{"id":4537,"date":"2023-05-09T17:01:56","date_gmt":"2023-05-09T14:01:56","guid":{"rendered":"https:\/\/datakapital.com\/blog\/?p=4537"},"modified":"2025-07-20T17:19:31","modified_gmt":"2025-07-20T14:19:31","slug":"makine-ogrenimi-ile-gogus-kanseri-siniflandirmasi","status":"publish","type":"post","link":"https:\/\/datakapital.com\/blog\/makine-ogrenimi-ile-gogus-kanseri-siniflandirmasi\/","title":{"rendered":"Makine \u00d6\u011frenimi \u0130le G\u00f6\u011f\u00fcs Kanseri S\u0131n\u0131fland\u0131rmas\u0131"},"content":{"rendered":"<p>G\u00f6\u011f\u00fcs kanseri s\u0131n\u0131fland\u0131rmas\u0131, makine \u00f6\u011frenimi algoritmalar\u0131n\u0131n kullan\u0131ld\u0131\u011f\u0131 bir t\u0131bbi uygulamad\u0131r. Bu uygulama, g\u00f6\u011f\u00fcs kanseri tarama testlerinde elde edilen g\u00f6r\u00fcnt\u00fclerin analiz edilmesi yoluyla kanser t\u00fcr\u00fcn\u00fcn saptanmas\u0131n\u0131 ama\u00e7lamaktad\u0131r. G\u00f6\u011f\u00fcs kanseri, kad\u0131nlarda en s\u0131k g\u00f6r\u00fclen kanser t\u00fcrlerinden biridir ve erken te\u015fhis edilmesi hayat kurtar\u0131c\u0131 olabilir.<\/p>\n<p><a href=\"https:\/\/datakapital.com\/blog\/amerikan-saglik-sektoru-yukselis-trendini-devam-ettiriyor\/\">G\u00f6\u011f\u00fcs kanseri s\u0131n\u0131fland\u0131rmas\u0131, g\u00f6r\u00fcnt\u00fc i\u015fleme teknikleri<\/a>, \u00f6zellik \u00e7\u0131kar\u0131m\u0131 ve s\u0131n\u0131fland\u0131rma algoritmalar\u0131n\u0131n bir arada kullan\u0131lmas\u0131n\u0131 gerektirir. \u00d6ncelikle, g\u00f6\u011f\u00fcs kanseri tarama testlerinde elde edilen g\u00f6r\u00fcnt\u00fclerin i\u015flenmesi ve \u00f6n i\u015flemesi yap\u0131l\u0131r. Daha sonra, g\u00f6r\u00fcnt\u00fclerden \u00f6zellikler \u00e7\u0131kar\u0131l\u0131r ve bu \u00f6zellikler kullan\u0131larak kanser t\u00fcr\u00fc belirlenmeye \u00e7al\u0131\u015f\u0131l\u0131r.<\/p>\n<p>S\u0131n\u0131fland\u0131rma algoritmalar\u0131, elde edilen \u00f6zellikleri kullanarak kanser t\u00fcr\u00fcn\u00fc s\u0131n\u0131fland\u0131r\u0131r.<\/p>\n<p><a href=\"https:\/\/datakapital.com\/\">Makine \u00f6\u011frenimi algoritmalar\u0131<\/a>, bu uygulamada olduk\u00e7a etkilidir. \u00d6zellikle, derin \u00f6\u011frenme algoritmalar\u0131, y\u00fcksek do\u011fruluk oranlar\u0131na sahip olmalar\u0131 nedeniyle tercih edilirler. Derin \u00f6\u011frenme algoritmalar\u0131, yapay sinir a\u011f\u0131 mimarileri kullanarak verileri analiz eder ve karma\u015f\u0131k ili\u015fkileri \u00f6\u011frenir. Bu sayede, g\u00f6\u011f\u00fcs kanseri s\u0131n\u0131fland\u0131r\u0131lmas\u0131nda elde edilen y\u00fcksek boyutlu ve karma\u015f\u0131k verileri i\u015flemek daha kolay hale gelir.<\/p>\n<p>G\u00f6\u011f\u00fcs kanseri s\u0131n\u0131fland\u0131rmas\u0131, t\u0131bbi uygulamalar\u0131n bir \u00f6rne\u011fidir ve makine \u00f6\u011frenimi tekniklerinin sa\u011fl\u0131k sekt\u00f6r\u00fcnde kullan\u0131lmas\u0131na \u00f6rnek te\u015fkil eder. Bu uygulama, kanser t\u00fcrlerinin erken te\u015fhis edilmesine ve tedavi s\u00fcre\u00e7lerinin optimize edilmesine yard\u0131mc\u0131 olur.<\/p>\n<p><img fetchpriority=\"high\" decoding=\"async\" class=\"alignnone size-full wp-image-4538\" src=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Makine-Ogrenimi-ve-Gogus-Kanseri-Siniflandirmasi.png\" alt=\"G\u00f6\u011f\u00fcs Kanseri Yapay Zeka S\u0131n\u0131fland\u0131rmas\u0131\" width=\"602\" height=\"239\" title=\"\" srcset=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Makine-Ogrenimi-ve-Gogus-Kanseri-Siniflandirmasi.png 602w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Makine-Ogrenimi-ve-Gogus-Kanseri-Siniflandirmasi-300x119.png 300w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Makine-Ogrenimi-ve-Gogus-Kanseri-Siniflandirmasi-150x60.png 150w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Makine-Ogrenimi-ve-Gogus-Kanseri-Siniflandirmasi-450x179.png 450w\" sizes=\"(max-width: 602px) 100vw, 602px\" \/><\/p>\n<h4>G\u00f6\u011f\u00fcs Kanseri Veri Seti ve S\u0131n\u0131fland\u0131rmas\u0131<\/h4>\n<p>Meme kanseri te\u015fhisinde <a href=\"https:\/\/datakapital.com\/blog\/yinelenen-sinir-aglari-nedir\/\">derin \u00f6\u011frenme y\u00f6ntemlerinin<\/a> kullan\u0131lmas\u0131, do\u011fru sonu\u00e7lar elde etmek i\u00e7in bir se\u00e7enek olabilir. Bu ama\u00e7la kullan\u0131labilecek veri setlerinden biri, Wisconsin \u00dcniversitesi T\u0131p Fak\u00fcltesi&#8217;nde elde edilen Meme Kanseri Wisconsin (Te\u015fhis) Veri Seti&#8217;dir. Bu veri seti, h\u00fccre g\u00f6r\u00fcnt\u00fclerinden olu\u015fmaktad\u0131r ve 569 \u00f6rne\u011fi i\u00e7ermektedir. Her bir \u00f6rnek, bir h\u00fccre \u00f6rne\u011fini temsil etmektedir.<\/p>\n<p>Bu \u00f6zellikler, h\u00fccre \u00e7ekirde\u011fi ile ilgili \u00f6zellikler ve h\u00fccrenin genel \u00f6zellikleri olarak s\u0131n\u0131fland\u0131r\u0131labilir. H\u00fccreler, iyi huylu (benign) veya k\u00f6t\u00fc huylu (malignant) olarak s\u0131n\u0131fland\u0131r\u0131lm\u0131\u015ft\u0131r. Bu veri seti, meme kanseri te\u015fhisi i\u00e7in derin \u00f6\u011frenme algoritmalar\u0131 ile kullan\u0131labilecek bir \u00f6rnek veri setidir. Bu veri seti \u00fczerinde yap\u0131lacak \u00e7al\u0131\u015fmalar, meme kanserinin do\u011fru bir \u015fekilde te\u015fhis edilmesine yard\u0131mc\u0131 olabilir.<\/p>\n<p>Derin \u00f6\u011frenme algoritmalar\u0131, bu veri seti \u00fczerinde s\u0131n\u0131fland\u0131rma problemini \u00e7\u00f6zmek i\u00e7in kullan\u0131labilir. Bu algoritmalar, \u00f6zellikleri kullanarak h\u00fccreleri iyi huylu veya k\u00f6t\u00fc huylu olarak s\u0131n\u0131fland\u0131rabilirler. Veri seti, do\u011fru bir \u015fekilde i\u015flenerek, e\u011fitim ve test verileri olarak b\u00f6l\u00fcnebilir ve model e\u011fitiminde kullan\u0131labilir.<\/p>\n<p>Sonu\u00e7 olarak, Meme Kanseri Wisconsin (Te\u015fhis) Veri Seti, meme kanseri te\u015fhisi i\u00e7in kullan\u0131labilecek bir veri setidir. Bu veri seti \u00fczerinde derin \u00f6\u011frenme algoritmalar\u0131n\u0131n kullan\u0131lmas\u0131, meme kanserinin do\u011fru bir \u015fekilde te\u015fhis edilmesine yard\u0131mc\u0131 olabilir.<\/p>\n<p><img decoding=\"async\" class=\"alignnone size-full wp-image-4539\" src=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-Kanseri-Veri-Seti-Siniflandirmasi.png\" alt=\"G\u00f6\u011f\u00fcs Kanseri Veri Setleri\" width=\"602\" height=\"151\" title=\"\" srcset=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-Kanseri-Veri-Seti-Siniflandirmasi.png 602w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-Kanseri-Veri-Seti-Siniflandirmasi-300x75.png 300w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-Kanseri-Veri-Seti-Siniflandirmasi-150x38.png 150w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-Kanseri-Veri-Seti-Siniflandirmasi-450x113.png 450w\" sizes=\"(max-width: 602px) 100vw, 602px\" \/><\/p>\n<p><strong>G\u00f6\u011f\u00fcs kanseri s\u0131n\u0131fland\u0131rmas\u0131<\/strong>, ba\u015far\u0131l\u0131 bir \u015fekilde derin \u00f6\u011frenme y\u00f6ntemleri kullan\u0131larak ger\u00e7ekle\u015ftirilebilmektedir. Bu ama\u00e7la,<a href=\"https:\/\/www.wisc.edu\/\" target=\"_blank\" rel=\"noopener\"> Meme Kanseri Wisconsin (Te\u015fhis) Veri Seti<\/a> gibi uygun veri setleri kullan\u0131labilir. Bu veri seti, meme kanseri h\u00fccrelerinin g\u00f6r\u00fcnt\u00fclerini ve bu h\u00fccrelerin 30 farkl\u0131 \u00f6zelli\u011fini i\u00e7ermektedir. Bu \u00f6zellikler, h\u00fccre \u00e7ekirde\u011fi ile ilgili \u00f6zellikler ve h\u00fccrenin genel \u00f6zellikleri \u015feklinde s\u0131n\u0131fland\u0131r\u0131labilir.<\/p>\n<p>Veri setinde, h\u00fccrelerin iyi huylu veya k\u00f6t\u00fc huylu olarak s\u0131n\u0131fland\u0131r\u0131lm\u0131\u015f halleri de yer almaktad\u0131r. Derin \u00f6\u011frenme algoritmalar\u0131, bu veri seti \u00fczerinde e\u011fitilerek, yeni \u00f6rneklerin iyi huylu veya k\u00f6t\u00fc huylu olarak s\u0131n\u0131fland\u0131r\u0131lmas\u0131 m\u00fcmk\u00fcnd\u00fcr. Bu \u015fekilde, g\u00f6\u011f\u00fcs kanseri te\u015fhisi konusunda do\u011fru sonu\u00e7lar elde edilebilir.<\/p>\n<p>Derin \u00f6\u011frenme y\u00f6ntemleri, bir\u00e7ok farkl\u0131 model ve algoritma i\u00e7ermektedir. Bunlar aras\u0131nda, yapay sinir a\u011flar\u0131, evri\u015fimli sinir a\u011flar\u0131 (CNN), tekrarlayan sinir a\u011flar\u0131 (RNN) ve derin \u00f6\u011frenme tabanl\u0131 s\u0131n\u0131fland\u0131rma y\u00f6ntemleri gibi teknikler yer almaktad\u0131r. Bu y\u00f6ntemler, t\u0131bbi uygulamalar gibi g\u00f6\u011f\u00fcs kanseri s\u0131n\u0131fland\u0131rmas\u0131 gibi alandaki \u00e7al\u0131\u015fmalarda da ba\u015far\u0131l\u0131 sonu\u00e7lar vermektedir.<\/p>\n<p><img decoding=\"async\" class=\"alignnone size-full wp-image-4540\" src=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-kanseri-veri-setleri.png\" alt=\"G\u00f6\u011f\u00fcs Kanseri Verileri S\u0131nfland\u0131rma\" width=\"593\" height=\"99\" title=\"\" srcset=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-kanseri-veri-setleri.png 593w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-kanseri-veri-setleri-300x50.png 300w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-kanseri-veri-setleri-150x25.png 150w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Gogus-kanseri-veri-setleri-450x75.png 450w\" sizes=\"(max-width: 593px) 100vw, 593px\" \/><\/p>\n<h4>Ke\u015fifsel &#8211; A\u00e7\u0131klay\u0131c\u0131 Veri Analizi<\/h4>\n<p>Ke\u015fifsel-A\u00e7\u0131klay\u0131c\u0131 Veri Analizi, veri k\u00fcmesinin ke\u015ffedilmesi, anla\u015f\u0131lmas\u0131 ve g\u00f6rselle\u015ftirilmesi yoluyla veri analizinin ger\u00e7ekle\u015ftirilmesidir. Bu y\u00f6ntem, bir veri k\u00fcmesindeki ili\u015fkileri ve \u00f6zellikleri anlamak i\u00e7in kullan\u0131l\u0131r.<\/p>\n<p>Ke\u015fifsel veri analizi, verilerin \u00f6zelliklerinin tan\u0131mlanmas\u0131 ve ke\u015ffedilmesine odaklan\u0131r. Bu a\u015famada, verilerin yap\u0131s\u0131, da\u011f\u0131l\u0131m\u0131, eksik de\u011ferlerin varl\u0131\u011f\u0131, ayk\u0131r\u0131 de\u011ferlerin olup olmad\u0131\u011f\u0131 gibi \u00f6zellikleri incelenir. Bu ad\u0131mda ama\u00e7, veri k\u00fcmesindeki trendleri ve \u00f6zellikleri anlamak ve veri hikayesini olu\u015fturmakt\u0131r. Bu a\u015fama, veri setinin temel istatistiklerinin hesaplanmas\u0131, grafiksel g\u00f6sterimi ve veri setindeki \u00f6zelliklerin belirlenmesi gibi i\u015flemleri i\u00e7erir.<\/p>\n<p>A\u00e7\u0131klay\u0131c\u0131 veri analizi ise, veri setinin daha ayr\u0131nt\u0131l\u0131 bir \u015fekilde incelenmesini ve spesifik bir soruya cevap bulmay\u0131 hedefler. Bu a\u015famada, veri k\u00fcmesindeki \u00f6zellikler aras\u0131ndaki ili\u015fkiler ve etkiler analiz edilir. Bu ad\u0131mda ama\u00e7, elde edilen sonu\u00e7lar\u0131 yorumlamak ve a\u00e7\u0131klamaktad\u0131r. Bu a\u015fama, veri setindeki de\u011fi\u015fkenler aras\u0131ndaki korelasyon analizi, regresyon analizi ve hipotez testleri gibi istatistiksel y\u00f6ntemleri i\u00e7erir.<\/p>\n<p>Ke\u015fifsel-A\u00e7\u0131klay\u0131c\u0131 Veri Analizi, veri tabanl\u0131 karar verme ve problem \u00e7\u00f6zme s\u00fcrecinin \u00f6nemli bir ad\u0131m\u0131d\u0131r. Bu y\u00f6ntem, verilerin anla\u015f\u0131lmas\u0131 ve yorumlanmas\u0131 yoluyla, problem alan\u0131 hakk\u0131nda daha fazla bilgi edinilmesine ve daha do\u011fru kararlar vermesine yard\u0131mc\u0131 olur.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-4541\" src=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Saglikta-aciklayici-kesif-verilerin-analizi.png\" alt=\"Kanser s\u0131n\u0131fland\u0131rmas\u0131nda descriptive istatistikler\" width=\"602\" height=\"327\" title=\"\" srcset=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Saglikta-aciklayici-kesif-verilerin-analizi.png 602w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Saglikta-aciklayici-kesif-verilerin-analizi-300x163.png 300w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Saglikta-aciklayici-kesif-verilerin-analizi-150x81.png 150w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Saglikta-aciklayici-kesif-verilerin-analizi-450x244.png 450w\" sizes=\"(max-width: 602px) 100vw, 602px\" \/><\/p>\n<h2>Outlier Detection &#8211; Local Outlier Factor Y\u00f6ntemi<\/h2>\n<p>Outlier Detection (Ayk\u0131r\u0131 Veri Tespiti), veri setinde beklenmeyen veya anormal de\u011ferleri tespit etmek i\u00e7in kullan\u0131lan bir y\u00f6ntemdir. Local Outlier Factor (LOF) y\u00f6ntemi, ayk\u0131r\u0131 de\u011ferleri tespit etmek i\u00e7in s\u0131kl\u0131kla kullan\u0131lan bir y\u00f6ntemdir.<\/p>\n<p>LOF y\u00f6ntemi, bir veri noktas\u0131n\u0131n yerel yo\u011funlu\u011funun di\u011fer veri noktalar\u0131n\u0131n yo\u011funlu\u011fu ile kar\u015f\u0131la\u015ft\u0131r\u0131lmas\u0131na dayan\u0131r. Bir veri noktas\u0131n\u0131n yo\u011funlu\u011fu, belirli bir yar\u0131\u00e7ap i\u00e7indeki di\u011fer veri noktalar\u0131n\u0131n say\u0131s\u0131 ile \u00f6l\u00e7\u00fcl\u00fcr. E\u011fer bir veri noktas\u0131, di\u011ferlerine g\u00f6re daha seyrek bir b\u00f6lgede yer al\u0131yorsa, bu durumda LOF de\u011feri y\u00fcksek olacakt\u0131r ve bu veri noktas\u0131 bir ayk\u0131r\u0131 olarak tan\u0131mlanabilir.<\/p>\n<p>LOF y\u00f6ntemi, ayn\u0131 zamanda bir veri noktas\u0131n\u0131n yo\u011funlu\u011funu etkileyen kom\u015fuluk boyutu fakt\u00f6r\u00fcn\u00fc de dikkate al\u0131r. Bu fakt\u00f6r, veri setindeki veri noktalar\u0131n\u0131n birbirlerine olan uzakl\u0131klar\u0131na g\u00f6re belirlenir. Kom\u015fuluk boyutu fakt\u00f6r\u00fc artt\u0131k\u00e7a, daha geni\u015f bir yar\u0131\u00e7ap i\u00e7indeki veri noktalar\u0131 da hesaba kat\u0131l\u0131r ve bu da daha az ayk\u0131r\u0131 veri noktas\u0131 tespit edilmesine neden olur.<\/p>\n<p>LOF y\u00f6ntemi, b\u00fcy\u00fck veri setleri \u00fczerinde etkili bir \u015fekilde \u00e7al\u0131\u015fabilir ve di\u011fer y\u00f6ntemlerden daha az hesaplama maliyeti gerektirir. Ayr\u0131ca, LOF y\u00f6ntemi, veri setindeki ayk\u0131r\u0131 de\u011ferlerin \u00e7\u0131kar\u0131lmas\u0131n\u0131n yan\u0131 s\u0131ra, veri setindeki farkl\u0131 gruplar veya k\u00fcmeleme yap\u0131lar\u0131n\u0131n da tespit edilmesine yard\u0131mc\u0131 olabilir.<\/p>\n<h4>Outlier&#8217;lar\u0131n Tespiti ve \u00c7\u0131kar\u0131lmas\u0131<\/h4>\n<p>Outlier, bir veri k\u00fcmesindeki di\u011fer verilere g\u00f6re anormal derecede farkl\u0131 olan bir veya birka\u00e7 veri noktas\u0131d\u0131r. Bu farkl\u0131l\u0131k, verilerin yanl\u0131\u015fl\u0131kla veya kas\u0131tl\u0131 olarak girilmesi veya ger\u00e7ek hayatta nadir g\u00f6r\u00fclen olaylar nedeniyle olu\u015fabilir. Outlier&#8217;lar\u0131n tespiti ve \u00e7\u0131kar\u0131lmas\u0131, do\u011fru sonu\u00e7lar elde etmek i\u00e7in veri analizinde \u00f6nemli bir ad\u0131md\u0131r.<\/p>\n<p>Outlier&#8217;lar\u0131n tespiti ve \u00e7\u0131kar\u0131lmas\u0131 i\u00e7in \u00e7e\u015fitli y\u00f6ntemler vard\u0131r. \u0130statistiksel y\u00f6ntemler, veri k\u00fcmesinin da\u011f\u0131l\u0131m\u0131 ve temel istatistiksel \u00f6zellikleri kullanarak outlier&#8217;lar\u0131 tespit eder. Grafiksel y\u00f6ntemler, verilerin grafikler \u00fczerinde g\u00f6sterilmesi yoluyla outlier&#8217;lar\u0131 tespit eder. Makine \u00f6\u011frenimi y\u00f6ntemleri ise, verilerin \u00f6zelliklerine dayal\u0131 olarak outlier&#8217;lar\u0131 tespit eder.<\/p>\n<p>En yayg\u0131n kullan\u0131lan y\u00f6ntemler aras\u0131nda Local Outlier Factor (LOF), Isolation Forest, K-Nearest Neighbors (KNN), One-Class SVM (Support Vector Machine) ve DBSCAN (Density-Based Spatial Clustering of Applications with Noise) gibi makine \u00f6\u011frenimi y\u00f6ntemleri bulunmaktad\u0131r. Bu y\u00f6ntemler, veri k\u00fcmesindeki \u00f6zellikleri analiz ederek outlier&#8217;lar\u0131 tespit ederler.<\/p>\n<p>Outlier&#8217;lar\u0131n tespiti ve \u00e7\u0131kar\u0131lmas\u0131, veri analizi ve makine \u00f6\u011frenimi gibi alanlarda \u00f6nemlidir. Bu y\u00f6ntemler, veri k\u00fcmesindeki hatal\u0131 veya yan\u0131lt\u0131c\u0131 verilerin tespit edilmesine ve \u00e7\u0131kar\u0131lmas\u0131na yard\u0131mc\u0131 olur. Bu sayede, daha do\u011fru sonu\u00e7lar elde edilir ve do\u011fru kararlar verilir.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-4543\" src=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Outlier-temizlenmesi-ve-istatistik.png\" alt=\"Makine \u00d6\u011freniminde Outlierlar\u0131n \u00e7\u0131kar\u0131lmas\u0131\" width=\"602\" height=\"163\" title=\"\" srcset=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Outlier-temizlenmesi-ve-istatistik.png 602w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Outlier-temizlenmesi-ve-istatistik-300x81.png 300w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Outlier-temizlenmesi-ve-istatistik-150x41.png 150w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Outlier-temizlenmesi-ve-istatistik-450x122.png 450w\" sizes=\"(max-width: 602px) 100vw, 602px\" \/><\/p>\n<h4>Standardization<\/h4>\n<p>Standardizasyon (standartla\u015ft\u0131rma), veri \u00f6n i\u015fleme s\u00fcrecinde s\u0131kl\u0131kla kullan\u0131lan bir y\u00f6ntemdir. Veri k\u00fcmesindeki say\u0131sal \u00f6zelliklerin, belirli bir \u00f6l\u00e7ekte ve \u00f6zellik da\u011f\u0131l\u0131m\u0131 ile ifade edilmesini sa\u011flar.<\/p>\n<p>G\u00f6\u011f\u00fcs kanseri derin \u00f6\u011frenme \u00e7al\u0131\u015fmalar\u0131nda da veri standardizasyonu kullan\u0131labilir. \u00d6rne\u011fin, meme kanseri g\u00f6r\u00fcnt\u00fclerinin piksel de\u011ferleri kullan\u0131larak bir derin \u00f6\u011frenme modeli e\u011fitilecekse, piksel de\u011ferlerinin farkl\u0131 \u00f6l\u00e7eklerde veya da\u011f\u0131l\u0131mlarda olmas\u0131 modelin performans\u0131n\u0131 olumsuz etkileyebilir.<\/p>\n<p>Bu nedenle, verilerin \u00f6zelliklerinin standartla\u015ft\u0131r\u0131lmas\u0131, verilerin benzer bir \u00f6l\u00e7e\u011fe ve da\u011f\u0131l\u0131ma sahip olmas\u0131n\u0131 sa\u011flar. Standartla\u015ft\u0131rma y\u00f6ntemleri aras\u0131nda en yayg\u0131n olan\u0131, \u00f6zellik \u00f6l\u00e7e\u011fini s\u0131f\u0131r ortalamal\u0131 ve birim varyansl\u0131 bir normal da\u011f\u0131l\u0131ma d\u00f6n\u00fc\u015ft\u00fcrmektir. Bu y\u00f6ntem, Z-score normalle\u015ftirme veya standart sapma y\u00f6ntemi olarak da bilinir.<\/p>\n<p>\u00d6rne\u011fin, meme kanseri g\u00f6r\u00fcnt\u00fc veri k\u00fcmesindeki piksel de\u011ferleri Z-score normalle\u015ftirme y\u00f6ntemi ile standart ula\u015ft\u0131r\u0131labilir. Bu sayede, her bir \u00f6zelli\u011fin benzer bir \u00f6l\u00e7e\u011fe sahip oldu\u011fu ve da\u011f\u0131l\u0131mlar\u0131n\u0131n benzer oldu\u011fu bir veri k\u00fcmesi elde edilir. Bu veri k\u00fcmesi, daha sonra derin \u00f6\u011frenme modelinde kullan\u0131labilir ve modelin performans\u0131 artt\u0131r\u0131labilir.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-4544\" src=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu.png\" alt=\"Verilerin Standartla\u015ft\u0131r\u0131lmas\u0131\" width=\"602\" height=\"292\" title=\"\" srcset=\"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu.png 602w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu-300x146.png 300w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu-150x73.png 150w, https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu-450x218.png 450w\" sizes=\"(max-width: 602px) 100vw, 602px\" \/><\/p>\n<h4>K-Nearest Neighbors(KNN) Nedir?<\/h4>\n<p>K-Nearest Neighbors (KNN), bir s\u0131n\u0131fland\u0131rma veya regresyon algoritmas\u0131d\u0131r. Bu algoritma, \u00f6\u011frenme a\u015famas\u0131nda veri noktalar\u0131n\u0131n birbirine olan benzerliklerine dayal\u0131 olarak \u00f6r\u00fcnt\u00fcleri tan\u0131mlar. KNN algoritmas\u0131, bir veri noktas\u0131n\u0131n s\u0131n\u0131fland\u0131rmas\u0131n\u0131 belirlemek i\u00e7in kom\u015fu veri noktalar\u0131n\u0131n s\u0131n\u0131flar\u0131n\u0131 kullan\u0131r. Bu nedenle, KNN, temel olarak \u00f6r\u00fcnt\u00fc tan\u0131ma ve s\u0131n\u0131fland\u0131rma problemleri i\u00e7in kullan\u0131l\u0131r.<\/p>\n<p>KNN, bir \u00f6rnek tabanl\u0131 \u00f6\u011frenme y\u00f6ntemidir. Yani, \u00f6\u011frenme a\u015famas\u0131nda, veri setindeki her bir \u00f6rnek, bir s\u0131n\u0131fa atanm\u0131\u015f bir etiketle birlikte depolan\u0131r. KNN algoritmas\u0131, s\u0131n\u0131fland\u0131rma yaparken, verilen bir test \u00f6rne\u011fini al\u0131r ve test \u00f6rne\u011fi ile en yak\u0131n kom\u015fular\u0131n\u0131 (K kom\u015fu) bulmak i\u00e7in bir mesafe \u00f6l\u00e7\u00fct\u00fc kullan\u0131r. Bu K kom\u015fuya g\u00f6re, test \u00f6rne\u011fi, s\u0131n\u0131fland\u0131rmas\u0131 i\u00e7in \u00e7o\u011funluk oyu kullan\u0131larak s\u0131n\u0131fland\u0131r\u0131l\u0131r.<\/p>\n<p>KNN algoritmas\u0131nda en \u00f6nemli parametre K, belirlenmesi gereken bir parametredir. K, kom\u015fu say\u0131s\u0131n\u0131 belirler ve genellikle tek say\u0131 olarak se\u00e7ilir, b\u00f6ylece oylama sonucu bir s\u0131n\u0131fa d\u00fc\u015fer. K&#8217;n\u0131n artmas\u0131, modelin karma\u015f\u0131kl\u0131\u011f\u0131n\u0131 artt\u0131r\u0131r ve a\u015f\u0131r\u0131 uyma riskini azalt\u0131rken, K&#8217;n\u0131n azalt\u0131lmas\u0131 modelin esnekli\u011fini artt\u0131r\u0131r ancak a\u015f\u0131r\u0131 uyma riskini artt\u0131r\u0131r.<\/p>\n<p>KNN algoritmas\u0131, \u00f6zellikle k\u00fc\u00e7\u00fck veri k\u00fcmeleri i\u00e7in etkilidir, ancak veri k\u00fcmesi b\u00fcy\u00fcd\u00fck\u00e7e hesaplama maliyeti artar. KNN algoritmas\u0131 ayr\u0131ca, \u00f6zniteliklerin \u00f6l\u00e7e\u011fi ve mesafe \u00f6l\u00e7\u00fct\u00fcn\u00fcn se\u00e7imi gibi baz\u0131 \u00f6nemli sorunlarla kar\u015f\u0131 kar\u015f\u0131ya kalabilir ve bu sorunlar, modelin performans\u0131n\u0131 etkileyebilir.<\/p>\n<h4>Principal Component Analysis(PCA) Nedir?<\/h4>\n<p>Principal Component Analysis (PCA), bir veri k\u00fcmesinin boyutunu azaltmak i\u00e7in kullan\u0131lan bir <a href=\"https:\/\/datakapital.com\/blog\/makine-ogrenimi-machine-learning-nedir\/\">makine \u00f6\u011frenimi<\/a> tekni\u011fidir. Veri k\u00fcmesindeki de\u011fi\u015fken say\u0131s\u0131n\u0131 azalt\u0131r ve veri setindeki temel \u00f6zelliklerin ortaya \u00e7\u0131kar\u0131lmas\u0131na yard\u0131mc\u0131 olur.<\/p>\n<p>PCA, \u00e7ok boyutlu veri setlerindeki yap\u0131sal ili\u015fkileri ve de\u011fi\u015fkenler aras\u0131ndaki korelasyonlar\u0131 analiz eder. Bu analiz sonucunda, orijinal veri k\u00fcmesindeki de\u011fi\u015fkenlerin en \u00f6nemli olanlar\u0131 se\u00e7ilir ve yeni bir veri k\u00fcmesi olu\u015fturulur. Yeni veri k\u00fcmesi, orijinal veri k\u00fcmesinden daha az boyutlu olmakla birlikte, veri setinin temel \u00f6zelliklerini korur.<\/p>\n<p>PCA, bir veri k\u00fcmesindeki en b\u00fcy\u00fck varyans\u0131 yakalamak i\u00e7in kullan\u0131l\u0131r. Yeni veri k\u00fcmesindeki de\u011fi\u015fkenler, orijinal veri k\u00fcmesindeki de\u011fi\u015fkenlerin birle\u015fimi \u015feklinde olu\u015fur ve yeni de\u011fi\u015fkenler, birincil bile\u015fenler olarak adland\u0131r\u0131l\u0131r.<\/p>\n<p>PCA&#8217;n\u0131n uygulanmas\u0131 i\u00e7in \u00f6ncelikle veri k\u00fcmesindeki de\u011fi\u015fkenlerin standardize edilmesi gereklidir. Daha sonra, kovaryans matrisi hesaplan\u0131r ve bu matrisin \u00f6zvekt\u00f6rleri ve \u00f6zde\u011ferleri bulunur. \u00d6zvekt\u00f6rler, orijinal veri k\u00fcmesindeki de\u011fi\u015fkenlerin lineer kombinasyonlar\u0131n\u0131 temsil eder. \u00d6zde\u011ferler ise, orijinal veri k\u00fcmesindeki de\u011fi\u015fkenlerin varyans\u0131n\u0131 g\u00f6sterir.<\/p>\n<p>PCA, bir\u00e7ok farkl\u0131 alanda kullan\u0131l\u0131r, \u00f6rne\u011fin finansal analiz, g\u00f6r\u00fcnt\u00fc i\u015fleme, veri s\u0131k\u0131\u015ft\u0131rma ve biyolojik verilerin analizi gibi. PCA, b\u00fcy\u00fck boyutlu veri setlerinde kullan\u0131ld\u0131\u011f\u0131nda, boyut d\u00fc\u015f\u00fcrme sayesinde veri i\u015fleme s\u00fcresini azaltabilir ve hesaplama maliyetlerini d\u00fc\u015f\u00fcrebilir.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>G\u00f6\u011f\u00fcs kanseri s\u0131n\u0131fland\u0131rmas\u0131, makine \u00f6\u011frenimi algoritmalar\u0131n\u0131n kullan\u0131ld\u0131\u011f\u0131 bir t\u0131bbi uygulamad\u0131r. Bu uygulama, g\u00f6\u011f\u00fcs kanseri tarama testlerinde elde edilen g\u00f6r\u00fcnt\u00fclerin analiz edilmesi yoluyla kanser t\u00fcr\u00fcn\u00fcn saptanmas\u0131n\u0131 ama\u00e7lamaktad\u0131r. G\u00f6\u011f\u00fcs kanseri, kad\u0131nlarda en s\u0131k g\u00f6r\u00fclen kanser t\u00fcrlerinden biridir ve erken te\u015fhis edilmesi hayat kurtar\u0131c\u0131 olabilir. G\u00f6\u011f\u00fcs kanseri s\u0131n\u0131fland\u0131rmas\u0131, g\u00f6r\u00fcnt\u00fc i\u015fleme teknikleri, \u00f6zellik \u00e7\u0131kar\u0131m\u0131 ve s\u0131n\u0131fland\u0131rma algoritmalar\u0131n\u0131n bir arada<\/p>\n","protected":false},"author":12,"featured_media":4544,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[38],"tags":[278,333,400,402,401,290,399],"class_list":{"0":"post-4537","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-python-ile-veri-isleme","8":"tag-algoritmalar","9":"tag-derin-ogrenme","10":"tag-gogus-kanseri-siniflandirmasi","11":"tag-istatistik","12":"tag-knn","13":"tag-saglik-otomasyonlari","14":"tag-veri-analizi"},"better_featured_image":{"id":4544,"alt_text":"Verilerin Standartla\u015ft\u0131r\u0131lmas\u0131","caption":"","description":"","media_type":"image","media_details":{"width":602,"height":292,"file":"2023\/05\/Verilerin-Normalizasyonu.png","filesize":56571,"sizes":{"medium":{"file":"Verilerin-Normalizasyonu-300x146.png","width":300,"height":146,"mime-type":"image\/png","filesize":23164,"source_url":"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu-300x146.png"},"thumbnail":{"file":"Verilerin-Normalizasyonu-150x150.png","width":150,"height":150,"mime-type":"image\/png","filesize":17373,"source_url":"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu-150x150.png"},"bunyad-small":{"file":"Verilerin-Normalizasyonu-150x73.png","width":150,"height":73,"mime-type":"image\/png","filesize":7998,"source_url":"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu-150x73.png"},"bunyad-medium":{"file":"Verilerin-Normalizasyonu-450x218.png","width":450,"height":218,"mime-type":"image\/png","filesize":43023,"source_url":"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu-450x218.png"}},"image_meta":{"aperture":"0","credit":"","camera":"","caption":"","created_timestamp":"0","copyright":"","focal_length":"0","iso":"0","shutter_speed":"0","title":"","orientation":"0","keywords":[]}},"post":4537,"source_url":"https:\/\/datakapital.com\/blog\/wp-content\/uploads\/2023\/05\/Verilerin-Normalizasyonu.png"},"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/posts\/4537","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/users\/12"}],"replies":[{"embeddable":true,"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/comments?post=4537"}],"version-history":[{"count":1,"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/posts\/4537\/revisions"}],"predecessor-version":[{"id":4545,"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/posts\/4537\/revisions\/4545"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/media\/4544"}],"wp:attachment":[{"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/media?parent=4537"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/categories?post=4537"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/datakapital.com\/blog\/wp-json\/wp\/v2\/tags?post=4537"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}