Yazar: Eyüp Sabri Çelik

Veri analizinde en sık kullanılan yöntemlerden biri regresyondur, Lasso regresyonu da bu regresyon türlerinden biridir. Regresyon, bir bağımlı değişkeni bu değişkenin veri setindeki diğer bağımsız değişkenlerle arasındaki ilişkisini kullanarak tahmin etmeyi sağlayan bir istatiksel metottur. En temel regresyon türü bağımlı bir değişken ile bağımsız değişkenler arasındaki ilişkiyi doğrusal bir şekilde modelleyen lineer regresyondur. Gerçek hayattaki veri setleri genellikle karmaşık ve çok boyutludur. Böyle durumlarda klasik doğrusal regresyon çoğu zaman yetersiz kalır. Örneğin değişkenler arasında yüksek korelasyon varsa katsayılar kararsız hale gelir(multicollinearity). Ya da çok sayıda değişken varsa model overfitting(aşırı uyum) riski taşır. Bu sebeplerden ötürü eğitim verisinde iyi görünen ama…

Read More

Günümüzde veri, her sektörde karar alma süreçlerinin merkezinde yer alıyor. Ancak verinin kendisi yalnızca bir başlangıçtır. Asıl önemli olan, bu verilerden anlam çıkarabilmek, geleceğe dair çıkarımlarda bulunabilmek ve belirsizlikleri yönetebilmektir. İşte bu noktada istatistik modelleme, güçlü bir araç olarak karşımıza çıkar. İstatistiksel modelleme, veriyle bilinmeyeni anlamlandırmanın pusulasıdır. Dağılımlar, varyanslar, beklenen değerler ve olasılık teorisi gibi kavramlar aracılığıyla, sadece “ne oldu?” sorusuna değil, “neden oldu?” ve “bundan sonra ne olabilir?” sorularına da yanıt verir. Bu nedenle istatistiksel modelleme, veri biliminin matematiksel omurgasıdır. Bu yazıda, istatistiksel modellemenin temel yapı taşlarını ele alacağız. Makine öğrenmesiyle olan ilişkisini açıklayacak; beklenen değer, varyans, olasılık dağılımları…

Read More