P-değeri Nedir?

P-değeri(p-value); istatistiksel bir test gerçekleştirildiğinde sıfır hipotezinin(H0) reddedilip reddedilmeyeceğine karar vermeye yardımcı olur. P-değeri ne kadar küçükse sıfır hipotezini reddetme olasılığı o kadar yüksektir.

Alternatif Regresyon Yöntemleri: Lasso Regresyon

Lasso Regresyon, çoklu doğrusal regresyonda ortaya çıkan çoklu doğrusal bağlantı probleminin üstesinden gelmek için EKK yöntemine alternatif yanlı tahmin yöntemlerinden biridir.

Dengesiz Veri Setlerinde Modelleme

Standart bir sınıflandırıcı makine öğrenmesi algoritmasının amacı doğruluğu maksimize etmektir. Dengesiz veri setlerinde ise algoritma, veri sayısı çok olan sınıfı daha iyi öğrenecektir ve bu eğitimin sonucu çoğunluk sınıfı için düşük hata oranı, ancak azınlık sınıfı için daha yüksek hata oranı olacaktır.

Boruta Algoritması ile Değişken Seçimi

Boruta veri setine eklediği gölge değişkenler ve iterasyonlu yapısı ile bir veri setinden önemli ve önemli olmayan değişkenlerin tarafsız ve istikrarlı bir şekilde seçilmesini sağlayan, Random Forest tabanlı değişken seçme yöntemidir.

Boosting Kutu Açılışı

En sık kullanılan boosting algoritmalarının kullanımı, hiperparametre optimizasyonu ve performansları Python dili kullanılarak incelenmiştir.

CatBoost Nedir? Diğer Boosting Algoritmalarından Farkı Nelerdir?

Catboost, Yandex şirketi tarafından geliştirilmiş olan Gradient Boosting tabanlı açık kaynak kodlu bir makine öğrenmesi algoritmasıdır. Gradient Boosting’in performansını arttırmak amacıyla geliştirilen XGBoost ve LightGBM’e alternatiftir.

LightGBM

LightGBM diğer boosting algoritmaları ile karşılaştırıldığında yüksek işlem hızı, büyük verileri işleyebilmesi, daha az kaynak(RAM) kullanımı, yüksek tahmin oranı, paralel öğrenme ve GPU öğrenimini desteklemesi gibi avantajları vardır.

XGBoost Nasıl Çalışır? Neden İyi Performans Gösterir?

XGBoost, Gradient Boosting algoritmasının optimize edilmiş yüksek performanslı halidir. Yazıda XGBoost’un nasıl çalıştığı ve performansı incelenmiştir.