Yazar Hakkında
Toplam 11 yazı
Emre Rıdvan Muratlar
Emre Rıdvan Muratlar
2016 yılından bu yana finans sektöründe veri bilimi üzerine çalışmaktadır. Yıldız Teknik Üniversitesi İstatistik bölümü doktora öğrencisidir.
İstatistik

P-değeri Nedir?

P-değeri(p-value); istatistiksel bir test gerçekleştirildiğinde sıfır hipotezinin(H0) reddedilip reddedilmeyeceğine karar vermeye yardımcı olur. P-değeri ne kadar küçükse sıfır hipotezini reddetme olasılığı o kadar yüksektir.

İstatistik Çok Değişkenli İstatistik Makine Öğrenmesi Regresyon Teori Uygulamalı İstatistik

Alternatif Regresyon Yöntemleri: Lasso Regresyon

Lasso Regresyon, çoklu doğrusal regresyonda ortaya çıkan çoklu doğrusal bağlantı probleminin üstesinden gelmek için EKK yöntemine alternatif yanlı tahmin yöntemlerinden biridir.

Sınıflandırma Teori Veri Bilimi Veri hazırlığı

Dengesiz Veri Setlerinde Modelleme

Standart bir sınıflandırıcı makine öğrenmesi algoritmasının amacı doğruluğu maksimize etmektir. Dengesiz veri setlerinde ise algoritma, veri sayısı çok olan sınıfı daha iyi öğrenecektir ve bu eğitimin sonucu çoğunluk sınıfı için düşük hata oranı, ancak azınlık sınıfı için daha yüksek hata oranı olacaktır.

Makine Öğrenmesi Teori Veri Bilimi

Boruta Algoritması ile Değişken Seçimi

Boruta veri setine eklediği gölge değişkenler ve iterasyonlu yapısı ile bir veri setinden önemli ve önemli olmayan değişkenlerin tarafsız ve istikrarlı bir şekilde seçilmesini sağlayan, Random Forest tabanlı değişken seçme yöntemidir.

Genel bir bakış Makine Öğrenmesi Python Sınıflandırma Uygulama Veri Bilimi Veri hazırlığı Veri Ön İşleme

Boosting Kutu Açılışı

En sık kullanılan boosting algoritmalarının kullanımı, hiperparametre optimizasyonu ve performansları Python dili kullanılarak incelenmiştir.

Genel bir bakış Makine Öğrenmesi Python Sınıflandırma Uygulama Veri Bilimi Veri Görselleştirme

CatBoost Nedir? Diğer Boosting Algoritmalarından Farkı Nelerdir?

Catboost, Yandex şirketi tarafından geliştirilmiş olan Gradient Boosting tabanlı açık kaynak kodlu bir makine öğrenmesi algoritmasıdır. Gradient Boosting’in performansını arttırmak amacıyla geliştirilen XGBoost ve LightGBM’e alternatiftir.

Genel bir bakış Makine Öğrenmesi Python Sınıflandırma Teori Uygulama Veri Bilimi

LightGBM

LightGBM diğer boosting algoritmaları ile karşılaştırıldığında yüksek işlem hızı, büyük verileri işleyebilmesi, daha az kaynak(RAM) kullanımı, yüksek tahmin oranı, paralel öğrenme ve GPU öğrenimini desteklemesi gibi avantajları vardır.

Genel bir bakış Makine Öğrenmesi Python Sınıflandırma Teori Uygulama

XGBoost Nasıl Çalışır? Neden İyi Performans Gösterir?

XGBoost, Gradient Boosting algoritmasının optimize edilmiş yüksek performanslı halidir. Yazıda XGBoost'un nasıl çalıştığı ve performansı incelenmiştir.

Makine Öğrenmesi Python Regresyon Teori

Gradient Boosted Regresyon Ağaçları

Gradient Boosting, zayıf öğrenicileri güçlü öğreniciye dönüştürme yöntemidir.

İstatistik R

Makine Öğrenmesine Çok Değişkenli İstatistiksel Yaklaşımlar: Uyum Analizi

Uyum analizi, kategorik verilerin yorumlanmasını kolaylaştıran ve veri analizine grafiksel yaklaşım sunan çok değişkenli bir analiz yöntemidir.

×

Bir Şeyler Ara