Lojistik Regresyon ve K-En Yakın Komşu

K-En Yakın Komşu

K en yakın komşu (k-nearest neighbor-kNN) algoritması sınıflandırma algoritmalarından en yaygın olanlarından biridir. Temel mantık; “bana arkadaşını söyle kim olduğunu söyleyeyim” şeklinde işler. Örneğin k (5 olsun) olarak göstereceğimiz bir sayı seçeriz. Sınıflandırmak istediğimiz yeni bir elemanın hangi sınıfa dahil olacağını belirlemek için bu yeni elemana en çok benzeyen beş elemanın sınıflarına bakarız. En çok eleman hangi sınıfa mensup ise yeni elemanımız da o sınıftandır deriz.

Müşteri Nu.123456789
Telefonu açıyor mu?EEEHEEEHH
Sözünde duruyor mu?KEEHHEEHH
Görüşmeye geliyor mu?HEEHHEEHK
Yetki belgesi veriyor mu?HEEHHEEHH
Fiyata duyarlılığı çok mu?EHEEHHEEE
Seni sık sık atlatıyor mu?EHEEEHEEE
SınıfCA+ACCA+AC?
AksiyonKaçAlAlKaçKaçAlAlKaç?
  • E: Evet
  • H: Hayır
  • K: Kısmen

Örneğin yukarıdaki tabloda bir gayrimenkul danışmanı zaman, emek ve parasını israf etmemek için her müşteri ile uğraşmak istemiyor. Bunun için müşterilerini sınıflandırmış. Toplamda altı adet özellik tespit etmiş ve bu müşterileri A+, A, B ve C olarak sınıflandırmış. A+ ve A sınıf müşteriler, birlikte çalışılabilecek altın müşteriler, sağlam karakterli düzgün insanlar. B sınıfındakiler, ikna edildiğinde çalışılabilecekler ancak her an falso verebilirler. C sınıfındakiler ise hiç uğraşılmayacaklar, ilk fırsatta danışmanın emeğini heba edecekler. Danışman yeni  müşterinin (9’uncu) özelliklerini belirliyor ve geçmiş kayıtları kullanarak bunu sınıflandırmak istiyor.  Bu dokuzuncu kayda baktığımızda kendisine en yakın üç kaydın 4,5 ve 8’inci müşteriler olduğunu görüyoruz. Bu müşterilerin üçü de C sınıfında olduğu için danışman bu müşteriyi de rahatlıkla C sınıfına dahil edebilir. Çünkü en yakın 3 (k’yı 3 aldık) komşusu hep C sınıfı. O halde danışman bu müşteriyi C sınıfı olarak sınıflandıracak ve aksiyon olarak da KAÇACAK “Run Forrest run!” 🙂

Yazar Hakkında
Toplam 180 yazı
Erkan ŞİRİN
Erkan ŞİRİN
10 yılı aşkın süredir yurtiçi ve yurtdışında sektörde büyük veri mühendisliği, platform yönetimi ve makine öğrenmesi ile ilgili çalışmalar yürütmekte ve aynı zamanda birçok kurum ve şirkete danışmanlık ve eğitimler vermektedir. Çalışma alanları: Data ve MLOps platformları, gerçek zamanlı veri işleme, değişen veriyi yakalama (CDC) ve Lakehouse.
Yorumlar (Yorum yapılmamış)

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara