Veri Madenciliğinin Sınıflandırılması
Veri madenciliği konusunda kafaları karıştıran konulardan biri de bir çok teknik, yöntem, algoritmanın ve modelin nasıl sınıflandırılacağına dairdir. Benim kafa bu konuda biraz karışık. Belli bir süredir bu konularla ilgilenmeme rağmen ne nerededir hala tam oturtamadım. Bu konuda Gökhan SİLAHTAROĞLU’nun sınıflandırmasını sizlerle paylaşacağım. Niye durduk yerde şimdi sınıflandırıyoruz? kimileri kabaca iki sınıfta topluyor: Denetimli (supervised) ve denetimsiz (unsupervised). Bazıları da üç tanedir demiş denetimli, denetimsiz ve hibrit. Ben olayı daha fazla karıştırmadan Gökhan Bey’in sınıflandırmasıyla sizi baş başa bırakıyorum.
- Sınıflandırma
- İstatistiğe Dayalı Algoritmalar
- Bayesyen Sınıflandırma
- Regresyon
- CHAID
- Mesafeye Dayalı Algoritmalar
- En Yakın Komşu
- En Küçük Mesafe Sınıflandırıcısı
- Karar Ağaçları
- CART
- ID3
- C4.5
- Sprint
- Genetik Algoritmalar
- Yapay Sinir Ağları
- İstatistiğe Dayalı Algoritmalar
- Kümeleme
- Hiyerarşik Yöntemler
- SLINK Algoritması
- Cure Algoritması
- CHAMELEON Algoritması
- BIRCH Algoritması
- CLUCDUH Algoritması
- Bölümlemeli Yöntemler
- K-Ortalama Algoritması
- PAM Algoritması
- CLARA Algoritması
- CLARANS Algoritması
- Yoğunluğa Dayalı Algoritmalar
- DBSCAN Algoritması
- OPTICS Algoritması
- DENCLUDE Algoritması
- Grid Temelli Algoritmalar
- STING Algoritması
- Dalga Kümeleme
- CLIQUE Algoritması
- Genetik Algoritmalar
- Yapay Sinir Ağları
- Hiyerarşik Yöntemler
- Bağlantı Analizi Modeli
- Apriori Algoritması
- SETM Algoritması
- Apriori TID Algoritması
- GRI Algoritması