Basit Bir Örnek ile Birliktelik Kuralları

“Bunu alan şunları da aldı” önermesini bir çok alışveriş sitesinde görmüşsünüzdür. Ayrıca birliktelik kurallarını anlatırken sürekli örnek verilen bir birlikte satın alma örüntüsü vardır. Bebek bezi ve bira. Ne alaka diyeceksiniz. Ama bu doğrulanmış bir birliktelik. Nesneler arasındaki bağlantıların ortaya çıkarılması ve bir kural olarak belirlenmesi birliktelik kuralıdır. En yaygın birliktelik kuralı alış-veriş alışkanlıklarının incelendiği pazar sepet analizidir. Alış-veriş alışkanlıklarının ortaya çıkarılması raf dizimi, market içi yerleşim, fiyatlandırma stratejisi vb birçok konuda karar vericilerin işini kolaylaştırır. Bir sonraki yazımızda veri setiyle örnek uygulama yapacağız. Ama ondan önce bazı kavramları açıklamak istiyorum.

Birliktelik kuralına nesneler arasındaki bağlantıların bir kural halinde ortaya koyulması olarak diyebiliriz demiştik. İyi bir kural yüksek bir güvenirlik ve güçlü bir destekle mümkün olur. Destek x ve y mallarını satın alan müşterilerin toplam müşteriye oranını gösterir. Güven ise x ve y malını satın almış müşteri sayısının y malını satın almış müşteri sayısına oranıdır. Destek, bağıntı sıklığını güven ise y malını alan birinin hangi olasılıkla x malını alacağını gösterir. Örneğin Starbucks’tan kahve alan bir müşteri %70 olasılıkla sinemaya gitmektedir. Takım elbise alan bir kimse muhtemelen gömlek, kravat ve kemer de alacaktır.

Apriori Algoritması Basit Uygulama

Bir süper markette alış veriş yapan müşterilere ilişkin tablo aşağıdadır. Asgari destek oranı %25, güven oranı ise %60 olsun.

Müşteri AdıSatın Aldığı Ürünler
BahadırŞampuan, Diş Macunu
MuhittinParfüm, Vücut Şampuanı, Cilt Kremi, Tıraş Bıçağı
SatılmışŞampuan, Cilt Kremi,  Diş Macunu, Tıraş Losyonu, Parfüm
HicaziyeŞampuan, Parfüm, Cilt Kremi
GülserenDiş Macunu, Vücut Şampuanı, Arap Sabunu

Tüm ürünler için tek tek destek oranını hesaplayalım. Destek ürünü alan kişi sayısının toplam müşteri sayısına oranıydı. Müşteri sayımız beş. Öyleyse bir ürün kaç defa satın alınmış onu sayıp müşteri sayısına böleceğiz.

ÜrünMiktarDestek
Şampuan3% 60
Diş Macunu3% 60
Parfüm3% 60
Vücut şampuanı2% 40
Cilt Kremi3% 60
Tıraş Bıçağı1% 20
Tıraş Losyonu1% 20
Arap Sabunu1% 20

İkinci aşamada ürünleri ikili olarak ele alacağız. Ancak belirlenen destek oranı % 25 altında olan Tıraş Bıçağı, Tıraş Losyonu ve Arap Sabununu hesaba katmayacağız.

Diş Macunu, Parfüm1% 20

ÜrünMiktarDestek
Şampuan, Diş Macunu2% 40
Şampuan, Parfüm2% 40
Şampuan, Vücut Şampuanı0% 0
Şampuan, Cilt Kremi2% 40
Diş Macunu, Parfüm1% 20
Diş Macunu, Vücut Şampuanı1% 20
Diş Macunu, Cilt Kremi1% 20
Parfüm, Cilt Kremi3% 60
Vücut Şampuanı,  Cilt Kremi1% 20

Şimdi üçlü satış desteklerini hesaplayalım

ÜrünMiktarDestek
Şampuan, Diş Macunu, Parfüm1% 20
Şampuan, Diş Macunu, Cilt Kremi1% 20
Şampuan, Parfüm, Cilt Kremi2% 40

Asgari destek oranımız % 25’i sadece Şampuan, Parfüm ve Cilt Kremi üçlüsü geçebildi.
Şimdi güven oranlarına bakalım

Şampuan ve parfüm alanların cilt kremi alma olasılığı: 2/2 = % 100

Şampuan alanların parfüm ve cilt kremi alma olasılığı: 2/3 = % 67

Cilt kremi alanların parfüm ve şampuan alma olasılığı: 2/3 = % 67

Parfüm alanların şampuan ve cilt kremi alma olasılığı: 2/3 = % 67

Hoşçakalın…

Değiştirilmiş örneğin kaynağı: Gürsoy, U. T. Ş. (2009). Veri madenciliği ve bilgi keşfi. Pegem Akademi

Yazar Hakkında
Toplam 180 yazı
Erkan ŞİRİN
Erkan ŞİRİN
10 yılı aşkın süredir yurtiçi ve yurtdışında sektörde büyük veri mühendisliği, platform yönetimi ve makine öğrenmesi ile ilgili çalışmalar yürütmekte ve aynı zamanda birçok kurum ve şirkete danışmanlık ve eğitimler vermektedir. Çalışma alanları: Data ve MLOps platformları, gerçek zamanlı veri işleme, değişen veriyi yakalama (CDC) ve Lakehouse.
Yorumlar (Yorum yapılmamış)

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara