R ile Normallik Testi

Erkan ŞİRİN 9 Aralık 2016 Genel bir bakış, R, Veri Bilimi 6 10051 186 kelime - 1 dakika110

Bu yazıya puan ver

(No Ratings Yet)

Veri seti üzerinde yaptığımız bir çok veri analizi verinin normal dağıldığı varsayımına dayanır. Veri analizine başlamadan önce verimizin normal dağılıma uygun olup olmadığına bakmamızda fayda var. Normallik kontrolü için yaygın olarak kullanılan testlerden birisi de Shapiro-Wilks testidir. Kullanımı oldukça basittir. Sadece numeric (numeric factor) verimizi argüman olarak shapiro.test(verimiz) fonksiyonuna ekliyoruz ekliyoruz.

Verimiz:

fiyat <- c(351.750, 348.400, 372.750, 378.000, 378.000, 414.750, 402.900, 400.820, 402.550, 363.384, 344.964, 373.850, 356.000)

Verimizin numeric factor olduğunu kontrol edelim:

str(fiyat)
num [1:13] 352 348 373 378 378 ...

Shapiro Testi

Testimizi yapalım:

shapiro.test(fiyat)
Shapiro-Wilk normality test
data: fiyat
W = 0.92784, p-value = 0.3192)

Sonucun yorumlanması:

Bu testte boş hipotez verinin normal dağıldığını var sayar. Eğer p değeri seçilen α seviyesinden daha düşük ise (ben p<0.05’i yeterli görüyorum) boş hipotez reddedilir. Ancak yukarıda yapmış olduğumuz testte p değeri 0,3192’dir yani 0,05 değerinden çok büyüktür. Bu sebeple boş hipotezi reddedemeyiz. Yani verimizin normal dağıldığını kabul ediyoruz. Böylelikle normal dağılım varsayımına (ön koşuluna) sahip testleri yapabiliriz.

Erkan SIRIN

Normal dağılım R and Normal Distribution R and Shapiro-Wilks R ile normal dağılım R ile normallik testi R ile Shapiro-Wilks Shapiro-Wilks

Yazar Hakkında

Toplam 179 yazı

Erkan ŞİRİN

10 yılı aşkın süredir yurtiçi ve yurtdışında sektörde büyük veri mühendisliği, platform yönetimi ve makine öğrenmesi ile ilgili çalışmalar yürütmekte ve aynı zamanda birçok kurum ve şirkete danışmanlık ve eğitimler vermektedir. Çalışma alanları: Data ve MLOps platformları, gerçek zamanlı veri işleme, değişen veriyi yakalama (CDC) ve Lakehouse.

Tüm yazılarını gör

Şunlar da ilginizi çekebilir