R ile Normallik Testi
Veri seti üzerinde yaptığımız bir çok veri analizi verinin normal dağıldığı varsayımına dayanır. Veri analizine başlamadan önce verimizin normal dağılıma uygun olup olmadığına bakmamızda fayda var. Normallik kontrolü için yaygın olarak kullanılan testlerden birisi de Shapiro-Wilks testidir. Kullanımı oldukça basittir. Sadece numeric (numeric factor) verimizi argüman olarak shapiro.test(verimiz) fonksiyonuna ekliyoruz ekliyoruz.
Verimiz:
fiyat <- c(351.750, 348.400, 372.750, 378.000, 378.000, 414.750, 402.900, 400.820, 402.550, 363.384, 344.964, 373.850, 356.000)
Verimizin numeric factor olduğunu kontrol edelim:
str(fiyat) num [1:13] 352 348 373 378 378 ...
Shapiro Testi
Testimizi yapalım:
shapiro.test(fiyat) Shapiro-Wilk normality test data: fiyat W = 0.92784, p-value = 0.3192)
Sonucun yorumlanması:
Bu testte boş hipotez verinin normal dağıldığını var sayar. Eğer p değeri seçilen α seviyesinden daha düşük ise (ben p<0.05’i yeterli görüyorum) boş hipotez reddedilir. Ancak yukarıda yapmış olduğumuz testte p değeri 0,3192’dir yani 0,05 değerinden çok büyüktür. Bu sebeple boş hipotezi reddedemeyiz. Yani verimizin normal dağıldığını kabul ediyoruz. Böylelikle normal dağılım varsayımına (ön koşuluna) sahip testleri yapabiliriz.
Bravo, l’idГ©e magnifique
discoverst
Merhaba
p-value değeri < 0,05 olduğu durumlarda ne yapmamız gerekir?
Merhabalar, güzel anlatımınız için teşekkürler, Kolmogorov-Smirnov normallik testi içinde bir yazı yazabilir misiniz?
Merhabalar, histogram grafiği çizince bu veri normal dağılıma hiç benzemiyor ki 0,05 yanılma olasılığına göre ise baya şüpheler var.
Merhabalar, kamuron hum ile ilgili bir yazı yazar mısınız?
Merhabalar, sadece Shapiro testi yapmak yeterli midir yoksa bir histogram grafiği de çizdirsek ve yorumlasak olur mu?