Veri Bilimi Okulu

R ile Normallik Testi
R ile Normallik Testi
r_ve_normal_dagilim

Loading

Veri seti üzerinde yaptığımız bir çok veri analizi verinin normal dağıldığı varsayımına dayanır. Veri analizine başlamadan önce verimizin normal dağılıma uygun olup olmadığına bakmamızda fayda var. Normallik kontrolü için yaygın olarak kullanılan testlerden birisi de Shapiro-Wilks testidir. Kullanımı oldukça basittir. Sadece numeric (numeric factor) verimizi argüman olarak shapiro.test(verimiz) fonksiyonuna ekliyoruz ekliyoruz.

Verimiz:

fiyat <- c(351.750, 348.400, 372.750, 378.000, 378.000, 414.750, 402.900, 400.820, 402.550, 363.384, 344.964, 373.850, 356.000)

Verimizin numeric factor olduğunu kontrol edelim:

str(fiyat)
num [1:13] 352 348 373 378 378 ...

Shapiro Testi

Testimizi yapalım:

shapiro.test(fiyat)
Shapiro-Wilk normality test
data: fiyat
W = 0.92784, p-value = 0.3192)

Sonucun yorumlanması:

Bu testte boş hipotez verinin normal dağıldığını var sayar. Eğer p değeri seçilen α seviyesinden daha düşük ise (ben p<0.05’i yeterli görüyorum)  boş hipotez reddedilir. Ancak yukarıda yapmış olduğumuz testte p değeri 0,3192’dir yani 0,05 değerinden çok büyüktür. Bu sebeple boş hipotezi reddedemeyiz. Yani verimizin normal dağıldığını kabul ediyoruz. Böylelikle normal dağılım varsayımına (ön koşuluna) sahip testleri yapabiliriz.

0

6 Responses

Bir yanıt yazın

Password Requirements:

  • At least 8 characters
  • At least 1 lowercase letter
  • At least 1 uppercase letter
  • At least 1 numerical number
  • At least 1 special character