P-değeri Nedir?

Merhaba,

Bu yazıda p-değerinin tanımı, hesaplanma mantığı, hipotez testlerindeki yeri ve yorumlanmasını ele alacağız.

P-değeri(p-value); istatistiksel bir test gerçekleştirildiğinde sıfır hipotezinin(H0) reddedilip reddedilmeyeceğine karar vermeye yardımcı olur. P-değeri ne kadar küçükse sıfır hipotezini reddetme olasılığı o kadar yüksektir.

Sıfır Hipotezi Nedir?

Tüm istatistiksel testlerin sıfır hipotezi vardır. Çoğu test için sıfır hipotezi, ilgilendiğiniz değişkenler arasında ilişki olmadığı veya gruplar arasında fark olmadığı şeklindedir.

Örnek olarak bağımsız örneklem t-testi(independent sample t-test) hipotezleri aşağıdaki gibi olabilir.

H0: Grupların ortalamaları arasında anlamlı fark yoktur.

H1: Gruplar ortalamaları arasında anlamlı fark vardır.

Hipotez Testine P-değeri Yaklaşımı

Hipotez testine yönelik p-değeri yaklaşımı, sıfır hipotezini reddedecek kanıt olup olmadığını belirlemek için hesaplanan olasılığı kullanır. Sıfır hipotezi, bir popülasyon hakkındaki ilk iddiadır. Alternatif hipotez(H1), popülasyon parametresinin H0’da belirtilen popülasyon parametresi değerinden farklı olup olmadığını belirtir.

Sıfır hipotezini reddetmek için p-değerinin ne kadar küçük olması gerektiği önceden belirtilir. Bir konuyu incelerken farklı araştırmacılar farklı güven düzeyleri kullanabilir ve bu durumda okuyucular bu iki farklı testin sonuçlarını karşılaştırmakta zorluk çekebilir. P-değerleri bu soruna bir çözüm sağlar.

Örneğin; bir araştırmacı sıfır hipotezini reddetmek için %90 ve diğeri %95 güven düzeyi kullanmış olsun. Bu iki sonuç arasındaki gözlenen farkın p-değeri 0,07 ise (93’lik bir güven düzeyine karşılık gelir) ilk araştırmacı iki grubun istatistiksel olarak anlamlı bir farka sahip olduğunu tespit ederken, ikincisi gruplar arasında istatistiksel olarak anlamlı bir fark bulmayacaktır.

Bu sorunu önlemek için, araştırmacılar hipotez testinin p-değerini bildirebilir ve okuyucuların istatistiksel önemi kendilerinin yorumlamasına izin verebilir. Buna hipotez testi için p-değeri yaklaşımı denir. Bağımsız gözlemciler, p-değerini not edebilir ve bunun istatistiksel olarak anlamlı bir farkı temsil edip etmediğine kendileri karar verebilirler.

Düşük bir p değeri bile, gözlemlenen verilerin şans eseri olma olasılığı olduğundan, istatistiksel olarak anlamlı olduğunun kanıtı olmayabilir. Bir ilişkinin istatistiksel olarak anlamlı olup olmadığını yalnızca tekrarlanan deneyler veya çalışmalar doğrulayabilir.

Grafik olarak, p-değeri olasılık dağılımının kuyruğundaki alandır ve tek kuyruklı bir test ise test istatistiğinin sağındaki alan, iki kuyruklu bir test ise soldaki ve sağdaki alandır.

P-değeri – Alfa Seviyesi

Alfa seviyeleri araştırmacı tarafından kontrol edilir ve güven seviyeleri ile ilişkilidir. Güven düzeyi %100’den çıkarılarak bir alfa düzeyi elde edilir. Örneğin, araştırmaya yüzde 98 güvenmek için, alfa düzeyi %2 olacaktır. Hipotez testi çalıştırıldığında test bir p-değeri verecektir. Bu değer seçilen alfa düzeyiyle karşılaştırılır. Örneğin, alfa düzeyinin %5 (0,05) olarak seçtildiğini varsayalım. Testin sonucu küçük bir p (≤ 0.05) ise bu sıfır hipotezinin geçersiz olduğuna dair güçlü bir kanıttır. Testin sonucu büyük bir p (> 0,05) ise alternatif hipotezin zayıf olduğu anlamına gelir, dolayısıyla sıfır hipotez reddedilemez.

Görsel-1: P-değeri Grafiksel Gösterimi

P-değeri Tam Olarak Nedir?

Yukarıda verilen bilgiler ışığında p-değerini tekrar tanımlayalım:

P-değeri, verilerin sıfır hipotezi altında gerçekleşmiş olma olasılığını verir. Bunu, verileri kullanarak istatistiksel bir test tarafından hesaplanan sayı olan test istatistiğinin olasılığını hesaplayarak yapar.

P-değeri, o testin sıfır hipotezi doğruysa, bir test istatistiğini ne sıklıkla istatistiksel test tarafından hesaplanandan daha aşırı görmeyi beklediğini söyler. Verilerden hesaplanan test istatistiği sıfır hipotezi tarafından tahmin edilen test istatistikleri aralığından uzaklaştıkça p değeri küçülür.

Örneğin; iki farklı öğrenci grubu ortalama olarak aynı notları alıyorlarsa, o zaman t-testinden elde edilen test istatistiği sıfır hipotezinden (gruplar arasında fark yoktur) elde edilen test istatistiğiyle yakından eşleşir ve elde edilen p değeri 1’e yakın olur. Gerçek hayatta gruplar tamamen eşit olmayacak olmayacağı için p-değeri de tam olarak 1 olmayacaktır.

Bununla birlikte, iki grup arasında ortalama not farkı varsa, o zaman test istatistiği sıfır hipotezi tarafından tahmin edilen değerlerden uzaklaşacak ve p-değeri küçülecektir. P-değeri hiçbir zaman sıfıra ulaşmaz, çünkü olayların şans eseri meydana gelme olasılığı son derece düşük olsa bile her zaman bir olasılık vardır.

P-değeri Nasıl Hesaplanır?

P-değerleri genellikle p-değeri tabloları veya istatistik yazılımı kullanılarak bulunur. Bu hesaplamalar, test edilen istatistiğin varsayılan veya bilinen olasılık dağılımına dayanmaktadır. P-değeri, olasılık dağılımı göz önüne alınarak, gözlemlenen değer ile seçilen bir referans değer arasındaki sapmadan hesaplanır.

Matematiksel olarak p-değeri, olasılık dağılım eğrisinin altındaki toplam alana göre, referans değerden en az gözlenen değer kadar uzak olan tüm istatistik değerleri için olasılık dağılım eğrisinin altındaki alandan integral hesabı kullanılarak hesaplanır.

Özetle, gözlemlenen iki değer arasındaki fark ne kadar büyükse, farkın basit rastgele şanstan kaynaklanma olasılığı o kadar düşüktür ve bu daha düşük bir p-değeri ile yansıtılır.

 

Görsel-2: P-değeri Grafiksel Gösterimi

(Kaynak: https://www.simplypsychology.org/p-value.html)

P-değerinin Anlamlı Olup Olmadığı Nasıl Anlaşılır?

P-değeri, olayların şans eseri meydana gelme olasılığının (yani sıfır hipotezin doğru olması) ne kadar olası olduğunu açıklayan bir sayıdır.

İstatistiksel anlamlılık seviyesi 0 ile 1 arasında bir p-değeri olarak ifade edilir. P-değeri ne kadar küçükse, sıfır hipotezini reddetmeniz gerektiğine dair kanıt o kadar güçlüdür.

Eşik değer(kritik değer veya alfa değeri olarak da ifade edilir) çalışma alanına bağlıdır. Bazı alanlar 0,01, hatta 0,001 eşiklerini tercih eder. Ancak en yaygın eşik p < 0,05’tir.

Kritik değerin 0,05 seçildiğin bir araştırmada 0,05’ten küçük bir p-değeri istatistiksel olarak anlamlıdır. Boş hipotezin doğru olma olasılığı %5’ten az olduğundan, sıfır hipotezine karşı güçlü kanıtlar gösterir. Bu nedenle sıfır hipotezini reddeder ve alternatif hipotezi kabul ederiz. Ancak bu durum, alternatif hipotezin doğru olma olasılığının %95 olduğu anlamına gelmez. P-değeri, sıfır hipotezinin doğru olmasına bağlıdır, ancak alternatif hipotezin doğruluğu veya yanlışlığı ile ilgisi yoktur.

0,05’ten yüksek bir p-değeri istatistiksel olarak anlamlı değildir ve sıfır hipotezi için güçlü kanıtlara işaret eder. Bu, sıfır hipotezini koruduğumuz ve alternatif hipotezi reddettiğimiz anlamına gelir.

İstatistiksel olarak anlamlı bir sonuç, bir araştırma hipotezinin doğru olduğunu kanıtlayamaz. Çünkü bu %100 kesinlik anlamına gelir. Bunun yerine, sonuçların araştırma hipotezini “desteklediğini” veya “kanıt verdiğini” belirtilebilir.

0.01 p-değeri Ne Anlama Geliyor?

0,01’lik bir p-değeri, test edilen sıfır hipotezi gerçekten doğruysa, sonuçların aşırı derecede gözlemlenmesinin 100’de bir şansı olacağını gösterir. Bu, gözlemcinin sıfır hipotezini reddetmesine yol açar çünkü ya oldukça nadir bir veri sonucu gözlemlenmiştir ya da sıfır hipotezi yanlıştır.

Bir Hipotez Testinin İki Farklı Sonucunu Karşılaştırmak için p-değerini Nasıl Kullanabilirsiniz?

Biri p-değeri 0,01 ve diğer p-değeri 0,03 olan iki farklı sonucunuz varsa, p-değeri 0,01 olan sonuç, 0,03 olan p-değerinden istatistiksel olarak daha anlamlı kabul edilecektir. Her ikisi de istatistiksel olarak anlamlıdır, ancak 0.01 örneği sıfır hipotezine karşı 0.03’ten daha güçlü bir durum sağlar.

P-değerlerini Kullanırken Dikkat!

P-değerleri genellikle, sıfır hipotezi gerçekte doğru olduğunda, testinizin sıfır hipotezini reddetme riski olarak yorumlanır.

Gerçekte, özellikle tek bir çalışmaya bakıldığında veya küçük örneklem boyutları kullanıldığında, sıfır hipotezini reddetme riski genellikle p-değerinden daha yüksektir. Bunun nedeni, referans çerçevesi kadar küçük olursa, tamamen kazara istatistiksel olarak anlamlı bir örüntüye rastlama şansı da o kadar yüksek olmasıdır.

P-değeri aynı zamanda alternatif hipotezi destekleyen veya çürüten değer olarak yorumlanabilir. Ancak böyle değildir. P-değeri yalnızca sıfır hipotezinin desteklenip desteklenmediğini söyleyebilir. Alternatif hipotezinizin doğru olup olmadığını veya nedenini söyleyemez.

Kaynakça

https://www.simplypsychology.org/p-value.html

https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/p-value/

https://www.investopedia.com/terms/p/p-value.asp

https://www.scribbr.com/statistics/p-value/

https://www.youtube.com/watch?v=vemZtEM63GY&ab_channel=StatQuestwithJoshStarmer

https://community.jmp.com/t5/JMP-Blog/P-values/ba-p/37506

Yazar Hakkında
Toplam 11 yazı
Emre Rıdvan Muratlar
Emre Rıdvan Muratlar
2016 yılından bu yana finans sektöründe veri bilimi üzerine çalışmaktadır. Yıldız Teknik Üniversitesi İstatistik bölümü doktora öğrencisidir.
Yorumlar (1 Yorum)
fuat koçyiğit
fuat koçyiğit Yanıtla
- 17:16

elinize ve emeğinize sağlık..

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara