Parametrik Testlerden T Testi ile Merhaba
Giriş
Veri Bilimi Okulu okuyucularına merhaba!
Uzun süredir Veri Bilimi Okulu’nun teknik alt yapısı görevlerimin yoğunluğundan dolayı çok sık görüşemiyorduk fakat artık veri analizi içerikleri hazırlayıp sizlerle paylaşmak üzere geri döndüm🌼
Başladığımız bu seri, hangi sektörden olursanız olun hepinize hitap ediyor ve hepinizin sorularına cevap olacak. Eğitim, sosyal bilimler, lojistik, turizm, diş hekimliği, tıp, iş güvenliği ve dahası… İlk aşamada; bütün bu konuları içeren parametrik testlerle başlayıp, parametrik olmayan testlerle devam edecek olan SPSS uygulamaları sizleri bekliyor. Bu yazımızda parametrik testlerin en sevilenleri; Independent Sample T testi, Paired Sample T testi ve son olarak One Sample T testini öğreneceğiz.
Elimizdeki veri setinin T testine uygun olduğunu nasıl anlayacağız?
Veri setinin büyüklüğünü ele aldığımızda ilgili değişkenin frekans dağılımını incelediğimizde sonuç normal dağılıma uygunsa parametrik testler kullanılabilmektedir. T Testi; iki örneklem gurubu arasındaki ortalama farkı olup olmadığını inceler. Sorumuz iki örneklem arasındaki ortalamalarla ilgileniyorsa ve ilgili değişkenlerimiz normal dağılıyorsa t testi olduğunu anlarız.
Uygulama1: Veri setimizde sigara içen ve sigara içmeyen iki hasta grubunun geçirdikleri ameliyat sonrası hissettikleri ağrı seviyelerinin ortalamaları arasında anlamlı bir fark olup olmadığını Independent Sample T testi uygulayarak araştıracağız.
Uygulama2: Veri setimizde obezite sorunu olan kişilere bir ilaç uygulanmıştır ve bu ilaç uygulanmadan önceki ağırlıkları ile ilaç uygulandıktan sonra elde edilen ağırlıklarının ortalamaları arasında anlamlı bir farklılık olup olmadığını Paired Sample T testi uygulayarak araştıracağız.
Uygulama3: Yaptığımız ikinci örnekle ilgili olarak, araştırmacı doktor hastaların sonraki kilolarının ortalamasının 90 olduğunu beklemektedir. Kiloların ortalamasının 90 değerinden farklı olup olmadığını One Sample T test uygulayarak araştıracağız.
Independent Sample T Testi Uygulama 1
H0: Sigara içenler ile sigara içmeyenlerin ortalamaları arasında fark yoktur.
H1: Sigara içenler ile sigara içmeyenlerin ortalamaları arasında fark vardır.
Adım1: Analyze -> Compare Means -> Independent Sample T Test
Adım 1’den sonra sağdaki Independent Sample T test kutucuğuyla karşılaşacağız. Burada grup değişkenimizi atacağımız Grouping Variable alanını ve test edeceğimiz bağımlı değişkenimizi atacağımız Test Variable(s) alanını görüyoruz.
Adım 2: Test Variable(s) alanına bağımlı değişkenimizi atarız. -> Grouping Variable alanına sigara içen ve içmeyen gruplarımı içeren değişkenimizi atarız. -> Define Groups butonuna tıklarız. -> Define Groups kutucuğundan Group1’e sigara içmeyenlerin kodu olan 0’ı gireriz ve Group2’ye sigara içenlerin kodu olan 1’i gireriz. -> Continue butonuna tıklarız.
Adım 3: Grouping Variable kısmında sigara içen ve içmeyenlerin 0-1 olarak tanımlandığından emin olduktan sonra OK butonuna tıklarız.
Independent Sample T testini sonlandırdık ve çıkan sonuç tablolarından Grouping Statistics tablosuna göre; sigara kullanan hastaların ameliyat sonrasında hissettikleri ağrı seviyesinin ortalamasının, sigara kullanmayan hastalara göre daha az olduğu görülmektedir.
Independent Sample Test tablosuna göre ise; Levene’s Test for Equalit of Variances bölümündeki Equal variances assumed (varyansların eşit dağılımı) sig. değeri 0,013 olduğundan dolayı varyans dağılımlarının farklı olduğunu anlarız ve testin sonucunu değerlendirmek için Equal variances not assumed alanındaki t ile p değerlerini baz alırız. Sonuç olarak; significance değeri 0,037’tir ve 0,05’ten küçük olduğundan H0 hipotezini red ederek, alternatif hipotez kabul ederiz. Sigara içenler ile sigara içmeyenlerin ortalamaları arasında istatistiksel olarak anlamlı bir fark vardır deriz.
Paired Sample T Testi Uygulama 2
H0: Önceki ağırlıklar ile sonraki ağırlıkların ortalamaları arasında fark yoktur.
H1: Önceki ağırlıklar ile sonraki ağırlıkların ortalamaları arasında fark vardır.
Adım 1: Analyze -> Compare Means -> Paired Sample T Test
Adım 2: Önceki ve sonraki ağırlıkları içeren değişkenleri Variable 1 ile Variable 2 alanlarına atarız. -> Ok butonuna basarız.
Paired Sample T testini sonlandırdık ve çıkan sonuç tablolarından Paired Sample Statistics tablosuna göre, hastaların önceki ağırlıklarının ortalaması 100,43 ve hastaların sonraki ağırlıklarının ortalaması ise 99,76’dır. Analizin sonucuna göre %95 güven düzeyinde significance değeri 0,857’dir ve 0,05 değerinden büyük olduğundan dolayı, H0 hipotezi kabul edilerek hastaların önceki ağrılıkları ile sonraki ağırlıklarının ortalamaları arasında istatistiksel olarak anlamlı bir farklılık yoktur denir. Önceki ve sonraki ağrılıkların korelasyonu ise -0,086’dır aralarında zayıf ve negatif bir ilişki vardır.
One Sample T Testi Uygulama 3
H0: Gerçekleşen ortalama ile beklenen ortalama arasında fark yoktur.
H1: Gerçekleşen ortalama ile beklenen ortalama arasında fark vardır.
Adım 1: Analyze -> Compare Means -> One Sample T Test
Adım1 aşamalarını takip ettiğimizde karşımıza sağ altta görünen kutucuk açılacaktır.
Adım 2: Sonuç değişkeninde ki beklenen değeri test etmek amacıyla sonuç değişkeni Test Variable(s) alanına atılır. -> hastaların ilaç sonrası ağırlıklarının ortalaması 90 beklendiği için Test Value kısmının değeri 90 olarak girilir. -> Ok butonuna basılır.
One Sample T testini sonlandırdık ve çıkan sonuç tablolarından One Sample Statistics tablosunda sonuç değişkeni olan ağrılıkların ortalamasının 99,76 olduğu görülmektedir. Fakat araştırmacının istediği sonuç ortalaması 90’dır ve sonuç olarak gerçekleşen ortalama ile beklenen ortalama değeri arasında anlamlı bir farklılık olduğu görülmektedir. %95 güven düzeyinde significance değeri 0,000 olduğundan ve 0,05 değerinden küçük olduğundan dolayı H0 hipotezi red edilerek gerçekleşen ortalama ile beklenen ortalama arasında fark vardır denir.
Sonuç
Parametrik testlerden olan t testi türlerinin hepsini ayrıntılı bir şekilde anlatmaya çalıştım, sorularınız olursa yorumlarda belirtmekten lütfen çekinmeyin. İlgili sorularınız için benimle ve tüm VBO ekibiyle Likedln platformu aracılığı ile iletişime geçebilirsiniz.
Bol verili günler diliyorum…
Görüşmek üzere ✋
Merhaba Elif Hanım,
Öncelikle emeğinize sağlık. Çok faydalı bir yazı olmuş. Yalnızca küçük bir notumu iletmek isterim, sanırım independent sample t test örneğinizde bir karışıklık olmuş. “Levene’s Test for Equalit of Variances bölümündeki Equal variances assumed (varyansların eşit dağılımı) sig. değeri 0,013 olduğundan dolayı varyans dağılımlarının farklı olmadığını anlarız ve testin sonucunu değerlendirmek için Equal variances not assumed alanındaki t ile p değerlerini baz alırız” demişsiniz. Fakat oradaki p değer %5’ten küçük olduğu için aslında hipotezi reddederek varyanslar arasında fark vardır dediğimiz için not assumed olana bakıyoruz. Bir karışıklık olmuş sanırım. 🙂 Güzel günler dilerim.
Merhabalar Hande Hanım,
Uygulamaları faydalı bulduğunuz ve beğendiğiniz çok çok memnunum. Küçük notunuz için çok teşekkür ederim. Karışıklığı güncelledim. 🙂 İyi günler dilerim.
Merhaba ben Yüksek Lisans Öğrencisiyim. SPSS’de bir takım bilgilere ihtiyacım var. internette araştırdım ama sanırım ben iyi bir araştırma yapamadım aradıklarımı bulamadım.
Yardımcı olursanız sevinirim.
Sorularım şöyle:
1- Independet Sample Test
2- Paired Sample Test
3-Kuruskal-Walls Varyans Analizi
4- Man-Whitney U testi
Bunların herbirinin tanımı( tanımlarını buldum yazdım) H
Herbirinin kullanım alanları, avantaj ve dezavantajları gerekiyor bana .
Nereden bulabilirim.Önereceğiniz bir site varmıdır.Yada sizin yazılarınızda varmıdır.
Yardımcı olursanız sevinirm
Teşekkür ederim.
Yeliz hanım merhabalar,
Bahsedilen analiz yöntemleri hem parametrik hem de parametrik olmayan istatistiksel yöntemlerdir. Bu yöntemlerin avantajları ve dezavantajları gibi bir ayrımdan bahsedemeyiz çünkü bu yöntemlerin seçilme noktasına gelene kadar veri seti incelenip, bahsettiğimiz yöntemlerin uygulanması için bazı varsayımların karşılanması gerekmektedir. Sonuç olarak, 4 analiz yönteminin varsayımlarını Google da araştırabilirseniz kafanızdaki bütün soru işaretlerinin çözüleceğini düşünmekteyim. Kaynak olarak, Prof. Dr. Şeref Kalaycı’nın Çok Değişkenli İstatistik Yöntemleri kitabını önerebilirim.
İyi çalışmalar dilerim.
Merhaba Elif Hanim,
Site bir bakteri ekleyip bu setten peynir elde edeceğim. elde ettigim peyniri on Gunde bir analiz ederek eklediğim bakterinin sayısini öğreneceğim. Bu sayım 60 gun bound alti defa yapılacaktır. sormak istediğim soru sudur: Paired Sample T testi mi kullanmalıyım yoksa Tekrarli Olcumler ANOVA testi mi kullanmalıyım?
Yardimlariniz şimdiden teşekkürler
Merhabalar, Istatistik ve Biyoistatistik ogrenmeye sıfırdan başlayan bir öğrenciye yararli buldugunuz elektronik/yazılı kaynak tavsiyeleriniz olur mu? Şimdiden tesekkurler