İSTATİSTİKİ VERİLERİ YORUMLAMAK: t ve p DEĞERLERİ

Akademik yayınları takip edebilmenin ve paylaşılan verinin anlamlılığını yorumlayabilmenin belki de birincil unsuru paylaşılan istatistikleri okuyabilmek. Bu yazıda istatistikle ilgili temel kavramları açıklıyor ve sonunda “Nonhuman primates prefer slow tempos but dislike music overall” başlıklı 2007 yılında yayınlanan çalışmanın 1. deney sonuçlarını1 yorumluyor olacağım. Böylece kavramların uygulanma şeklini göstermeyi hedefliyorum.

Öncelikle kavramlarla başlayalım,

Mean (Ortalama):

Bir veri setine dair ilk bilgiyi edinebileceğimiz, verilerin aritmetik ortalamasıdır.

Median (Medyan):

Mean ortalama olanı gösterirken, median sıralı bir veri setinde ortada olan değeri ifade eder.

Standard Deviation (Standart Sapma):

Veri setimizin ne kadar dağınık olduğuna dair bilgi verir. Örneğin 4,4,5,6,6 ve 1,1,2,8,12 veri setleri aynı ortalamaya(5) sahip olsalar da ikinci setin standart sapması daha yüksektir ve veri daha dağınıktır.

Statistical Significance (İstatiktiksel Anlamlılık):

Elde edilen verinin yalnızca şans eseri oluşma oluşmadığının belirlenmesidir.

Null Hypothesis (Null Hipotez):

Null hipotez, iki grup arasında bir ilişki olmadığına dair bir önermedir. Null hipotez yanlışlanırsa, bu iki parametre arasında bir ilişki olduğunu gösterir.

p value (p değeri):

Elde edilen sonuçların tamamen şans eseri oluşmasının olasılığıdır. Dolayısıyla daha düşük p değeri, bu verilerin şans eseri gözlenmesi olasılığının düşük olduğunu gösterir. p ≤ .05 oranını elde ettiğimiz bir veri seti, istatistiksel olarak anlamlıdır. Bu da null hipotezi, yani parametlelerimizin arasında bir ilişki olmadığı ve tamamen şans eseri bu veri setinin oluştuğuna dair olan hipotezi, yanlışlamak için güçlü bir kanıt oluşturur. Sonrasında daha çok araştırmamız için zemin hazırlamış olur.

Degree of Freedom (Serbestlik Derecesi):

Veri setinin boyutuyla yakından ilişkili bir değerdir. Daha büyük bir veri setiyle daha yüksek bir değer elde edileiblir.

t value (t değeri):

Genellikle iki veri seti birbirlerinden farklı mıdır değil midir sorusuna cevap arar. Varsa bu gruplar arasındaki farkın ne kadar anlamlı olduğunu belirtir. T değerinin 0 olması örnek sonuçlarımızın null hipotezine tıpa tıp eşit olması anlamına gelir. İki veri seti arasındaki fark arttıkça, t değerinin mutlak değeri büyür.

Control (kontrol):

Bir parametreyi kontrol etmiş olmak, o parametrenin istatistik üzerindeki etkisini izole etmiş olmak anlamına gelir. Örneğin, bir topluluktaki insanların kilo ve kas kütlesi arasındaki ilişkiyi inceliyorsunuz. Cinsiyet kilo ve kas kütlesi oranı üzerinde etkili olabileceğinden, cinsiyet parametresini kontrol etmek gerekir. Bu bağlamda, eğer incelediğiniz istatistik verilerinin, etkili olabilecek bir parametre için kontrol edilmediğini görürseniz, verilere şüpheyle yaklaşabilirsiniz.

Proof (Kanıt):

İstatistiksel testler sonrasında bir önermenin doğruluk derecesinin rasyonel olarak gösterilmesidir.

Şimdi bu temel teirmleri kullanarak “Nonhuman primates prefer slow tempos but dislike music overall” başlıklı yayının 1. deneyini istatistiksel olarak yorumlayabiliriz. Yayına referanstan ulaşabilirsiniz.

Deney esnasında ipek maymunlarına (tamarin ve marmoset) sağ ve soldan iki farklı müzik dinletilecek. Deneklerin zaman geçirdikleri bölgeye bakılarak hangi tür müzikten hoşlandıkları belirlenmeye çalışılacak.

Method Validation safhasında yöntemin doğruluğunu kontrol etmek için 60 ve 90 desibelik beyaz gürültü (white noise) dinletilerek maymunların sese göre konumlarını değiştirip değiştirmediklerini test ediyorlar. 90 desibellik sesin daha itici olmasını bekliyorlar. Tamarin maymunları için bu deneyi daha önceli çalışmalarında yapmış oldukları için(McDermott & Hauser, 2004 2), sadece 6 marmoset üzerinde yöntemlerini test ediyorlar. Marmosetlerin ortalama olarak zamanlarının 63.3%‘ünü yumuşak müzik bölgesinde geçirdiklerini saptıyorlar. p ≤ .0001 verisini paylaşıyorlar.

Bu şu şekilde okunabilir, yalnızca şans eseri Marmosetlerin zamanlarının ortalama 63.3%‘ünü yumuşak müzikli bölgede geçirmelerinin olasılığı .0001’dir. Bu değer .05 anlamlılık sınırından düşük olduğu için, sonuçları istatistiksel olarak anlamlıdır. Marmosetler rahatsız edici müzikten dolayı yerlerini değiştirmişlerdir, dolayısıyla deney yöntemi doğrulanmıştır.

İlk deneyde, ipek maymunlarına flütle çalınan yumuşak bir müziği ve elektronik gitarla çalınan bir tekno müziği dinletiyorlar. İki müzikte de genlik dalgalanmalarının etkisini izole edebilmek için iki müziği de aynı genlik aralığına filtreliyorlar. İnsan sesinin yanıltıcı olmasının önlenmesi amacıyla da yalnızca enstrumantal müzik kullanılıyor. Çıkan sonuçlara göre:

Hem tamarinlerin hem de marmosetlerin yumuşak fülüt müziğini tercih ettikleri gösteriliyor.Tamarinler: t(31) = 4.47, p ≤ .0001; Marmosetler: t(23) = 7.27, p ≤ 0.00001 istatistiklerini gösteriyor. Bu verileri şu şekilde yorumlayabiliriz, t değerleri 0’dan uzak oldukları için null hipotezimizin yanlış olduğunu göstermiş olur. Bu kanıtımızın ne kadar güçlü olduğuna bakmak için de p değerlerine bakarız. İki değer de .05’ten küçük olduğu için, istatistiksel olarak anlamlı şekilde hem marmosetler hem de tamarinler yumuşak müziği tercih etmişlerdir. Elde ettiğimiz verinin şans eseri oluşmuş olma olasılığı p değerleri kadar küçüktür, yani bu bize ipek maymunların sevdikleri müzik hakkında bir kanıt sunar.

Farklı methodlar kullanılarak yapılan çalışmaları da sonraki yazılarda değerlendirelim.


  1. Mcdermott, Josh & Hauser, Marc. (2005). The origins of music: Innateness, uniqueness, and evolution. Music Perception - MUSIC PERCEPT. 23. 29-59. p. 39. doi:10.1525/mp.2005.23.1.29. ↩︎

  2. Mcdermott, Josh & Hauser, Marc. (2007). Nonhuman primates prefer slow tempos but dislike music overall. Cognition. doi:104. 654-68. 10.1016/j.cognition.2006.07.011. ↩︎