← Tüm yazılar

Biyoistatistik

Korelasyon Analizi Nedir? Pearson ve Spearman Farkı

İki değişken arasında bir ilişki var mı? Yaş arttıkça eklem aralığı daralıyor mu? BMI yükseldikçe komplikasyon riski artıyor mu? Bu tür soruları yanıtlamak için korelasyon analizi kullanılır. Ancak "korelasyon analizi yaptım" demek yeterli değil, Pearson mı, Spearman mı, Kendall mı? Doğru seçim metodolojik güvenilirliği doğrudan etkiler.

Korelasyon Katsayısı Nedir?

Korelasyon katsayısı (r), iki değişken arasındaki doğrusal ilişkinin yönünü ve gücünü -1 ile +1 arasında bir sayıyla özetler.

r = +1: Mükemmel pozitif ilişki (biri artarken diğeri de artar)

r = -1: Mükemmel negatif ilişki (biri artarken diğeri azalır)

r = 0: İlişki yok

Yorumlama eşikleri:

r değeriYorum
0.00 - 0.19Çok zayıf
0.20 - 0.39Zayıf
0.40 - 0.59Orta
0.60 - 0.79Güçlü
0.80 - 1.00Çok güçlü

Pearson mı, Spearman mı?

Pearson korelasyonu:

Parametrik bir testtir. İki değişkenin de sürekli ve normal dağılımlı olmasını gerektirir. Doğrusal ilişkiyi ölçer.

Pearson kullanın eğer:

Spearman korelasyonu:

Non-parametrik alternatiftir. Sıra (rank) değerleri üzerinden hesaplanır. Normal dağılım varsayımı gerektirmez.

Spearman kullanın eğer:

Korelasyon Nedensellik Değildir

Tıp araştırmalarında en yaygın yanlış yorumlardan biri korelasyonu nedensellikle karıştırmaktır.

Dondurma satışı ile boğulma ölümleri arasında güçlü bir korelasyon vardır. Dondurma boğulmaya neden olmuyor, ikisi de sıcak havalarda artıyor (confounding).

Klinik araştırmada benzer tuzaklar vardır. İki değişken arasında r=0.70 çıkması, birinin diğerine neden olduğunu kanıtlamaz. Nedensellik için randomize kontrollü çalışma veya uygun gözlemsel tasarım gerekir.

Kısmi Korelasyon

İki değişken arasındaki ilişkiyi üçüncü bir değişkenin etkisini kontrol ederek incelemek istiyorsanız kısmi korelasyon (partial correlation) kullanılır.

Örnek: Yaş ve eklem aralığı arasındaki ilişkiyi BMI'nin etkisini kontrol ederek inceleyin.

SPSS: Analyze → Correlate → Partial

SPSS ile Korelasyon Analizi

Pearson:

Spearman:

Çıktıda "Correlation Coefficient" (r değeri) ve "Sig. (2-tailed)" (p değeri) raporlanır.

Scatter Plot: Görsel Kontrol Zorunludur

Korelasyon analizinden önce her zaman scatter plot (dağılım grafiği) çizin. Çünkü:

Aynı r değeri çok farklı ilişki şekillerini gizleyebilir. Anscombe's quartet bunu mükemmel gösterir: dört farklı veri seti aynı korelasyon katsayısına sahipken çok farklı görünümlere sahiptir.

Scatter plot'ta aykırı değerler, kümelenme ve doğrusal olmayan ilişki kalıpları fark edilir.

Kaç Korelasyon Yapabilirsiniz?

Çok sayıda korelasyon yapıldığında çoklu karşılaştırma sorunu ortaya çıkar. 20 değişken çifti test ederseniz şans eseri en az birinin anlamlı çıkması beklenir.

Çözüm: Birincil hipotezinizi önceden belirleyin. Keşifsel analizler için Bonferroni düzeltmesi veya FDR kontrolü uygulayın ve bunu Methods bölümünde açıklayın.

Korelasyon analizi ve yorumlanması için ücretsiz görüşme talep edin.

Bu Analizde En Çok Nerede Takılınır?

İlgili Yazılar