Biyoistatistik
Korelasyon Analizi Nedir? Pearson ve Spearman Farkı
İki değişken arasında bir ilişki var mı? Yaş arttıkça eklem aralığı daralıyor mu? BMI yükseldikçe komplikasyon riski artıyor mu? Bu tür soruları yanıtlamak için korelasyon analizi kullanılır. Ancak "korelasyon analizi yaptım" demek yeterli değil, Pearson mı, Spearman mı, Kendall mı? Doğru seçim metodolojik güvenilirliği doğrudan etkiler.
Korelasyon Katsayısı Nedir?
Korelasyon katsayısı (r), iki değişken arasındaki doğrusal ilişkinin yönünü ve gücünü -1 ile +1 arasında bir sayıyla özetler.
r = +1: Mükemmel pozitif ilişki (biri artarken diğeri de artar)
r = -1: Mükemmel negatif ilişki (biri artarken diğeri azalır)
r = 0: İlişki yok
Yorumlama eşikleri:
| r değeri | Yorum |
|---|---|
| 0.00 - 0.19 | Çok zayıf |
| 0.20 - 0.39 | Zayıf |
| 0.40 - 0.59 | Orta |
| 0.60 - 0.79 | Güçlü |
| 0.80 - 1.00 | Çok güçlü |
Pearson mı, Spearman mı?
Pearson korelasyonu:
Parametrik bir testtir. İki değişkenin de sürekli ve normal dağılımlı olmasını gerektirir. Doğrusal ilişkiyi ölçer.
Pearson kullanın eğer:
- Her iki değişken sürekli (kesintisiz sayısal) ise
- Her iki değişken normal dağılım gösteriyorsa
- Aykırı değer yoksa veya minimal ise
Spearman korelasyonu:
Non-parametrik alternatiftir. Sıra (rank) değerleri üzerinden hesaplanır. Normal dağılım varsayımı gerektirmez.
Spearman kullanın eğer:
- Değişkenlerden biri veya ikisi normal dağılım göstermiyorsa
- Ordinal ölçek kullanılıyorsa (Likert, VAS skoru gibi)
- Aykırı değerler varsa
- Monoton ama doğrusal olmayan ilişki söz konusuysa
Korelasyon Nedensellik Değildir
Tıp araştırmalarında en yaygın yanlış yorumlardan biri korelasyonu nedensellikle karıştırmaktır.
Dondurma satışı ile boğulma ölümleri arasında güçlü bir korelasyon vardır. Dondurma boğulmaya neden olmuyor, ikisi de sıcak havalarda artıyor (confounding).
Klinik araştırmada benzer tuzaklar vardır. İki değişken arasında r=0.70 çıkması, birinin diğerine neden olduğunu kanıtlamaz. Nedensellik için randomize kontrollü çalışma veya uygun gözlemsel tasarım gerekir.
Kısmi Korelasyon
İki değişken arasındaki ilişkiyi üçüncü bir değişkenin etkisini kontrol ederek incelemek istiyorsanız kısmi korelasyon (partial correlation) kullanılır.
Örnek: Yaş ve eklem aralığı arasındaki ilişkiyi BMI'nin etkisini kontrol ederek inceleyin.
SPSS: Analyze → Correlate → Partial
SPSS ile Korelasyon Analizi
Pearson:
Spearman:
Çıktıda "Correlation Coefficient" (r değeri) ve "Sig. (2-tailed)" (p değeri) raporlanır.
Scatter Plot: Görsel Kontrol Zorunludur
Korelasyon analizinden önce her zaman scatter plot (dağılım grafiği) çizin. Çünkü:
Aynı r değeri çok farklı ilişki şekillerini gizleyebilir. Anscombe's quartet bunu mükemmel gösterir: dört farklı veri seti aynı korelasyon katsayısına sahipken çok farklı görünümlere sahiptir.
Scatter plot'ta aykırı değerler, kümelenme ve doğrusal olmayan ilişki kalıpları fark edilir.
Kaç Korelasyon Yapabilirsiniz?
Çok sayıda korelasyon yapıldığında çoklu karşılaştırma sorunu ortaya çıkar. 20 değişken çifti test ederseniz şans eseri en az birinin anlamlı çıkması beklenir.
Çözüm: Birincil hipotezinizi önceden belirleyin. Keşifsel analizler için Bonferroni düzeltmesi veya FDR kontrolü uygulayın ve bunu Methods bölümünde açıklayın.
Korelasyon analizi ve yorumlanması için ücretsiz görüşme talep edin.
Bu Analizde En Çok Nerede Takılınır?
- r = 0.45 çıktı ama bunun "orta korelasyon" olduğunu makalede nasıl ifade edeceğinizi bilmiyorsunuz.
- Pearson mu Spearman mı kullanmanız gerektiğine karar veremiyorsunuz, normallik testi sınırda.
- Korelasyon anlamlı çıktı ama reviewer "korelasyon nedensellik değildir" diyor, nasıl yanıt vereceğiniz belirsiz.