Biyoistatistik
Klinik Araştırmada Çok Değişkenli Analiz Nasıl Yapılır?
Major revizyon dönemlerinde reviewerların en sık yaptığı eleştirilerden biri şudur: "Konfounding faktörler kontrol edilmemiş." Bu eleştiri, çalışmanın temel bulgusunu sorgular. Çok değişkenli analiz bu sorunu çözer, ancak doğru kurgulanması gerekir.
Konfounding Faktör Nedir?
Konfounding (karıştırıcı) faktör, hem bağımsız hem de bağımlı değişkenle ilişkili olan ve bu ilişkiyi bozabilen değişkendir.
Klasik örnek: Kahve içimi ile akciğer kanseri arasında ilişki bulunuyor. Ancak kahve içenler aynı zamanda daha fazla sigara içiyor. Sigara hem kahve içimiyle hem de kanserle ilişkili, yani konfounding faktör. Sigarayı kontrol etmeden yapılan analiz yanıltıcıdır.
Tıbbi araştırmalarda yaş, cinsiyet, komorbidite indeksi, BMI ve sosyoekonomik durum en yaygın konfounding faktörlerdir.
Hangi Çok Değişkenli Analiz?
Doğru analizi seçmek bağımlı değişkenin tipine göre belirlenir:
| Bağımlı Değişken | Analiz |
|---|---|
| Sürekli (ağrı skoru, lab değeri) | Çok değişkenli lineer regresyon |
| İkili (var/yok, komplikasyon) | Lojistik regresyon |
| Zaman-olay (sağkalım) | Cox regresyon |
| Sayım verisi (tekrar sayısı) | Poisson regresyon |
Modele Hangi Değişkenler Alınmalı?
Değişken seçimi sistematik olmalıdır:
Klinik gerekçe: Literatürde konfounding faktör olduğu bilinen değişkenler modele alınmalıdır. Sadece istatistiksel kritere bakılmamalı.
Univaryat kriter: p < 0.20 veya p < 0.25 eşiği yaygın kullanılır. Bazı yazarlar tüm klinik açıdan anlamlı değişkenleri almayı tercih eder.
Örneklem büyüklüğü kuralı: Lojistik regresyonda her bağımsız değişken için en az 10-15 olay gerekir (Events Per Variable kuralı). 50 hastalık örneklemde 10'dan fazla değişken modele almak overfitting yaratır.
Adımsal (Stepwise) Yöntemler Kullanılmalı mı?
Forward, backward ve stepwise yöntemler istatistiksel yazılımlarda otomatik değişken seçimi yapar. Ancak bu yöntemler sorunludur:
- Sonuçlar örnekleme bağımlı ve tekrar edilemez
- p-değerleri şişirilmiş çıkar
- Klinik gerekçesi olmayan değişkenler modele girebilir
Tavsiye: Teorik gerekçeye dayalı manuel değişken seçimi yapın. Adımsal yöntemleri yalnızca keşifsel analizlerde kullanın ve bunu makalede açıkça belirtin.
Sonuçları Nasıl Raporlayın?
İyi bir multivaryat analiz tablosu şunları içerir:
- Her değişken için: katsayı (B), standart hata, OR/HR (ve %95 GA), p değeri
- Model uyum istatistikleri (Hosmer-Lemeshow, Nagelkerke R², AUC)
- Referans kategorileri açıkça belirtilmiş
Univaryat ve multivaryat sonuçları yan yana tabloda göstermek standarttır, reviewerlar her ikisini de görmek ister.
En Sık Yapılan Hatalar
Yalnızca anlamlı çıkan değişkenleri raporlamak: Anlamlı çıkmasa bile modele alınan tüm değişkenler tabloda gösterilmelidir.
Eksik veriyi görmezden gelmek: Bir değişkende eksik veri varsa, o gözlemler analizden çıkar. Bu selection bias yaratabilir. Multiple imputation veya complete case analizi açıklanmalıdır.
Multicollinearity kontrol etmemek: Birbirine çok benzer değişkenler aynı anda modele alınırsa katsayılar güvenilmez olur. VIF (Variance Inflation Factor) > 10 multicollinearity sorununu işaret eder.
Çok değişkenli analiz desteği için ücretsiz görüşme talep edin.
Bu Analizde En Çok Nerede Takılınır?
- Modele çok fazla değişken aldınız, overfitting riski var ama hangilerini çıkaracağınızı bilmiyorsunuz.
- VIF kontrolü yaptınız, multicollinearity var ama hangi değişkeni çıkarmanız gerektiği klinik açıdan belirsiz.
- Reviewer "adımsal yöntem kullanmayın" dedi ama manuel değişken seçiminin gerekçesini yazamıyorsunuz.