Medikal Yapay Zeka

Clinical Evaluation Report (CER) İstatistik Bölümü Nasıl Yazılır

30 Haziran 2026 · 6 dk okuma · Burak Serteser

Kısa Cevap

Clinical Evaluation Report (CER) istatistik bölümü, MEDDEV 2.7/1 Rev 4'ün dört aşamasından (Stage 0 scope, Stage 1 literatür/veri tanımlama, Stage 2 appraisal, Stage 3 analiz) Stage 2 ve Stage 3'ün metodolojik çekirdeğidir. Burada her bir klinik veri kaynağı (literatür, PMCF, post-market verisi, eşdeğer cihaz verisi) için kanıt değeri ve metodolojik kalite önceden tanımlı bir scoring şemasıyla appraise edilir; ardından klinik iddialar (intended purpose, performans, güvenlik) bu kanıtla nicel olarak desteklenir veya açık olarak gap işaretlenir. EU-MDR Annex XIV bunu zorunlu kılar: state-of-the-art tanımı, benefit-risk dengesi, residual risk ve PMCF'ye köprülenen analiz. CER bir QMS/ISO 13485 dokümanı değildir, bir klinik kanıt sentezi belgesidir.

Serteser Danışmanlık, bir medical-AI tıbbi cihazı geliştirip hakemli uluslararası bir dergide yayınlamış bir biyomedikal mühendis (BME MSc) tarafından yürütülür; SaMD/AI cihazlarınızın TİTCK-CDSS, EU-MDR ve FDA dosyalarının çekirdeğindeki CER'in istatistik ve klinik-veri çekirdeğini ve literatür appraisal şemasını tasarlar, istatistiğini yürütür ve isimli metodolog olarak bu çekirdeği imzalar; CER'in klinik-değerlendirme onayı sizin isimli klinik-değerlendiricinizde kalır. QMS yapısı, teknik dosya formatı ve ürün tescil evrakı ayrı uzmanlıklardır ve bizim şeritimizde değildir; biz kanıtın kendisini kuran metodolojik çekirdeği üstleniriz.

CER yazımında en sık karıştırılan nokta şudur: "Clinical Evaluation Report" bir kalite yönetimi dokümanı gibi görünür ama özünde bir bilimsel kanıt sentezi belgesidir. Bir notified body veya TİTCK reviewer'ı CER'i açtığında ilk baktığı yer kapak değil, Stage 2 appraisal tablosudur: hangi veriyi neden kabul ettiniz, hangisini neden dışladınız, ve klinik iddialarınızı destekleyen kanıtın metodolojik gücü nedir.

Bu yazıda CER'in istatistik/klinik-veri çekirdeğinin nasıl kurulduğunu, MEDDEV 2.7/1 Rev 4 ile EU-MDR Annex XIV'ün bu bölümden ne beklediğini ve bir biyoistatistikçinin tam olarak nereye değdiğini (ve nereye değmediğini) açıklıyorum.

CER bir QMS dokümanı değildir: nereye oturur

CER bir kalite kaydı değil, intended purpose ile klinik kanıt arasındaki bağı kuran analitik belgedir. Karışıklığı netleştirelim:

  • QMS / ISO 13485: Süreçlerin nasıl kontrol edildiğini gösterir. CER'in yazılma sürecini prosedürle bağlar ama içeriğini yazmaz.
  • Technical Documentation (EU-MDR Annex II/III): CER bunun bir parçasıdır, ama formatı/dosyalanması ayrı bir disiplindir.
  • Clinical Evaluation Plan (CEP): CER'den önce gelir. Scope, klinik iddialar, arama stratejisi, appraisal kriterleri ve kabul-red eşikleri burada önceden tanımlanır. CEP'te kriter yoksa CER'deki seçimler "post-hoc" sayılır ve eleştiri yer.
  • CER'in çekirdeği: Klinik verinin tanımlanması, appraisal'ı (metodolojik kalite + kanıt değeri) ve sentezi. Burası tamamen metodolojik/istatistiksel bir iştir.

Biyoistatistikçi tam olarak bu çekirdekte çalışır. QMS yapısını, teknik dosya formatını veya ürün tescil evrakını biz üretmeyiz: o ayrı bir regülasyon/kalite uzmanlığıdır. Biz kanıtın değerlendirilmesini ve sentezini kuran kısmı sahipleniriz.

MEDDEV 2.7/1 Rev 4'ün dört aşaması ve istatistik nerede

MEDDEV 2.7/1 Rev 4 hâlâ CER yapısının fiili referans iskeletidir (EU-MDR ile birlikte MDCG 2020-1, 2020-5, 2020-6 rehberleri tamamlayıcı olarak kullanılır). Dört aşama:

  • Stage 0, Scope: Cihaz, intended purpose, claim listesi ve değerlendirilecek klinik soruların tanımı. Burada her klinik iddia ayrıştırılır: performans iddiası, güvenlik iddiası, benefit iddiası.
  • Stage 1, Identification of data: Sistematik literatür araması (PICO benzeri arama stratejisi, veritabanları, tarih aralığı, dahil-dışlama kriterleri), üreticinin kendi klinik verisi, PMS/PMCF verisi ve varsa eşdeğer cihaz verisi.
  • Stage 2, Appraisal: Her veri kaynağının metodolojik kalitesi ve klinik kanıt değeri önceden tanımlı bir scoring şemasıyla puanlanır. CER'in istatistiksel kalbi burasıdır.
  • Stage 3, Analysis: Appraise edilmiş veri, her klinik iddiayı destekleyecek şekilde sentezlenir; state-of-the-art ile karşılaştırılır; benefit-risk dengesi ve residual risk değerlendirilir; gap'ler PMCF planına köprülenir.

Stage 1'in arama stratejisi sistematik derleme metodolojisini birebir yansıtır: PRISMA-benzeri akış diyagramı, çoğaltma/duplikat eleme, iki bağımsız tarayıcı ve uyuşmazlık çözümü kaydedilmelidir. Reviewer "arama tekrarlanabilir mi" diye bakar.

Stage 2 appraisal: önceden tanımlı scoring şeması

Appraisal CER'in en çok eleştiri alan ve en çok metodoloji isteyen bölümüdür. İki boyut puanlanır:

  • Suitability (uygunluk): Veri bu cihazın bu intended purpose'una ne kadar uygun? (Aynı cihaz mı, eşdeğer mi, aynı endikasyon mu, aynı popülasyon mu.)
  • Data contribution / quality (kanıt değeri ve metodolojik kalite): Çalışma tasarımı (RCT vs gözlemsel vs case series), örneklem büyüklüğü, bias riski, istatistiksel raporlamanın yeterliliği.

Pratikte burada bilinen risk-of-bias araçları devreye girer. Tanısal performans çalışmalarında QUADAS-2, prediksiyon/AI modellerinde PROBAST (ve AI cihazlar için PROBAST-AI), randomize çalışmalarda Cochrane RoB 2 appraisal'a metodolojik temel sağlar. AI/ML tabanlı bir SaMD için raporlama yeterliliğini değerlendirirken TRIPOD-AI ve klinik karar destek için DECIDE-AI checklist'leri appraisal kriterlerine gömülür.

Kritik nokta: appraisal kriterleri ve eşik puanları CEP'te önceden belirlenmiş olmalıdır. Veriyi gördükten sonra "bu çalışmayı şu yüzden kabul ettik" demek, reviewer için kırmızı bayraktır. Önceden tanımlı, tekrarlanabilir bir scoring rubric en güçlü savunmadır.

Medikal AI/SaMD cihazınızın CER istatistik çekirdeğini ve appraisal şemasını birlikte kurmak için 15 dakikalık ücretsiz scoping talep edin.

Stage 3 sentez: iddiayı kanıta nicel olarak bağlamak

Appraisal bittikten sonra her klinik iddia için kanıt sentezi yapılır. Burada biyoistatistikçinin somut çıktıları:

  • State-of-the-art tanımı: Karşılaştırma çıtasını koyan veri. EU-MDR Annex XIV açıkça SoTA ile karşılaştırma ister. Bu "literatürde ne var" değil, "kabul görmüş klinik performans aralığı nedir" demektir, ve sayısal aralıklarla (örn. sensitivity/specificity dağılımları, AUC-ROC bandı) ifade edilir.
  • Pooled veya nitel sentez: Yeterli homojen veri varsa nicel sentez (uygunsa meta-analitik özet ve heterojenite değerlendirmesi), aksi halde yapılandırılmış nitel sentez. Heterojenite yüksekse pooling yapılmaz, bu da açıkça gerekçelendirilir.
  • Performans metriklerinin uygun raporlanması: Tanı cihazında nokta tahmin değil, %95 güven aralığıyla sensitivity, specificity, PPV/NPV (prevalansa bağlı olduğu notuyla), ve mümkünse kalibrasyon. Tek bir AUC rakamı CER için yetersizdir.
  • Benefit-risk ve residual risk: Klinik faydanın, residual risklerin önüne geçtiğini gösteren yapılandırılmış değerlendirme. Risk yönetimi dosyasıyla (ISO 14971 çıktıları) tutarlı olmalı, ama biz risk dosyasını yazmayız: onunla istatistiksel tutarlılığı sağlarız.
  • Clinical evidence gap'leri: Hangi iddianın kanıtı zayıf? Bu açıkça yazılır ve PMCF planına köprülenir. Gap'i gizlemek değil, yönetmek doğru olandır.

EU-MDR, EU AI Act ve PMCF köprüsü

EU-MDR altında CER "yaşayan bir belge"dir: PMS/PMCF verisiyle periyodik güncellenir. Sınıf III ve implant cihazlarda PSUR'a, daha düşük sınıflarda planlı güncelleme döngüsüne bağlanır. CER'in Stage 3'ünde işaretlenen her gap, PMCF planında bir veri toplama hedefine dönüşmelidir; aksi halde gap "açık ve yönetilmemiş" olarak kalır.

AI tabanlı bir tıbbi cihaz için ek bir katman daha var: EU AI Act, yüksek riskli AI sistemleri için 2 Ağustos 2026'dan itibaren uygulanmaya başlayan veri yönetişimi yükümlülükleri (Madde 10) getirir; eğitim/validasyon/test verisinin temsililiği ve bias değerlendirmesi, CER'in klinik veri tartışmasıyla tutarlı olmak zorundadır. Türkiye tarafında TİTCK'nın EU-MDR'ı birebir transpoze eden çerçevesi de CDSS/klinik karar destek yazılımından benzer bir standalone klinik validasyon kanıtı bekler. Tek bir tutarlı metodolojik anlatı, üç dosyayı (EU-MDR CER, TİTCK CDSS, FDA dossier) aynı kanıt çekirdeğinden besler.

Sık Yapılan Hatalar

  • Appraisal kriterlerini veriyi gördükten sonra tanımlamak: CEP'te önceden tanımlanmamış kabul-red eşikleri post-hoc sayılır; reviewer'ın ilk hedefidir. Kriterler ve scoring rubric en baştan yazılı olmalı.
  • Eşdeğer cihaz (equivalence) iddiasını kanıtlamadan kullanmak: EU-MDR equivalence için teknik, biyolojik ve klinik karakteristiklerin üçünde de gösterilmiş benzerlik ister; "benzer ürün" demek yetmez. Çoğu CER burada düşer.
  • State-of-the-art'ı atlamak veya literatür özeti sanmak: Annex XIV SoTA ile karşılaştırma ister. "İlgili yayınlar şunlardır" listesi SoTA değildir; kabul görmüş klinik performans çıtasının sayısal tanımıdır.
  • Tek bir performans rakamına yaslanmak: Güven aralıksız sensitivity/specificity, kalibrasyonsuz AUC, veya prevalanstan bağımsız sunulan PPV reviewer için yetersizdir. Belirsizliğin raporlanması zayıflık değil, metodolojik güçtür.

İlgili Yazılar

CER istatistik bölümü, bir formu doldurmak değil, klinik iddialarınızla mevcut kanıt arasındaki bağı tekrarlanabilir bir metodolojiyle kurmaktır. Notified body veya TİTCK reviewer'ı bu bölümün sağlamlığına bakar; appraisal şeması zayıfsa CER'in geri kalanı ne kadar düzgün biçimlenirse biçimlensin major bulgu alır. Bu çekirdeği isimli bir metodolog imzasıyla kurmak, dosyanızın en savunulabilir parçasını üretir.

Kapsam, süre ve bütçe her dosyada farklıdır; bunları ücretsiz scoping görüşmesinde netleştiririz. Hangi katmana ihtiyacınız olduğunu belirlemek için:

Ücretsiz Scoping Görüşmesi

Sıradaki adım

Projenizi konuşalım.

15 dakikalık ücretsiz tanışma görüşmesinde ihtiyacınızı dinler, hangi hizmet katmanına uyduğunu söyleriz.