Kısa Cevap
Bir medical-AI klinik-validasyon çalışmasının tek bir standart maliyeti veya süresi yoktur; ikisini de kapsam belirler. Maliyeti ve süreyi belirleyen başlıca sürücüler şunlardır: çalışma tipi (retrospektif standalone, prospektif veya çok-okuyuculu reader study), birincil son nokta ve buna bağlı örneklem/güç hesabı, referans standardın (ground truth) inşa zorluğu, tek-merkez mi çok-merkez mi olduğu, dış validasyon (external validation) gerekip gerekmediği ve hedeflenen regülatör (TİTCK, EU-MDR, FDA). Bunlara verinin hazır olma durumu ve etik kurul süresi eklenir. Bu yüzden doğru soru "ne kadar tutar" değil, "hangi kapsam bizim kullanım amacımız ve regülatör hedefimiz için gerekli minimum savunulabilir kanıttır" sorusudur. En pahalı çalışma, kapsamı yanlış kurulduğu için yeniden yapılmak zorunda kalan çalışmadır.
Serteser Danışmanlık, bir medical-AI tıbbi cihazı geliştirip hakemli uluslararası bir dergide yayınlamış bir biyomedikal mühendis (BME MSc) tarafından yürütülür. Cihazınızın kullanım amacına ve regülatör hedefine göre gereken minimum savunulabilir validasyon kapsamını netleştirir, çalışmayı buna göre tasarlar ve isimli metodolog olarak yürütür.
"Klinik validasyon ne kadar tutar, ne kadar sürer?" sorusu doğal ve haklıdır, ama tek bir sayıyla cevaplanamaz: çünkü maliyet de süre de çalışmanın kapsamından türer, ve kapsam cihazdan cihaza değişir. İki cihaz aynı doğruluğa sahip olabilir ama biri tek-merkez retrospektif bir çalışmayla, diğeri çok-merkez prospektif bir çalışmayla savunulabilir; arada hem maliyet hem takvim kat farkı vardır.
Bu yazı, rakam vermek yerine maliyeti ve süreyi gerçekten belirleyen sürücüleri açıklar; böylece kendi cihazınız için doğru beklentiyi ve doğru kapsamı kurabilirsiniz.
Maliyeti Belirleyen Sürücüler
Bir validasyon çalışmasının bütçesini birkaç temel karar belirler:
- Çalışma tipi: Retrospektif standalone performans çalışması (mevcut, etiketlenmiş veriyle) en ekonomik olandır. Prospektif veri toplama veya çok-okuyuculu reader study (MRMC), klinisyen iş akışı etkisini ölçmek gerektiğinde devreye girer ve maliyeti belirgin biçimde yükseltir.
- Örneklem büyüklüğü: "Elimizdeki tüm vakalar" değil, birincil son noktayı (örneğin AUC veya sabit eşikte sensitivite) hedeflenen kesinlikte tahmin edecek formel bir güç hesabı belirler. Çoğu zaman bağlayıcı olan toplam N değil, pozitif vaka (event) sayısıdır; nadir bulgularda gereken veri hacmi hızla büyür.
- Referans standart inşası: Ground truth ne kadar "sert" olursa (histopatoloji, takip sonucu veya çoklu-uzman konsensüsü) o kadar güçlü ama o kadar maliyetlidir. Konsensüs okumalarda okuyucu sayısı, uzlaşı kuralı ve gözlemciler-arası uyum ölçümü ek emek demektir.
- Merkez sayısı: Tek-merkez çalışma hızlı ve ucuzdur ama genellenebilirliği sınırlıdır. Çok-merkez tasarım, cihaz/üretici ve popülasyon çeşitliliğini yakalar ve dış geçerliliği güçlendirir, ama koordinasyon ve maliyet ekler.
- Dış validasyon (external validation): Ayrı bir merkez veya zaman diliminden gelen, modeli yeniden eğitmeden test eden bağımsız veri seti, regülatör dosyalarının asıl beklediği kanıttır. Gerekli olduğunda kapsamı ve maliyeti artırır, ama çoğu durumda pazarlık edilebilir değildir.
- Regülatör hedefi: TİTCK/EU-MDR ve FDA dosyalarının beklediği kanıt eşiği ve raporlama (TRIPOD-AI, STARD-AI, MDCG 2020-1 üç-bileşenli klinik değerlendirme) kapsamı şekillendirir.
Süreyi Belirleyen Sürücüler
Takvim çoğu zaman istatistikten değil, hazırlık ve süreçten kaynaklanır:
- Verinin hazır olma durumu: Veri zaten toplanmış, anonimleştirilmiş ve etiketlenmişse çalışma hızla ilerler. Ham, dağınık veya KVKK açısından henüz anonimleştirilmemiş veri, analizden önce haftalar-aylar süren bir kürasyon işi demektir.
- Etik kurul ve izinler: Prospektif veya tanımlı veri kullanımının gerektirdiği etik kurul onayı ve kurumsal izinler takvimin sabit bir parçasıdır.
- Referans standart adjudikasyonu: Çoklu-uzman okuması ve uyuşmazlık çözümü, takvimi uzatan ama kaliteyi belirleyen adımdır.
- Retrospektif mi, prospektif mi: Retrospektif çalışma var olan veriyle haftalar-aylar içinde sonuçlanabilirken, prospektif veri toplama hasta akışına bağlı olarak çok daha uzun sürer.
En Pahalı Çalışma, Yeniden Yapılmak Zorunda Kalandır
Maliyeti gerçekten patlatan şey, çoğu zaman çalışmanın kendisi değil, yanlış kurulduğu için tekrarlanmasıdır. Analiz planı veriden sonra yazılmış, model validasyon sırasında ayarlanmış (yani aslında geliştirme yapılmış), referans standart modelin etiketinden bağımsız değil ya da dış validasyon hiç tasarlanmamışsa, regülatör veya hakem çalışmayı reddeder ve baştan istemek zorunda kalır. Bu noktada hem para hem aylar iki kez harcanır.
Bu yüzden en ucuz validasyon, kapsamı baştan doğru kurulan validasyondur: önceden kilitlenmiş protokol, bağımsız referans standart ve kullanım amacına göre tanımlanmış gereken minimum kanıt. Cihazınız için bu minimum savunulabilir kapsamı netleştirmek üzere 15 dakikalık ücretsiz scoping talep edebilirsiniz.
Scoping Neyi Netleştirir?
Doğru bir kapsam görüşmesi, fiyat vermeden önce şu soruları yanıtlar: kullanım amacınız ve hedef sınıfınız ne; birincil son nokta hangi metrik olmalı; örneklem hesabı kaç pozitif vaka gerektiriyor; referans standart nasıl kurulacak; dış validasyon gerekli mi; ve hangi regülatör hedefine göre raporlanacak. Bu sorular netleştiğinde maliyet ve süre tahmin edilebilir hale gelir; netleşmeden verilen her rakam ya fazla ya eksiktir.
Sonuç: Önce Kapsam, Sonra Rakam
Klinik validasyonun maliyeti ve süresi, cihazınızın ne kadar iyi olduğuna değil, kullanım amacınızın gerektirdiği kanıtın kapsamına bağlıdır. Doğru sıra önce kapsamı kullanım amacı ve regülatör hedefine göre kurmak, sonra maliyet ve takvimi bunun üzerine koymaktır. Bu sırayı tersine çevirmek, yani önce bütçeyi sabitleyip kapsamı ona sığdırmaya çalışmak, çoğu reddedilen validasyon dosyasının başlangıç noktasıdır.