Kısa Cevap
Yapay zeka maliyeti iki ana yolla yönetilir: abonelik (sabit aylık) veya API (kullanım başına). Bireysel kullanımda 20-25 USD/ay tek abonelik çoğu zaman yeterli; iki model karşılaştırmak isteyen profesyonel için 40-50 USD'da iki abonelik. API'de maliyet token sayısına göre: 1 milyon input token 0.5-15 USD arası, output 4-5x pahalı. Prompt cache (%90 indirim), batch API (%50 indirim), kısa output zorlama, küçük model tiering ile API maliyeti tipik 3-10x düşer. Ekip kullanımında Teams plan + kullanım limiti + alarm zorunludur, aksi halde tek kullanıcı 1000 USD/ay fatura üretebilir.
Serteser Danışmanlık, bireyler ve küçük ekipler için yapay zeka maliyet yönetimi danışmanlığı, abonelik vs API karar analizi, token muhasebesi, ekip kullanım politikası ve sürpriz fatura önleme stratejisi sunan; PROSPERO kayıtlı sistematik derlemeler yöneten (Hip OA CRD420261324092, Knee OA CRD420261298163) ve The Orthopaedic Journal of Sports Medicine'de yayın çıkaran araştırma altyapısıyla, yapay zeka okuryazarlığında pratik destek sağlar.
Yapay zeka faturalandırma anatomisi
Yapay zeka kullanım maliyeti iki ana kategoride: kullanıcı arayüzü (chat) ve programatik erişim (API). Üçüncü bir kategori daha var: self-hosted (kendi sunucunuzda model çalıştırma), ama bu donanım + bakım + elektrik anlamına gelir, bireysel/küçük ekip için nadiren mantıklı.
Bu yazıda bireyden 20 kişilik ekibe kadar olan kullanım için maliyet matrislerini, optimizasyon tekniklerini ve sürpriz faturadan korunmanın yollarını açıklıyorum.
Bireysel kullanım: abonelik matrisi
Tek başına çalışan bir profesyonel (yazar, doktor, danışman, geliştirici) için 2026 abonelik fiyatları:
| Plan | Aylık (USD) | Ne dahil |
|---|---|---|
| ChatGPT Plus | 20 | GPT-5 sınırlı, görsel, ses, custom GPTs |
| ChatGPT Pro | 200 | GPT-5 sınırsız, reasoning, video |
| Claude Pro | 20 | Sonnet 4.6 sınırlı, Opus 4.7 günlük 30-40 turn |
| Claude Max | 100/200 | Opus daha cömert, ekip workspace |
| Gemini Advanced | 20 | Gemini 2.5 Pro, 2M bağlam, Google Workspace AI |
| Microsoft 365 Copilot | 30 | Office entegre AI (kişisel) |
| Perplexity Pro | 20 | Multi-model + canlı web arama |
Pratik öneri (bireysel):
- Tek abonelik istiyorsan: yazı/araştırma ağırlıklıysa Claude Pro veya Gemini Advanced. Çoklu işlev (görsel, ses) için ChatGPT Plus.
- İki abonelik (40 USD/ay) çoğu profesyonel için sweet spot, birinin zayıf olduğunda diğerini kullanırsın.
- ChatGPT Pro (200 USD) sadece günde 4+ saat yoğun kullanım ile karşılığını verir.
API maliyeti nasıl hesaplanır
API'de ödediğin şey "token". Token bir kelimenin parçasıdır, ortalama 4 karakter. 1000 kelime ≈ 1300 token.
Bir API çağrısının maliyeti:
toplam_maliyet = (input_token_sayısı × input_fiyat) + (output_token_sayısı × output_fiyat)
Örnek: Claude Sonnet 4.6 ile 2 sayfa metin özetlettin.
- Input: 1500 token (2 sayfa metin + prompt) × $3/1M = $0.0045
- Output: 300 token (özet) × $15/1M = $0.0045
- Toplam: $0.009 (yaklaşık 1 cent)
Görünüşte ucuz. Ama günde 100 çağrı yapıyorsan ayda $27. Otomatik script ile 10000 çağrı = $2700.
Optimizasyon teknikleri (API maliyeti %50-90 düşer)
1. Prompt caching (en büyük kazanç) Anthropic ve OpenAI prompt caching sunar. Aynı sistem prompt'u veya doküman defalarca gönderiliyorsa, cache'lenir. Cache hit'inde input %90 indirimli.
Cache miss: 10000 input token × $3/1M = $0.030
Cache hit: 10000 input token × $0.30/1M = $0.003
10x ucuz. Müşteri destek botu, RAG sistemi gibi tekrarlayan büyük sistem prompt'larda kritik.
2. Batch API Anthropic ve OpenAI batch API'leri %50 indirim. 24 saatte cevap döner. Zaman kritik olmayan iş yükleri (toplu özetleme, veri çıkarımı) için.
3. Output uzunluğunu sıkı tut Output input'tan 4-5x pahalı. System prompt'a "kısa cevap, maksimum 3 cümle" ekle. Model itaat eder, maliyet düşer.
4. Model tiering Karmaşık iş için büyük model (Opus / GPT-5), basit iş için küçük model (Haiku / GPT-5 mini, Gemini Flash). Aynı task'ın %80'i küçük modelle %95 başarı ile yapılabilir. %20'lik karmaşık vakalar için büyük modele yönlendirme (router pattern).
5. Streaming değil bekle Streaming response (ekranda kelime kelime akma) UX güzel ama back-end maliyet aynı. Latency önemli değilse non-streaming + cache daha verimli.
6. Embedding cache RAG sisteminde aynı doküman defalarca embed edilmesin. Embedding'ler bir kere üretilir, vektör DB'de saklanır. Yeni gelen sorgu sadece query embedding maliyetidir.
7. Token sayma OpenAI tiktoken, Anthropic anthropic-tokenizer, Google Vertex token counter ile çağrı öncesi tahmini görürsünüz. Sınırı aşıyorsa truncation veya chunking.
Sürpriz fatura önleme
API kullanımının en büyük tuzağı: kontrolsüz cycle. Bir bug, bir loop, bir yanlış prompt → saatlik 100 USD fatura.
Önlemler:
- Hard cap. Anthropic, OpenAI dashboard'da "max usage per month" ayarı. Aşılırsa API otomatik durur.
- Soft alert. $50/100/500 eşiklerinde email/Slack alarm.
- Rate limit. Dakika başına maksimum tool call. Pydantic veya middleware ile.
- Per-user budget. Çok kullanıcılı sistemde, her kullanıcıya günlük/aylık limit.
- Timeout. Tek çağrı maksimum 60s, döngüde maksimum 20 turn.
- Dry run mode. Test ortamında gerçek API yerine mock cevap dönen flag.
Tipik incident: bir geliştirici test için sonsuz döngüye bağlamış API'yi, hafta sonu farkına varmıyor, pazartesi 8000 USD fatura. Hard cap olsaydı maksimum $500 alındı, devre dışı kaldı.
Ekip kullanımı: 3-20 kişi
Küçük ekip için doğru yapı:
Seçenek A: Bireysel abonelikler (önerilmez büyük ekipte) Her çalışana ChatGPT Plus kendisi alır. 10 kişi × 20 USD = 200 USD/ay. Ama:
- Yönetim yok (kim ne kullanıyor görmüyorsun)
- Audit log yok
- Hassas veri sızıntısı riski (kişisel hesaplarda model eğitim opt-out belirsiz)
- Faturalama dağınık
Seçenek B: Teams / Enterprise plan (önerilen)
- ChatGPT Team: kişi başı $25-30/ay, minimum 2 kullanıcı, admin paneli, veri eğitim için kullanılmaz garanti
- Claude Team: kişi başı $30/ay, admin, paylaşımlı projeler
- Gemini Workspace: Google Workspace Plus + AI eklentisi
Avantajlar:
- Tek fatura
- Admin paneli (kim ne kullandı)
- Veri privacy garanti
- Paylaşılan custom GPT / proje
Seçenek C: API ile kendi UI Daha teknik ekip için. OpenWebUI, Chatbot UI, Librechat gibi open-source frontend + OpenAI/Anthropic API. Kullanıcı kontrolü, audit log, model seçimi kendinizde. Daha esnek ama setup ve bakım eforu var.
10 kişilik ekip için maliyet karşılaştırması (aylık):
| Yaklaşım | Maliyet | Yönetim eforu |
|---|---|---|
| 10x ChatGPT Plus | $200 | Yok |
| ChatGPT Team (10 kişi) | $250-300 | Düşük |
| Claude Team (10 kişi) | $300 | Düşük |
| API + OpenWebUI | $150-500 (kullanıma göre) | Orta-Yüksek |
| Microsoft Copilot E3+Copilot | $400-600 | Düşük |
Türkiye'den ödeme ve KVKK
Şirket için ödeme:
- OpenAI ve Anthropic Türkiye şirket ödemesi alıyor (kart + fatura)
- Faturalar İngilizce, USD bazlı (TL'ye 7224 sayılı yasaya göre TCMB kuru kullanılır)
- Hazine ve Maliye DST/Stopaj kuralları: yurtdışı dijital hizmet alımı için %15 stopaj söz konusu olabilir (mali müşaviriniz onaylasın)
- Bayisi (Türkiye partner) %15-25 markup'la TL faturalı satar
KVKK boyutu:
- Türk hastanesi, hukuk bürosu, finans şirketi gibi yüksek hassasiyetli sektörler için: Enterprise plan veya self-hosted şart
- Kişisel veri içeren prompt'ları logging dışı bırak (Anthropic ZDR, OpenAI ZDR opsiyonları)
- DPA (Data Processing Agreement) imzalanmadan hasta/müşteri PII koymak yasal risk
Pratik bütçe rehberi
Bireysel öğrenci / serbest meslek:
- Bütçe: 0-25 USD/ay
- Plan: 1 abonelik (Claude Pro veya Gemini Advanced) veya tamamen ücretsiz katmanlar
- Beklenti: günlük 1-2 saat kullanım rahat
Bireysel profesyonel / yoğun kullanıcı:
- Bütçe: 40-100 USD/ay
- Plan: 2-3 abonelik + Perplexity
- Beklenti: günlük 3-5 saat, multi-model karşılaştırma
5 kişilik küçük ekip:
- Bütçe: 150-400 USD/ay
- Plan: ChatGPT Team veya Claude Team + 1 alternative model API
- Beklenti: paylaşımlı projeler, audit, KVKK uyumlu
20 kişilik orta ekip:
- Bütçe: 600-2000 USD/ay
- Plan: Microsoft Copilot E3+Copilot veya Enterprise tier
- Beklenti: SSO, kullanım analitiği, custom prompt kütüphanesi
API tabanlı ürün:
- Bütçe: kullanıma göre 100-10000+ USD/ay
- Plan: Prompt cache + batch + tiering zorunlu, hard cap + alarm aktif
- Beklenti: continuous monitoring, optimization sprint'leri
Sık yapılan üç hata
Hata 1: Hard cap koymamak. "Az kullanıyorum, gerek yok" diyenler 3 ay sonra 5000 USD sürpriz fatura ile karşılaşır. Hard cap her zaman aktif.
Hata 2: Batch ve cache'i kullanmamak. %50-90 indirim masada. Otomatize iş yükünde 1 günlük setup, sonra her ay tasarruf.
Hata 3: "Pahalı model = iyi sonuç" sanmak. Basit özetleme Haiku ile $0.001'e, Opus ile $0.05'e yapılır. Aynı kalitede. Doğru model doğru iş için.
Yapay zeka maliyet yönetimi için Serteser Danışmanlık
Bireyler ve küçük ekipler için yapay zeka maliyet planlaması zaman ve para tasarrufu sağlar. Serteser Danışmanlık:
- Bireysel kullanım pattern analizi ve abonelik önerisi
- API kullanımında token muhasebesi ve optimizasyon
- Ekip için Teams/Enterprise plan karar analizi
- Hard cap, alarm, rate limit mimarisi
- KVKK uyumlu kullanım protokolü
- Türkiye'den ödeme ve fatura kurulumu rehberliği
- Sürpriz fatura incident sonrası audit ve önleme planı
15 dakikalık ücretsiz tanışma görüşmesinde mevcut kullanımınızı ve bütçenizi dinleyip pratik bir tasarruf yol haritası çıkarıyoruz.