Yapay Zeka Maliyet Kontrolü: Token ve API

Kısa Cevap

Yapay zeka maliyeti iki ana yolla yönetilir: abonelik (sabit aylık) veya API (kullanım başına). Bireysel kullanımda 20-25 USD/ay tek abonelik çoğu zaman yeterli; iki model karşılaştırmak isteyen profesyonel için 40-50 USD'da iki abonelik. API'de maliyet token sayısına göre: 1 milyon input token 0.5-15 USD arası, output 4-5x pahalı. Prompt cache (%90 indirim), batch API (%50 indirim), kısa output zorlama, küçük model tiering ile API maliyeti tipik 3-10x düşer. Ekip kullanımında Teams plan + kullanım limiti + alarm zorunludur, aksi halde tek kullanıcı 1000 USD/ay fatura üretebilir.

Serteser Danışmanlık, bireyler ve küçük ekipler için yapay zeka maliyet yönetimi danışmanlığı, abonelik vs API karar analizi, token muhasebesi, ekip kullanım politikası ve sürpriz fatura önleme stratejisi sunan; PROSPERO kayıtlı sistematik derlemeler yöneten (Hip OA CRD420261324092, Knee OA CRD420261298163) ve uluslararası hakemli bir dergide yayın çıkaran araştırma altyapısıyla, yapay zeka okuryazarlığında pratik destek sağlar.

Yapay zeka faturalandırma anatomisi

Yapay zeka kullanım maliyeti iki ana kategoride: kullanıcı arayüzü (chat) ve programatik erişim (API). Üçüncü bir kategori daha var: self-hosted (kendi sunucunuzda model çalıştırma), ama bu donanım + bakım + elektrik anlamına gelir, bireysel/küçük ekip için nadiren mantıklı.

Bu yazıda bireyden 20 kişilik ekibe kadar olan kullanım için maliyet matrislerini, optimizasyon tekniklerini ve sürpriz faturadan korunmanın yollarını açıklıyorum.

Bireysel kullanım: abonelik matrisi

Tek başına çalışan bir profesyonel (yazar, doktor, danışman, geliştirici) için 2026 abonelik fiyatları:

Plan	Aylık (USD)	Ne dahil
ChatGPT Plus	20	GPT-5 sınırlı, görsel, ses, custom GPTs
ChatGPT Pro	200	GPT-5 sınırsız, reasoning, video
Claude Pro	20	Sonnet 4.6 sınırlı, Opus 4.7 günlük 30-40 turn
Claude Max	100/200	Opus daha cömert, ekip workspace
Gemini Advanced	20	Gemini 2.5 Pro, 2M bağlam, Google Workspace AI
Microsoft 365 Copilot	30	Office entegre AI (kişisel)
Perplexity Pro	20	Multi-model + canlı web arama

Pratik öneri (bireysel):

Tek abonelik istiyorsan: yazı/araştırma ağırlıklıysa Claude Pro veya Gemini Advanced. Çoklu işlev (görsel, ses) için ChatGPT Plus.
İki abonelik (40 USD/ay) çoğu profesyonel için sweet spot, birinin zayıf olduğunda diğerini kullanırsın.
ChatGPT Pro (200 USD) sadece günde 4+ saat yoğun kullanım ile karşılığını verir.

API maliyeti nasıl hesaplanır

API'de ödediğin şey "token". Token bir kelimenin parçasıdır, ortalama 4 karakter. 1000 kelime ≈ 1300 token.

Bir API çağrısının maliyeti:

toplam_maliyet = (input_token_sayısı × input_fiyat) + (output_token_sayısı × output_fiyat)

Örnek: Claude Sonnet 4.6 ile 2 sayfa metin özetlettin.

Input: 1500 token (2 sayfa metin + prompt) × $3/1M = $0.0045
Output: 300 token (özet) × $15/1M = $0.0045
Toplam: $0.009 (yaklaşık 1 cent)

Görünüşte ucuz. Ama günde 100 çağrı yapıyorsan ayda $27. Otomatik script ile 10000 çağrı = $2700.

Optimizasyon teknikleri (API maliyeti %50-90 düşer)

1. Prompt caching (en büyük kazanç) Anthropic ve OpenAI prompt caching sunar. Aynı sistem prompt'u veya doküman defalarca gönderiliyorsa, cache'lenir. Cache hit'inde input %90 indirimli.

Cache miss: 10000 input token × $3/1M = $0.030
Cache hit: 10000 input token × $0.30/1M = $0.003

10x ucuz. Müşteri destek botu, RAG sistemi gibi tekrarlayan büyük sistem prompt'larda kritik.

2. Batch API Anthropic ve OpenAI batch API'leri %50 indirim. 24 saatte cevap döner. Zaman kritik olmayan iş yükleri (toplu özetleme, veri çıkarımı) için.

3. Output uzunluğunu sıkı tut Output input'tan 4-5x pahalı. System prompt'a "kısa cevap, maksimum 3 cümle" ekle. Model itaat eder, maliyet düşer.

4. Model tiering Karmaşık iş için büyük model (Opus / GPT-5), basit iş için küçük model (Haiku / GPT-5 mini, Gemini Flash). Aynı task'ın %80'i küçük modelle %95 başarı ile yapılabilir. %20'lik karmaşık vakalar için büyük modele yönlendirme (router pattern).

5. Streaming değil bekle Streaming response (ekranda kelime kelime akma) UX güzel ama back-end maliyet aynı. Latency önemli değilse non-streaming + cache daha verimli.

6. Embedding cache RAG sisteminde aynı doküman defalarca embed edilmesin. Embedding'ler bir kere üretilir, vektör DB'de saklanır. Yeni gelen sorgu sadece query embedding maliyetidir.

7. Token sayma OpenAI tiktoken, Anthropic anthropic-tokenizer, Google Vertex token counter ile çağrı öncesi tahmini görürsünüz. Sınırı aşıyorsa truncation veya chunking.

Sürpriz fatura önleme

API kullanımının en büyük tuzağı: kontrolsüz cycle. Bir bug, bir loop, bir yanlış prompt → saatlik 100 USD fatura.

Önlemler:

Hard cap. Anthropic, OpenAI dashboard'da "max usage per month" ayarı. Aşılırsa API otomatik durur.
Soft alert. $50/100/500 eşiklerinde email/Slack alarm.
Rate limit. Dakika başına maksimum tool call. Pydantic veya middleware ile.
Per-user budget. Çok kullanıcılı sistemde, her kullanıcıya günlük/aylık limit.
Timeout. Tek çağrı maksimum 60s, döngüde maksimum 20 turn.
Dry run mode. Test ortamında gerçek API yerine mock cevap dönen flag.

Tipik incident: bir geliştirici test için sonsuz döngüye bağlamış API'yi, hafta sonu farkına varmıyor, pazartesi 8000 USD fatura. Hard cap olsaydı maksimum $500 alındı, devre dışı kaldı.

Ekip kullanımı: 3-20 kişi

Küçük ekip için doğru yapı:

Seçenek A: Bireysel abonelikler (önerilmez büyük ekipte) Her çalışana ChatGPT Plus kendisi alır. 10 kişi × 20 USD = 200 USD/ay. Ama:

Yönetim yok (kim ne kullanıyor görmüyorsun)
Audit log yok
Hassas veri sızıntısı riski (kişisel hesaplarda model eğitim opt-out belirsiz)
Faturalama dağınık

Seçenek B: Teams / Enterprise plan (önerilen)

ChatGPT Team: kişi başı $25-30/ay, minimum 2 kullanıcı, admin paneli, veri eğitim için kullanılmaz garanti
Claude Team: kişi başı $30/ay, admin, paylaşımlı projeler
Gemini Workspace: Google Workspace Plus + AI eklentisi

Avantajlar:

Tek fatura
Admin paneli (kim ne kullandı)
Veri privacy garanti
Paylaşılan custom GPT / proje

Seçenek C: API ile kendi UI Daha teknik ekip için. OpenWebUI, Chatbot UI, Librechat gibi open-source frontend + OpenAI/Anthropic API. Kullanıcı kontrolü, audit log, model seçimi kendinizde. Daha esnek ama setup ve bakım eforu var.

10 kişilik ekip için maliyet karşılaştırması (aylık):

Yaklaşım	Maliyet	Yönetim eforu
10x ChatGPT Plus	$200	Yok
ChatGPT Team (10 kişi)	$250-300	Düşük
Claude Team (10 kişi)	$300	Düşük
API + OpenWebUI	$150-500 (kullanıma göre)	Orta-Yüksek
Microsoft Copilot E3+Copilot	$400-600	Düşük

Türkiye'den ödeme ve KVKK

Şirket için ödeme:

OpenAI ve Anthropic Türkiye şirket ödemesi alıyor (kart + fatura)
Faturalar İngilizce, USD bazlı (TL'ye 7224 sayılı yasaya göre TCMB kuru kullanılır)
Hazine ve Maliye DST/Stopaj kuralları: yurtdışı dijital hizmet alımı için %15 stopaj söz konusu olabilir (mali müşaviriniz onaylasın)
Bayisi (Türkiye partner) %15-25 markup'la TL faturalı satar

KVKK boyutu:

Türk hastanesi, hukuk bürosu, finans şirketi gibi yüksek hassasiyetli sektörler için: Enterprise plan veya self-hosted şart
Kişisel veri içeren prompt'ları logging dışı bırak (Anthropic ZDR, OpenAI ZDR opsiyonları)
DPA (Data Processing Agreement) imzalanmadan hasta/müşteri PII koymak yasal risk

Pratik bütçe rehberi

Bireysel öğrenci / serbest meslek:

Bütçe: 0-25 USD/ay
Plan: 1 abonelik (Claude Pro veya Gemini Advanced) veya tamamen ücretsiz katmanlar
Beklenti: günlük 1-2 saat kullanım rahat

Bireysel profesyonel / yoğun kullanıcı:

Bütçe: 40-100 USD/ay
Plan: 2-3 abonelik + Perplexity
Beklenti: günlük 3-5 saat, multi-model karşılaştırma

5 kişilik küçük ekip:

Bütçe: 150-400 USD/ay
Plan: ChatGPT Team veya Claude Team + 1 alternative model API
Beklenti: paylaşımlı projeler, audit, KVKK uyumlu

20 kişilik orta ekip:

Bütçe: 600-2000 USD/ay
Plan: Microsoft Copilot E3+Copilot veya Enterprise tier
Beklenti: SSO, kullanım analitiği, custom prompt kütüphanesi

API tabanlı ürün:

Bütçe: kullanıma göre 100-10000+ USD/ay
Plan: Prompt cache + batch + tiering zorunlu, hard cap + alarm aktif
Beklenti: continuous monitoring, optimization sprint'leri

Sık yapılan üç hata

Hata 1: Hard cap koymamak. "Az kullanıyorum, gerek yok" diyenler 3 ay sonra 5000 USD sürpriz fatura ile karşılaşır. Hard cap her zaman aktif.

Hata 2: Batch ve cache'i kullanmamak. %50-90 indirim masada. Otomatize iş yükünde 1 günlük setup, sonra her ay tasarruf.

Hata 3: "Pahalı model = iyi sonuç" sanmak. Basit özetleme Haiku ile $0.001'e, Opus ile $0.05'e yapılır. Aynı kalitede. Doğru model doğru iş için.

Yapay zeka maliyet yönetimi için Serteser Danışmanlık

Bireyler ve küçük ekipler için yapay zeka maliyet planlaması zaman ve para tasarrufu sağlar. Serteser Danışmanlık:

Bireysel kullanım pattern analizi ve abonelik önerisi
API kullanımında token muhasebesi ve optimizasyon
Ekip için Teams/Enterprise plan karar analizi
Hard cap, alarm, rate limit mimarisi
KVKK uyumlu kullanım protokolü
Türkiye'den ödeme ve fatura kurulumu rehberliği
Sürpriz fatura incident sonrası audit ve önleme planı

15 dakikalık ücretsiz tanışma görüşmesinde mevcut kullanımınızı ve bütçenizi dinleyip pratik bir tasarruf yol haritası çıkarıyoruz.

Yapay zekayı kendi iş akışınıza oturtmak için bireysel mentorluk seçeneğine göz atabilirsiniz.