TLDR:

Temel model (foundation model), geniş, etiketlenmemiş veri üzerinde geniş ölçekte eğitilmiş ve çok çeşitli alt görevlere (fine-tuning veya prompt’lama yoluyla) uyarlanmak üzere tasarlanmış büyük bir yapay zeka modelidir. Terim 2021’de Stanford CRFM tarafından popülerleştirildi ve şimdi LLM’leri, görüntü/video üreticilerini, kod modellerini ve çok modlu sistemleri kapsar.

Temel Modeller vs. Dar Modeller

Geleneksel ML modelleri belirli görevler (duygu sınıflandırma, görüntü tanıma) için eğitilir. Temel modeller ise geniş veri üzerinde eğitilir ve minimum ek eğitim ile birçok göreve yeniden adapte edilebilir. GPT-5, Claude Opus, Gemini, Llama ve Mistral baskın genel amaçlı temel modellerdir; kod (Codex, Code Llama), görüntü (Stable Diffusion, DALL-E), ses (Whisper) ve biyoloji (AlphaFold, ESM) için özelleşmiş varyantlar mevcuttur.

İnşa Et vs. Satın Al Kararı

Temel modeli sıfırdan eğitmek, hesaplama ve veri altyapısında yüz milyonlarca dolar gerektirir. En büyük şirketler dışında pratik seçim, temel model API’lerini kullanmak (OpenAI, Anthropic, Google), açık kaynaklı temel modeli ince ayarlamak (Llama, Mistral) veya altta yatan modeli değiştirmeden davranışı özelleştirmek için arama-destekli üretim (RAG) kullanmak arasındadır. Her yaklaşımın farklı maliyet, gecikme, özelleştirme ve veri gizliliği etkileri vardır.

Düzenleyici Muamele

AB AI Act, “genel amaçlı yapay zeka” (GPAI) modelleri için özel yükümlülükler oluşturur: eğitim verisi şeffaflığı, telif hakkı uyum özetleri ve tanımlanmış hesaplama eşiklerinin üzerindeki “sistemik risk” modeller için ek güvenlik yükümlülükleri. ABD başkanlık kararnameleri ve sınır laboratuvarlarının gönüllü taahhütleri benzer açıklama ve red-teaming yükümlülüklerini dayatır. Temel modeller üzerine inşa eden kurucular, kullanım vakalarının aşağı akış yükümlülüklerini tetikleyip tetiklemediğini takip etmelidir.