Gömme (Embedding)

TLDR:

Embedding (gömme), verinin—metin, görüntü, ses, kod—anlamsal anlamı sürekli sayısal uzayda yakalayan yoğun vektör temsilidir. Embedding’ler modern yapay zekanın temelidir: anlamsal aramayı, önerileri, kümelemeyi mümkün kılar ve LLM’lere ve diğer alt akış modellerine girdi olarak hizmet eder.

Embedding’ler Nasıl Çalışır

Bir embedding modeli (örn. OpenAI text-embedding-3, Cohere Embed, Voyage AI, sentence-transformers gibi açık kaynak modeller) girdi verisini alır ve sabit uzunlukta bir vektör üretir—tipik olarak 384 ila 3.072 boyut. Anlamsal olarak benzer girdiler embedding uzayında birbirine yakın vektörler üretir; bu, kosinüs benzerliği veya Öklid mesafesiyle ölçülür. İlişkiler büyük veri kümeleri üzerinde model eğitimi sırasında öğrenilir.

Kullanım Alanları

Embedding’ler birçok üretim yapay zeka uygulamasını destekler: anlamsal arama (anahtar kelimeler yerine anlamla belge bulma), öneri sistemleri (kullanıcı tercihlerine benzer öğeleri bulma), kümeleme ve sınıflandırma (benzer öğeleri grupla), tekilleştirme (yakın çift içeriği bulma) ve RAG hatlarına ve alt akış ML modellerine girdi olarak. Bunlar temel altyapıdır—neredeyse her üretim yapay zeka sistemi yığının bir yerinde embedding kullanır.

Embedding Modeli Seçimi

Seçim kriterleri şunlardır: anlamsal kalite (MTEB gibi karşılaştırmalarda ölçülen), boyutluluk (daha yüksek boyutlar daha fazla nüans yakalayabilir ancak depolama ve hesaplama maliyetli), alan uzmanlığı (genel amaçlı vs. hukuk/tıp/kod uzmanı modeller), desteklenen diller (çok dilli yetenek) ve fiyatlandırma/lisanslama. Birçok üretim ekibi farklı içerik türleri için birden çok embedding modeli sürdürür ve modeller önemli ölçüde geliştiğinde periyodik olarak yeniden embedding yapar.

Referanslar

RAG ve arama ürünlerinde pratik kural: embedding indeksi, kaynak dokümanların başka biçimdeki kopyasıdır — erişim kontrolleri kaynakla eşit kurulmalı, kaynak silindiğinde vektörler ve indeks kayıtları da silinmeli (KVKK/GDPR silme yükümlülüğü) ve yönetilen vektör servisleri yurt dışındaysa 2024 standart sözleşme rejimi kapsamında aktarım evrakı tamamlanmalıdır.

TLDR:

Embedding’ler Nasıl Çalışır

Kullanım Alanları

Embedding Modeli Seçimi

Referanslar

İlgili terimler