Przejdź do treści
KOWiR

Definicja

Embeddings

Embeddings to liczbowa reprezentacja słów lub dokumentów. AI rozumie podobieństwo tekstów porównując ich embeddings. Klucz do wyszukiwania semantycznego i RAG.

Pełna definicja

Embeddings (zanurzenia) to wektory liczbowe — zwykle 384 do 3072 liczb — reprezentujące znaczenie słowa, zdania albo całego dokumentu. Dwa teksty o podobnym sensie mają podobne embeddings (matematycznie: mała "odległość" w przestrzeni wielowymiarowej). To kluczowy mechanizm współczesnego AI.

Po co Ci to wiedzieć? Embeddings są podstawą wyszukiwania semantycznego i RAG (retrieval-augmented generation). Konkretnie: zamiast szukać dokumentów po dokładnym słowie ("faktura"), wyszukujesz po znaczeniu ("dokument księgowy o wartości zakupu"). Notion, Slack, Google Drive, Microsoft 365 — wszystkie mają już wyszukiwanie embedding-based.

Praktyczne zastosowanie w polskiej JDG: zbudowanie własnej bazy wiedzy (np. szablony pism do US, instrukcje wewnętrzne, dokumentacja produktu) i wyszukiwanie semantyczne. Wpisujesz "jak odpowiedzieć na wezwanie z US o wyjaśnienie" — system znajduje najbliższe szablony, nawet jeśli nie zawierają tych słów dokładnie. Setup: 2-3h z n8n + OpenAI Embeddings API.

Cena: OpenAI text-embedding-3-small ≈ 0,02 USD za milion tokenów (bardzo tanio). Local alternatywy: Sentence-Transformers (gratis, działa offline). Większość polskich firm zacznie od OpenAI — jakość polskiego embeddings jest już bardzo dobra.

Przykład z polskiego życia

Firma consultingowa zbudowała wewnętrzny "Slack-bot": pracownik pisze "jak rozliczamy delegacje?", bot przeszukuje 400 dokumentów wewnętrznych embeddingami i zwraca 3 najtrafniejsze fragmenty + link do oryginału. Setup: 1 weekend, koszt utrzymania 5 USD/mc. Czas pracownika na znalezienie odpowiedzi: spadł z 15 minut do 30 sekund.

Powiązane pojęcia

Czy ta definicja Ci pomogła? Zostaw nam znać, czego brakuje: biuro@kowir.pl. Słownik rośnie razem z Wami.