RAG vs Fine-tuning — kiedy który wybrać? — DotFusion

# RAG — gdy wiedza się zmienia

Retrieval-Augmented Generation to podejście, w którym model nie jest uczony nowej wiedzy, ale dostaje ją dynamicznie w kontekście każdego zapytania. Retrievalujemy relevantne fragmenty z bazy wiedzy i pakujemy je do promptu.

Kiedy RAG wygrywa:

Baza wiedzy zmienia się często (dokumentacja, procedury, FAQ)
Potrzebujesz identyfikowalności — wiesz z jakiego źródła pochodzi odpowiedź
Budżet jest ograniczony — RAG można wdrożyć w tygodniu
Treści są poufne i nie chcesz ich wkładać do modelu na stałe

# Fine-tuning — gdy chodzi o styl i zachowanie

Fine-tuning zmienia sposób w jaki model odpowiada, nie co wie. Uczysz model nowego stylu, formatu, tonacji lub zestawu umiejętności.

Kiedy fine-tuning ma sens:

Chcesz żeby model mówił specyficznym żargonem branżowym
Odpowiedzi mają stały format (np. JSON z określoną strukturą)
Masz tysiące przykładów poprawnych odpowiedzi
Zależy Ci na redukcji kosztów przez krótsze prompty systemowe

# Pułapka kombinacji

Najgorsza decyzja: fine-tuning wiedzy domenowej. Modele zapominają fakty podczas fine-tuningu (catastrophic forgetting). Wyuczony fakt z sześciu miesięcy temu może być dziś nieaktualny a model nadal będzie go serwować z pełnym przekonaniem.

W praktyce większość projektów produkcyjnych to RAG. Fine-tuning trafia do wąskiego zastosowania gdzie chodzi wyłącznie o styl, format lub specjalistyczne umiejętności.

← Wróć do bloga Zacznij projekt →

RAG vs Fine-tuning — kiedy który wybrać?

RAG i fine-tuning to dwa różne narzędzia do tego samego celu. Mylenie ich kosztuje projekty miesiące pracy i tysiące dolarów. Tłumaczymy kiedy co ma sens.

# RAG — gdy wiedza się zmienia

# Fine-tuning — gdy chodzi o styl i zachowanie

# Pułapka kombinacji