# RAG — gdy wiedza się zmienia
Retrieval-Augmented Generation to podejście, w którym model nie jest uczony nowej wiedzy, ale dostaje ją dynamicznie w kontekście każdego zapytania. Retrievalujemy relevantne fragmenty z bazy wiedzy i pakujemy je do promptu.
Kiedy RAG wygrywa:
- Baza wiedzy zmienia się często (dokumentacja, procedury, FAQ)
- Potrzebujesz identyfikowalności — wiesz z jakiego źródła pochodzi odpowiedź
- Budżet jest ograniczony — RAG można wdrożyć w tygodniu
- Treści są poufne i nie chcesz ich wkładać do modelu na stałe
# Fine-tuning — gdy chodzi o styl i zachowanie
Fine-tuning zmienia sposób w jaki model odpowiada, nie co wie. Uczysz model nowego stylu, formatu, tonacji lub zestawu umiejętności.
Kiedy fine-tuning ma sens:
- Chcesz żeby model mówił specyficznym żargonem branżowym
- Odpowiedzi mają stały format (np. JSON z określoną strukturą)
- Masz tysiące przykładów poprawnych odpowiedzi
- Zależy Ci na redukcji kosztów przez krótsze prompty systemowe
# Pułapka kombinacji
Najgorsza decyzja: fine-tuning wiedzy domenowej. Modele zapominają fakty podczas fine-tuningu (catastrophic forgetting). Wyuczony fakt z sześciu miesięcy temu może być dziś nieaktualny a model nadal będzie go serwować z pełnym przekonaniem.
W praktyce większość projektów produkcyjnych to RAG. Fine-tuning trafia do wąskiego zastosowania gdzie chodzi wyłącznie o styl, format lub specjalistyczne umiejętności.