Jest to technika „ulepszania” dużych modeli językowych (AI), takich jak te używane w chatbotach. Działa na zasadzie „najpierw poszukaj, potem odpowiedz”.
Zanim AI wygeneruje odpowiedź, RAG pozwala jej przeszukać dodatkową, zewnętrzną bazę wiedzy (np. firmowe dokumenty, najnowsze wiadomości, specyfikacje produktów). Dopiero na podstawie znalezionych informacji tworzy odpowiedź.
To trochę tak, jakby uczeń przed odpowiedzią przy tablicy mógł szybko zerknąć do swoich notatek – dzięki temu jego odpowiedź jest bardziej precyzyjna, aktualna i oparta na faktach, a nie tylko na tym, co zapamiętał wcześniej.
Technika ta wykorzystuje embeddingi (czyli liczbowe reprezentacje tekstu, które oddają jego znaczenie) oraz bazy wektorowe (specjalne bazy danych do szybkiego wyszukiwania podobnych znaczeniowo fragmentów).
np.
– Ten nowy chatbot na infolinii ciągle podaje stare ceny naszych usług!
– Musimy go zaktualizować. Słyszałam o technologii RAG. Moglibyśmy podpiąć go pod naszą aktualną bazę produktów i sam by sobie sprawdzał ceny przed odpowiedzią!
Odmiany:
RAGowy, RAG-owe, model RAG, architektura RAG, pipeline RAG