- LLM - duży model językowy. Generuje tekst. Przykład: ChatGPT.
- Enkoder - program, który zamienia tekst na wektor liczb. Przykład: BERT.
- Embedding - wektor liczb, który reprezentuje tekst. Przykład: wektor reprezentujący słowo "pies".
- Prompt - tekst, który podajemy LLM, aby wygenerował tekst. Przykład: "Ile palców ma człowiek?"
- Prompt template - szablon z którego tworzony jest
Prompt
. Przykład: "Jesteś AI. Odpowiedz na pytanie: {pytanie}". W miejsce{pytanie}
wstawiamy pytanie. - Dokument - tekst wraz z metadanymi o nim np. skąd pochodzi.
- Chunk - fragment Dokumentu. Przykład: akapit.
- Parser - program lub kod przeznaczony do przetwarzania obiektów (np. stron internetowych) i tworzenia z nich Dokumentów.
- Retriever - program lub kod przeznaczony do wyszukiwania Dokumentów lub Chunków podobnych do Prompta (np. wyszukiwarka internetowa).