Terug naar blog
    ·6 min lezen

    Wat is RAG? Retrieval-Augmented Generation uitgelegd

    RAG combineert taalmodellen met jouw eigen kennisbank. Zo krijg je accurate, verifieerbare AI-antwoorden zonder hallucinaties.

    RAGAIArchitectuur
    Schematische illustratie van RAG: een AI-knooppunt verbonden met documenten en databases

    Wat is RAG?

    Retrieval-Augmented Generation (RAG) is een AI-architectuur waarbij een taalmodel eerst relevante informatie ophaalt uit een externe kennisbank voordat het een antwoord genereert. In plaats van te vertrouwen op de algemene trainingsdata van het model, wordt het antwoord onderbouwd door specifieke, vaak actuele bronnen.

    Hoe werkt RAG technisch?

    Een RAG-pipeline bestaat uit drie kernstappen:

    1. Indexeren — Documenten worden opgesplitst in chunks en omgezet naar vector-embeddings die in een vector database (zoals pgvector, Pinecone of Qdrant) worden opgeslagen.
    2. Retrieven — Bij een vraag wordt de query ook geëmbed en worden de meest relevante chunks opgehaald via similarity search.
    3. Genereren — Deze chunks worden als context meegegeven aan het taalmodel, dat op basis daarvan een antwoord formuleert.

    Wanneer kies je voor RAG?

    RAG is de juiste keuze als:

    • Je antwoorden wilt baseren op eigen documenten, beleid of wetgeving.
    • De informatie regelmatig verandert en niet in het basismodel zit.
    • Je bronverwijzingen wilt tonen bij elk antwoord.
    • Hallucinaties onacceptabel zijn (juridisch, medisch, financieel).

    RAG vs fine-tuning

    Fine-tuning past het model aan, RAG voedt het model met context. RAG is goedkoper, sneller te updaten en transparanter. Fine-tuning is beter voor consistente toon of zeer specifieke output-formats.

    Praktijkvoorbeeld: Huurrecht AI

    Onze Huurrecht AI gebruikt RAG om Nederlandse huurrechtwetgeving en jurisprudentie doorzoekbaar te maken. Elke vraag levert een onderbouwd antwoord op met directe verwijzingen naar wetsartikelen — geen verzonnen jurisprudentie.

    Conclusie

    RAG is de meest pragmatische manier om AI te koppelen aan je eigen kennis. Het is productie-klaar, kosteneffectief en geeft controle over wat het model wel en niet zegt. Wil je AI niet alleen kennis laten raadplegen, maar ook acties laten uitvoeren op live data? Lees dan verder over het Model Context Protocol (MCP), of bekijk vijf concrete AI use-cases voor het MKB. Veelgestelde vragen over onze aanpak vind je op de FAQ-pagina.