RAG vs intent-based : pourquoi votre chatbot doit lire votre site

Si vous avez utilisé un chatbot avant 2023, vous avez probablement vécu cette frustration : poser une question, recevoir "Je n'ai pas compris", reformuler 3 fois, et finir par chercher vous-même sur le site. Ce bug d'expérience venait d'une limite architecturale fondamentale : les chatbots étaient construits sur des intents. Le RAG change tout.

Comment fonctionnait l'ancien : les chatbots "intent-based"

Un bot intent-based fonctionne en 3 étapes :

L'admin définit une liste d'intents : "demande de prix", "horaires d'ouverture", "annulation commande", etc.
Pour chaque intent, l'admin écrit 5-10 exemples de phrases qui le déclenchent ("Combien ça coûte ?", "Quel est votre tarif ?", "C'est gratuit ?")
L'admin écrit la réponse fixe associée à chaque intent

Quand un visiteur écrit, le bot calcule la similarité entre sa phrase et les intents définis. Si la similarité dépasse un seuil, il déclenche la réponse correspondante. Sinon, fallback : "Je n'ai pas compris".

Les 3 limites bloquantes

Maintenance énorme : si vous ajoutez une page sur votre site, vous devez créer un nouvel intent + des phrases d'exemple + une réponse. Pour un site avec 100 pages, c'est 1 mois de travail.
Couverture faible : à mesure que les intents s'accumulent, les frontières deviennent floues. La phrase "Vous fermez quand cet été ?" peut matcher "horaires", "vacances", "fermeture exceptionnelle"... ou aucun.
Réponses figées : les réponses sont écrites à l'avance, donc impossibles à adapter au contexte. "Bonjour, je viens de chez X, vous prenez ma carte vitale ?" → réponse pré-écrite "Voici nos horaires" 🤦

L'approche RAG : votre site EST la base de connaissances

RAG signifie Retrieval-Augmented Generation. C'est la combinaison de deux briques :

Brique 1 : Retrieval (recherche sémantique)

Au moment de l'installation, Omybox crawle votre site, découpe chaque page en "chunks" de quelques paragraphes, et calcule pour chaque chunk un vecteur d'embedding — une représentation mathématique du sens du texte (1024 dimensions).

Ces vecteurs sont stockés dans une base de données vectorielle (pgvector chez nous). Quand un visiteur pose une question, on calcule le vecteur de sa question et on récupère les 4-6 chunks les plus proches sémantiquement — pas par mots-clés, mais par sens.

Brique 2 : Generation (LLM)

Les chunks récupérés + la question du visiteur sont envoyés à un grand modèle de langage. Le LLM formule une réponse naturelle en s'appuyant strictement sur ces chunks. Si le contexte ne contient pas la réponse, il dit "Je ne sais pas" et propose une escalation.

Les 5 bénéfices concrets du RAG

Zéro maintenance. Vous modifiez une page → notre plugin synchronise → le bot est à jour. Pas d'intent à créer, pas de phrase d'exemple à écrire.
Couverture totale. Toutes les pages indexées sont accessibles à toutes les questions formulables. Aucune frontière entre topics.
Multi-langue automatique. Le LLM détecte la langue de la question et répond dans cette langue, même si votre site n'est qu'en français.
Compréhension contextuelle. Les phrases conversationnelles, les sous-entendus, les fautes d'orthographe : tout passe.
Hallucinations contrôlées. Le LLM est instruit dans son system prompt de ne répondre qu'à partir du contexte fourni. Si l'info n'y est pas, il dit "je ne sais pas". Pas d'invention.

Et les limites du RAG ?

Le RAG n'est pas magique. Trois cas où il déçoit :

Calculs et logique : un RAG ne fait pas de calculs ("Quel est le prix avec 2 adultes + 1 enfant ?"). Pour ça, il faut des "AI actions" qui appellent du code.
Données dynamiques : un RAG ne connaît pas votre stock en temps réel ni le statut d'une commande. Il faut des outils (function calling) qui interrogent vos APIs.
Tâches transactionnelles : créer une commande, modifier un compte. Là encore, AI actions.

Pour 80% des sites web (vitrine, blog, cabinet, association, e-commerce simple), le RAG seul suffit. Les AI actions arrivent dans la roadmap Omybox 2026 H2 pour couvrir les 20% restants.

Comment tester si le RAG vous convient ?

Le plus simple : essayer. Tapez l'URL de votre site sur notre page d'accueil et posez 5 questions auxquelles votre site répond normalement. Vous verrez immédiatement si la qualité des réponses correspond à vos besoins.

Aller plus loin : FAQ technique ou créez un compte gratuit pour tester sur votre vrai site.