Când oamenii spun „AI”, se gândesc la ChatGPT. ChatGPT e doar o piesă din puzzle. Un asistent AI care răspunde clienților tăi combină 3 elemente care lucrează împreună, și fiecare are un rol clar.
Dacă încă te întrebi ce este, de fapt, un chatbot AI, începe cu articolul Ce este un chatbot AI și cum poate ajuta afacerea ta. Aici intrăm direct în tehnologie.
Cele 3 ingrediente
1. Modelul de limbă (LLM). Partea de „ChatGPT”. E un model antrenat pe miliarde de cuvinte care a învățat să înțeleagă și să genereze text natural în zeci de limbi, inclusiv română. Modele cunoscute: GPT-4o de la OpenAI, Claude de la Anthropic. Toate marile produse AI pentru afaceri folosesc unul sau mai multe dintre ele.
2. Baza ta de cunoștințe. Informațiile despre afacerea ta. Site, PDF-uri (meniu, prețuri, condiții), fișiere Excel, text scris direct în dashboard. Asta diferențiază botul tău de un asistent generic care vorbește frumos dar nu știe nimic concret despre tine.
3. Sistemul de retrieval (RAG). Partea care leagă cele două. Numele tehnic e retrieval-augmented generation. Când un client întreabă ceva, sistemul caută în baza ta de cunoștințe informațiile relevante, le pune în fața modelului de limbă, iar acesta generează răspunsul folosind doar acele informații.
O metaforă simplă
Imaginează un coleg nou care lucrează pentru tine. Vorbește perfect româna, e politicos, răspunde calm. Dar nu știe absolut nimic despre afacerea ta în prima zi.
Lângă el e un dulap cu toate informațiile relevante: meniu, prețuri, condiții de rezervare, program, FAQ-uri vechi. Când vine o întrebare de la un client, colegul deschide dulapul, găsește informația potrivită, citește, și răspunde corect.
RAG e procesul prin care colegul „cere informația din dulap” și o folosește. Fără dulap, ai avea un coleg care vorbește frumos dar inventează tot ce zice.
Limita LLM-urilor pure
Modelele de limbă singure (LLM fără RAG) au două probleme practice:
- Nu cunosc informații specifice despre afacerea ta. Nu îți știu meniul, prețurile, programul, condițiile actuale.
- Au tendința să inventeze (în jargon: halucinează) când nu știu ceva. Și pot face asta cu un ton convingător, ceea ce e periculos.
RAG rezolvă ambele. Cum?
- Clientul scrie întrebarea. Exemplu: „Aveți rezervări sâmbătă seara?”.
- Sistemul caută în baza ta de cunoștințe chunk-urile relevante. Găsește, să zicem, program de funcționare, condiții pentru rezervare, capacitatea maximă pe seri de weekend.
- Aceste informații sunt date modelului LLM ca context.
- Modelul generează răspuns folosind doar acele informații. Nu inventează ce nu i s-a dat.
Conform IBM, asta reduce dramatic halucinațiile și permite citarea sursei pentru fiecare răspuns. McKinsey explică același principiu: RAG-ul „înrădăcinează” răspunsurile în informația ta concretă, nu în memoria generală a modelului.
Cum se construiește baza de cunoștințe
Un asistent AI învață de la tine în trei pași tehnici:
- Indexare. Tu dai surse (link la site, PDF-uri, Excel, text scris direct). Sistemul citește, împarte conținutul în chunk-uri logice (paragrafe, secțiuni), și le stochează într-o bază specială numită vector store.
- Embedding. Fiecare chunk e convertit într-un vector matematic care reprezintă „sensul” textului. Asta permite căutarea bazată pe sens: dacă întrebi „cât plătesc pentru livrare?”, sistemul găsește chunk-uri despre „costuri de transport”, chiar dacă nu folosesc cuvântul „livrare”.
- Retrieval la rulare. Când vine o întrebare reală, sistemul caută chunk-urile cele mai apropiate de întrebare ca sens, și le dă modelului LLM ca context pentru răspuns.
Tehnic, există mai mult de atât (reranking, query rewriting, hybrid search). Dar acelea sunt ideile principale și e suficient să le înțelegi la nivel conceptual.
Ce poate face, ce încă nu poate
Lucruri pe care un asistent AI modern le face bine:
- Răspunde la întrebări care se repetă, cu informații exacte din sursele tale
- Înțelege întrebări scrise prost gramatical, cu prescurtări, în argou („pls”, „k”, „mersi”)
- Lucrează în mai multe limbi simultan (română prioritar, engleză sau alte la nevoie)
- Răspunde sub 3 secunde, 24/7, fără pauză de masă
- Recunoaște când nu știe și transferă conversația la un coleg uman cu tot contextul
Lucruri pe care încă nu le face suficient de bine:
- Întrebări care necesită raționament complex pe mai mulți pași (cazuri excepționale)
- Decizii cu consecințe importante (rambursări mari, contracte personalizate, dispute)
- Empatie reală în situații emoționale grele (deces, divorț, criză)
- Integrări cu sisteme externe foarte vechi sau personalizate (ERP-uri custom)
Limitele astea se reduc lună de lună. Modele noi apar la fiecare 3-6 luni cu îmbunătățiri vizibile. Dar nu sunt zero încă, și e cinstit să știi asta înainte să cumperi.
Cum recunoști un asistent AI bun
Întrebări utile când evaluezi un produs:
- Cum „învață” botul din informațiile mele? (Cuvinte-cheie de auzit: bază de cunoștințe, knowledge base, RAG, vector store)
- Cât durează indexarea unui site sau PDF? (Sub 5 minute pentru documente normale)
- Botul citează sursele când răspunde? (Răspuns ideal: da)
- Ce se întâmplă dacă nu știe răspunsul? (Răspuns ideal: transferă cu context la om)
- Informațiile mele sunt folosite să antreneze modelul lor sau al furnizorilor AI? (Răspuns dorit: nu, niciodată)
Dacă nu primești răspunsuri clare la întrebările astea, mai întreabă. Sau caută alt furnizor. Pentru un argument concret de business, 5 motive să automatizezi conversațiile cu clienții are cifrele din 2025-2026.
Convia, pe scurt
Convia folosește exact arhitectura descrisă mai sus: modele AI premium de la OpenAI și Anthropic, bază de cunoștințe indexată din sursele tale, retrieval RAG la fiecare răspuns. Datele tale nu antrenează niciun model, nici al nostru, nici al furnizorilor AI cu care lucrăm. Indexarea unui site mediu durează 2-3 minute. Vezi detaliile complete pe pagina GDPR sau cum integrezi widget-ul pe site-ul tău în documentația tehnică.