Retrieval Augmented Generation (RAG): Halluzinationen in GenAI-Anwendungen Datenschutzkonform minimieren

Gerhard Kürner
3 min readOct 8, 2023
Gerhard Kürner CEO 506.ai über den Einsatz von First Party Data und AI

Die Welt der künstlichen Intelligenz erlebt mit dem Aufkommen großer Sprachmodelle (LLMs) wie ChatGPT von OpenAI und Claude von Anthropic eine Revolution. Diese Modelle sind faszinierend, aber nicht ohne Mängel. In diesem Blogbeitrag möchte ich die Herausforderungen aufzeigen, vor denen aktuelle LLMs stehen, und wie Retrieval Augmented Generation (RAG) der beste Weg ist, um diese Probleme zu lösen, Datenschutzsicherheit zu bieten und die Leistung von GenAI-Anwendungen mit Unternehmensdaten zu erweitern.

Die Grenzen aktueller LLMs

Große Sprachmodelle bringen trotz ihrer beeindruckenden Leistung einige gravierende Nachteile mit sich:

- Aktualitätsmangel: LLMs sind auf den Zeitpunkt ihres letzten Trainings “eingefroren” und können nicht auf aktuelle Informationen zugreifen.
- Fehlendes domänenspezifisches Wissen: Sie werden für allgemeine Aufgaben trainiert und kennen nicht die spezifischen Daten Ihres Unternehmens.
- Blackbox-Verhalten: Es ist schwierig zu verstehen, welche Quellen ein LLM bei der Erstellung seiner Antworten verwendet hat.
- Hohe Kosten und Ineffizienz: Die Entwicklung und Bereitstellung dieser Modelle erfordert erhebliche Ressourcen.

Diese Einschränkungen führen zu Genauigkeitsproblemen in GenAI-Anwendungen, insbesondere bei anspruchsvollen geschäftlichen Anforderungen.

Was ist Retrieval Augmented Generation (RAG)?

RAG ist eine Methode, die das Potential hat, die oben genannten Probleme zu lösen und die Leistung von GenAI-Anwendungen signifikant zu steigern.

Aktualität und domänenspezifisches Wissen

RAG ermöglicht es, aktuelle oder kontextspezifische Daten aus einer externen Datenbank abzurufen und einem LLM zur Verfügung zu stellen, wenn dieser aufgefordert wird, eine Antwort zu generieren. Es bietet eine Lösung für den Mangel an Aktualität und domänenspezifischem Wissen, indem es ermöglicht, firmeneigene Geschäftsdaten oder aktuelle Informationen über die Welt zu speichern und diese zum Zeitpunkt der Generierung abzurufen.

Verbesserte Überprüfbarkeit

RAG ermöglicht GenAI-Anwendungen, ihre Quellen anzugeben, ähnlich wie in wissenschaftlichen Arbeiten. Dies verbessert die Überprüfbarkeit und macht die inneren Abläufe von GenAI-Anwendungen transparenter.

Die wirtschaftliche Tragweite von RAG

Die Verbesserung der Leistung Ihrer GenAI-Anwendung kann durch verschiedene Ansätze erfolgen, darunter das Erstellen Ihres eigenen Basismodells, die Feinabstimmung eines vorhandenen Modells oder Prompt Engineering. RAG stellt sich jedoch als kosteneffektivste, leicht zu implementierende und risikoärmste Option dar.

Erstellung einer Vektordatenbank

RAG erfordert die Erstellung einer Vektordatenbank aus Ihren domänenspezifischen Daten. Ein Einbettungsmodell konvertiert Ihre Daten in Vektoren, die dann in einer Vektordatenbank gespeichert werden. Dies ermöglicht eine semantische Suche, um relevante Informationen basierend auf den Abfragen der Benutzer abzurufen.

Semantische Suche und RAG

Die Kombination von semantischer Suche und RAG ermöglicht es, relevanteren und zeitnahen Kontext abzurufen, wodurch LLMs genauere Antworten liefern können. Diese Methode reduziert die Wahrscheinlichkeit von Halluzinationen und ermöglicht die Erstellung von GenAI-Anwendungen, die genaue und kontextsensitive Antworten liefern.

Fazit
RAG bietet die beste Lösung für die Herausforderungen, mit denen KI-Anwendungen konfrontiert sind, und stellt den wichtigsten Schritt zur Verbesserung der Genauigkeit und Relevanz der von LLMs generierten Antworten dar. Es ermöglicht eine schnelle und sichere Integration in alltägliche Unternehmensprozesse und es können auch alle Datenschutzanforderungen erfüllt werden. In Kombination mit einer datenschutzfreundlichen KI-Lösung wie CompanyGPT kann jedes Unternehmen sofort auf seine eigenen Daten zugreifen.

--

--

Gerhard Kürner

CEO 506 - European CompanyGPT - Vice Chairman @AIupperaustria - Keynote Speaker