Glossar

Browser-Plugin: Plug-ins sind Erweiterungen für Anwendungen, Computerprogramme oder auch Webbrowser. Der Begriff wird oft auch synonym zu Add-on und Add-in benutzt. Dabei sind Plug-ins stets mit der Hauptanwendung verbunden und können nicht einzeln ausgeführt werden. Die Hauptfunktion ist für alle Bereiche deckungsgleich: Die Software um neue Funktionen erweitern. In diesem Fall soll das Browser-Plugin zusätzliche Informationen über die Vertrauenswürdigkeit bestimmter Webseiten/Aussagen geben.

Crawler: Als Crawler oder Webcrawler werden Software-Programme bezeichnet, die das Internet durchsuchen. Dabei analysieren und indizieren sie Inhalte von Websites wie Texte und Bilder oder auch Videos. Ein Crawler arbeitet im Vorfeld definierte Aufgaben sukzessive ab. So werden ihm z. B. am Anfang einige URLs vorgegeben, die er besuchen soll. Beim Durchsuchen des Webs folgt er dabei prinzipiell jedem Link, den er auf einer Website entdeckt.

Large Language Models (LLM): Large Language Models (dt. etwa Sprachmodelle) sind mit Mitteln des Machine Learning erzeugte Computerprogramme, die darauf trainiert sind menschliche Sprache zu verstehen und zu verarbeiten. LLMs sind die Kernkomponenten zahlreicher moderner KI-Anwendungen wie Chatbots (z.B. ChatGPT), Anwendungen zur Übersetzung von Sprache (z.B. DeepL) oder KIs zur Erzeugung von Bildern (z.B. MidJourney). LLMs werden typischerweise über die Konditionierung auf großen Textkorpora erstellt und in einem zweiten Schritt für eine konkrete Aufgabe wie bspw. Übersetzung oder Prüfung einer Aussage spezialisiert. Je nach Kontext werden LLMs im alltäglichen Sprachgebrauch oft synonym mit Chatbots verwendet.

Retrieval-Augmented Generation (RAG): RAG-Anwendungen erweitern Chatbots um Datenquellen, aus denen sich das zugrundeliegende LLM bei der Erstellung von Antworten bedient. Dieser Ansatz löst das Problem, dass LLMs typischerweise auf generischen Inhalten konditioniert werden, denen einerseits domänenspezifische Daten wie bspw. medizinische Informationen fehlen und die andererseits veraltet sind. Das Training von LLMs ist äußerst aufwändig und somit nicht zur regelmäßigen Aktualisierung der Modelle geeignet. Daher hat der RAG-Ansatz in den letzten Monaten starke Popularität erlangt.