KI Themenportal

Es ist Stormingphase

KI ist überall – und KI wird auf alles und jeden geworfen. Das Erstellen und Modifizieren von KI-Modellen ist verhältnismäßig einfach und stellt dem Willigen nur geringe Hürden in den Weg. KI-Modell und Angebote von KI-Integrationen fluten die weltweiten Märkte.

Immer wieder lese ich von teilweise schwer nachvollziehbaren Geschäftsmodellen. Wachstum junger Startups speist sich heute in 2025 zu großen Teil aus Investitionsgeldern. Es ist die Phase des Sturms. Was sich am Ende durchsetzt entscheiden die Märkte.

Auf meinen Wegen durch das Netz und die Literatur kommen mir regelmäßig unzählige KI-Modell unter. Damit ich die Übersicht behalte, werden jetzt kleine Steckbriefe erstellt. Für mich und für Euch und vielleicht auch schon als Nachruf für Modelle, die unter die Räder kommen werden.

KI-Modell-Übersicht

Unsere Übersicht zu KI-Modellen und KI-Anwendungen

KI-Modelle in Tabelle

20

Einzelartikel

1

getestet

4

KI-Modelle tot

1

KI-Kernkonzepte kurz erklärt

Im Folgenden ein kurzer und oberflächlicher Ritt durch die Kernkonzepte und Begriff aus der KI-Welt

Large Language Modelle (LLMs)

LLMs bilden eine Obergruppe von konkreter KI-Modelle. Es handelt sich dabei um konkret realisierte Sprachmodelle (language model) die augrund ihrer Parameteranzahl (z. B. mehrere Milliarden) durch aus als groß (large) bezeichnet werden können. LLMs können Sprache generieren, indem sie durch ein neurales Netz (mit eben jenen Parametern) ein Sprachmodell umsetzen.

Konkret ergibt sich dabei beispielsweise ein Text als eine Abfolge von über eine Wahrscheinlichkeitsbetrachtung ermittelten Elementen (z. B. Wörtern, Buchstaben oder Symbole). Wie diese Wahrscheinlichkeitsberechnung konkret erfolgt wird durch das Training des neuralen Netzes bestimmt.

Alle KI-Anwendungen, die natürliche Sprache verarbeiten fußen komplett auf einem LLM oder nutzen LLMs zur Verarbeitung der Nutzereingaben.

Architektur: Tansformermodell

Über die Funktionsweise der Tansformer- gibt der Name bereits Auskunft. Diese Modelle wandeln Eingaben anhand ihrer Trainings in eine Ausgabe um.

Diese Kernidee wird häufig noch durch weitere Techniken erweitert. So kann die Eingabe zunächst durch Algorithmen analysiert, zerlegt und in eine für die eigentliche KI besser verarbeitbare Form gebracht werden. Teils werden nach Verarbeitung durch das neurale Netz die Ergebnisse erneut algorithmisch inhaltlich verändert und aufbereitet. Manchmal kann anfrageabhängig auf Internetsuchfunktion zurückgegriffen werden.

Diese Modelle erstellen Bilder, Texte, Musik und andere Medienformate. Im Regelfall erfolgt die Interaktion mittels natürlicher Sprache/Text. Hierzu stützt die die KI-Anwendung auf LLMs zur Verarbeitung der sprachlichen Anteile ab.

ChatGPT, Perplexity

Architektur: Diffusionsmodell

Diffusionsmodelle sind generative KI-Modelle, deren Arbeit mit einem Rauschen startet. Über eine definierte Anzahl von Schritten entschärft das neurale Netz das Rauschen und nähert sich so der Endausgabe an. Jeder Schritt dieses „Entrauschens“ wird anhand einer Vorgabe (z. B. die Nutzereingabe oder ein Medienformat) bewertet und an das neurale Netz zurückgekoppelt. In der nächsten Iteration des „Entrauschens“ wird das Feedback angewandt und im Ergebnis nähert sich das Netz mit jedem Schritt der gewünschten Ausgabe an.

Aufgrund ihrer Funktionsweise können Diffusionsmodelle durchaus in beide Richtungen arbeiten. Also aus beispielsweise aus einer Bildbeschreibung ein Bild erzeugen und auch aus einem Bild eine Bildbeschreibung erzeugen.

Beispiele: Midjourney, StableDiffusion, DALL-E

KI-Anwendungen

Die Nutzung eines KI-Models und Erweiterung um Nutzerinterface und weitere Verarbeitungsschritte führt zur Entstehung einer KI-Anwendung. Letztlich also eine IT-Anwendung, deren Kernfunktionalität ein KI-Modell nutzt. So ist ChatGPT beispielsweise ein Chatbot, der das KI-Modell GPT nutzt.

Im Regelfall bilden KI-Anwendungen konkrete Use-Cases ab, also beispielsweise Bilderzeugung, KI-Agenten, Bilderkennung, Simulation, Sicherheitsfunktionen für Netzwerke, usw.