Zum Inhalt springen

Künstliche Intelligenz Made in Franken by IIS

Fraunhofer Instituts IIS aus Erlangen entwickelt eigenes KI-Sprachmodell Teuken

Wirtschaft und Verbraucher schielen seit Chat-GPT auf die Möglichkeiten der sogenannten Sprachmodelle aus den USA von Google, Meta, Microsoft & Co. Und seit dem Launch des chinesischen DeepSeek sind auch Effizienz und Modellierung ein Thema. Immerhin gilt die Leistung von DeepSeek trotz der US-Sanktionen im HighTech-Bereich als beachtlich. Allerdings ist das Herz der KI, der sogenannte Kern, sowohl bei den Chinesen als auch bei der US-Amerikanern Verschlusssache. Als starke Alternative Made in Franken gilt die Lösung der Fraunhofer Instituts IIS aus Erlangen. Gemeinsam mit dem Schwester-Institut IAIS hat es das eigene KI-Sprachmodell Teuken entwickelt. Teuken ist ein Kunstwort aus Token und EU. Token steht in diesem Kontext für eine Zahlenreihe, in die ein Wort eines Textes umgewandelt wird und so für die nachfolgenden mathematischen Prozesse verfügbar ist. Mit dem Teuken-7B können sich Unternehmen auf Basis ihrer eigenen Daten aus der Fertigung eine individuelle Maschinensteuerung umsetzen.

Ein wichtiger Unterschied zu den großen amerikanischen oder chinesischen KI-Modellen: „Die Kundendaten der Unternehmen bleiben im geschützten Raum“, hebt IIS-Institutschef Bernhard Grill hervor. Anders als bei Chat-GPT & Co. fließen sie nicht in den allgemeinen Datenbestand ein. Mit einer entsprechenden Lizenz lassen sich betriebseigene KI-Anwendungen auf die firmeneigenen Geräte, wie Handys oder Laptops, auf die firmeneigene Cloud oder das eigene Firmenareal begrenzen.

Ein weiterer Unterschied zu den großen KI-Sprachmodellen: Teuken-7B ist eine europäische KI „Made in Germany“ und eine Open Source-Entwicklung. Damit ist das Innenleben eben keine Black Box sowie datenschutzkonform. Neben kleinen eingebetteten Lösungen für spezielle Lösungen wie etwa einem Hörgerät eignet sich Teuken-7B als sogenanntes Foundation-Modell für Großgeräte. Es lässt sich mit Texten, Videos und anderen beliebigen Daten füttern.

Anders als die allgemein sehr großen Modelle achten IIS und IAIS darauf, nicht einfach unkontrolliert alle verfügbaren Daten, den Common Crawl, einzuspeisen. Außerdem liegt der Fokus nicht fast ausschließlich auf Englisch und Chinesisch. Teuken-7B ist multilingual. „Es versteht und spricht alle 24 EU-Sprachen.“ Beim nächsten Update im Sommer sollen zudem weitere 13 Sprachen und Dialekte hinzukommen.

Instituts-Chef Grill hofft auf ein großes Anwendungsinteresse aus Nordbayern, Deutschland und Europa. Er selbst hat einst das Audiocodierverfahren mp3 mitentwickelt, dass auch den Weltruhm des Instituts mitbegründet hat. Allerdings biss sich das IIS trotz „jahrelanger Gespräche“ die Zähne an einer mittelfränkischen Lösung mit dem einstigen Unterhaltungskonzern Grundig aus, erinnert er sich. Mittlerweile steht hier die fünfte Generation an Audiocodecs nun auf Basis von KI an. „Wir sind in jedem technischen Wettbewerb nie schlechter als Erster gewesen“, hebt er selbstbewusst mit Blick auf den globalen Wettbewerb hervor. Heute fänden sich in jedem Handy, egal ob aus den USA, aus Europa oder China, sechs Technologie der Erlanger Forscher. Diesen „Welterfolg“ wünscht er sich auch für Teuken – möglichst auch mit Unternehmen vor Ort.   

Beitragbild: Institutsleiter Prof. Dr.-Ing. Bernhard Grill von Fraunhofer IIS