Smartphones mit LLM: Was heißt das genau? – Bei vielen Ankündigungen von Smartphone Herstellern liest man mittlerweile, dass sie an LLM Lösungen für die kommenden Geräte arbeiten. Auch Qualcomm hat dieses Kürzel in Verbindungen mit der neuen Chip-Generation immer wieder genannt und viele Nutzer sind sich gar nicht sicher, was dahinter nun genau steckt oder was man an Vorteilen hat, wenn Smartphones mit LLM auf den Markt kommen. Daher wollen wir hier einen Blick auf diese neue Technik werfen und erklären, was dahinter steckt.

Was ist ein LLM?

Ein LLM, also ein Large Language Model, ist eine Art von künstlicher Intelligenz (KI), die Deep-Learning-Techniken und massiv große Datensätze verwendet, um neue Inhalte zu verstehen, zusammenzufassen, zu generieren und vorherzusagen. LLMs sind eine Weiterentwicklung des Sprachmodellkonzepts (Language Model Concept) in der künstlichen Intelligenz, das die für das Training und die Schlussfolgerungen verwendeten Daten drastisch erweitert. Aktuell kennt man sie vor allem von Google Bart und ChatGPT und sie werden genutzt um Frage zu beantworten, Texte zu erstellen oder auch Bilder und Videos zu erstellen. LLMs generell werden für eine Vielzahl von Aufgaben eingesetzt, darunter:

Spracherkennung: LLMs können verwendet werden, um Sprache aus Audio- oder Videodaten zu erkennen.

LLMs können verwendet werden, um Sprache aus Audio- oder Videodaten zu erkennen. Sprachübersetzung: LLMs können verwendet werden, um Sprachen automatisch zu übersetzen.

LLMs können verwendet werden, um Sprachen automatisch zu übersetzen. Textgenerierung: LLMs können verwendet werden, um Text zu generieren, z. B. für Artikel, Blogposts oder E-Mails.

LLMs können verwendet werden, um Text zu generieren, z. B. für Artikel, Blogposts oder E-Mails. Frage-Antwort-Systeme: LLMs können verwendet werden, um Fragen zu beantworten, z. B. aus Wikipedia oder anderen Wissensdatenbanken.

LLMs können verwendet werden, um Fragen zu beantworten, z. B. aus Wikipedia oder anderen Wissensdatenbanken. Kundenservice: LLMs können verwendet werden, um Kundenanfragen zu beantworten.

LLMs sind noch in der Entwicklung, aber sie haben das Potenzial, eine Vielzahl von Aufgaben in der KI zu revolutionieren. Beispiele für LLMs, die in der Praxis eingesetzt werden:

Google Translate: Google Translate verwendet ein LLM, um Sprachen zu übersetzen.

Google Translate verwendet ein LLM, um Sprachen zu übersetzen. GPT-3: GPT-3 ist ein LLM von OpenAI, das für eine Vielzahl von Aufgaben eingesetzt werden kann, darunter Textgenerierung, Übersetzung und Frage-Antwort-Systeme.

GPT-3 ist ein LLM von OpenAI, das für eine Vielzahl von Aufgaben eingesetzt werden kann, darunter Textgenerierung, Übersetzung und Frage-Antwort-Systeme. LaMDA: LaMDA ist ein LLM von Google AI, das für die Erstellung von kreativen Textformaten wie Gedichten, Code, Skripte, Musikstücke, E-Mails, Briefe usw. verwendet werden kann.

LLMs sind ein leistungsstarkes Werkzeug, das in einer Vielzahl von Bereichen eingesetzt werden kann. Sie haben das Potenzial, die Art und Weise, wie wir mit Sprache interagieren, grundlegend zu verändern.

Was bringen LLM Systeme für Smartphones?

LLM haben bisher das Problem, dass sie viel Rechenpower brauchen und daher meistens nur über das Netz nutzbar sind. Ohne Internet ist dann auch kein Zugriff auf das LLM möglich. Mit der nächsten Generation der Smartphones ab 2024 wird das anders werden. Die Performance nimmt zu und die Optimierung der LLM wird besser, so dass diese Technik auch direkt auf Smartphones eingesetzt werden kann. Auch ohne Internet-Anschluss kann man dann bestimmte Modelle auf den Geräten nutzen.

Honor schreibt beispielsweise zum YOYO LLM für die neuen Magic 6 Modelle:

Mit der mobilen Plattform Snapdragon 8 Gen 3 wird die HONOR Magic6 Serie von einem geräteeigenen LLM mit sieben Milliarden Parametern betrieben. Das Potenzial seiner KI-Fähigkeiten veranschaulichte HONOR während seiner Präsentation im Rahmen einer Demo zur Erstellung von Videos durch eine Künstliche Intelligenz. Mit Befehlen an den Smart-Sprachassistenten YOYO können Benutzer problemlos kurze Videos aus Bildmaterial erstellen, das auf ihren Geräten gespeichert ist. Vorlagen, Themen und Musik der generierten Videos lassen sich durch zusätzliche Aufforderungen anpassen und personalisieren.

Man wird mit den Systemen also in erster Linie Inhalte erstellen können und wohl auch bei Probleme Antworten finden. Wahrscheinlich werden die LLM zukünftig immer stärker in die Betriebssysteme integriert, so dass auch die Steuerung der Smartphones bald darüber möglich sein wird.

LLM sind keine normalen Sprachassistenten

LLMs und Sprachassistenten wie Siri oder Bixby unterscheiden sich in einer Reihe von Punkten.Vor allem die Spracherkennung ist ein Unterschied, denn Siri und Co reagieren in erster Linie auf bekannte Befehle und Anweisungen. Der Nutzer muss seine Anweisungen so formulieren, dass der Assistent ihn versteht. LLM arbeiten anders und verstehen natürliche Sprache. Dazu können sie auch dazu lernen und auf Anweisungen reagieren, die noch nicht da waren. Daneben gibt es auch noch andere Unterscheidungen:

Datensatz

LLMs werden auf riesigen Datensätzen von Text und Code trainiert, während Sprachassistenten auf kleineren Datensätzen von Sprachdaten trainiert werden. Dies bedeutet, dass LLMs in der Lage sind, komplexere Aufgaben auszuführen, z. B. die Erstellung von kreativen Textformaten oder die Beantwortung von offenen Fragen.

Aufgaben

LLMs sind in der Lage, eine Vielzahl von Aufgaben auszuführen, während Sprachassistenten in erster Linie darauf ausgelegt sind, einfache Aufgaben auszuführen, z. B. das Abspielen von Musik oder das Stellen von Weckern.

Interaktion

LLMs können über eine Vielzahl von Eingabemethoden gesteuert werden, z. B. über Text, Sprache oder Berührung. Sprachassistenten werden in der Regel über Sprache gesteuert.

Verfügbarkeit

LLMs sind noch in der Entwicklung und sind daher nicht für die breite Öffentlichkeit verfügbar. Sprachassistenten sind in der Regel als Apps oder Geräte erhältlich.

Hier ist eine Tabelle mit den wichtigsten Unterschieden zwischen LLMs und Sprachassistenten:

Merkmal LLM Sprachassistent Datensatz Riesig, Text und Code Klein, Sprache Aufgaben Komplex, z. B. Textgenerierung oder Frage-Antwort-Systeme Einfach, z. B. Musik abspielen oder Wecker stellen Interaktion Text, Sprache, Berührung Sprache Verfügbarkeit In Entwicklung Für die breite Öffentlichkeit verfügbar