Keyframer: Apples neuestes KI-Tool kann ein Bild auf der Grundlage von Texteingaben animieren

Nachdem Apple vor kurzem erst mit dem KI-Tool MGIE gezeigt hatte, wie Bilder auf der Grundlage von Texteingaben entstehen, stellt das Unternehmen nun das nächste fortschrittliche KI-Modell vor. Keyframer nutzt die Leistung großer Sprachmodelle (LLMs), um statische Bilder in dynamische Animationen zu verwandeln, die durch vom Benutzer erstellte Texteingaben gesteuert werden.

Benutzerfreundlichkeit und Design-Flexibilität

Wie Apple in der Forschungsarbeit „Keyframer: Empowering Animation Design Using Large Language Models“ beschreibt, stellt das neue Tool einen Durchbruch bei der Erstellung und Verfeinerung von Animationen dar.

Im Gegensatz zu herkömmlichen Text-zu-Bild-Systemen wie DALL-E und Midjourney, die sich auf einmalige Eingabeaufforderungen stützen, befasst sich Keyframer mit den komplizierteren Anforderungen der Animation, wie Timing und Koordination. Diese komplexen Zusammenhänge entziehen sich oft einer einzelnen Eingabeaufforderung, sodass ein differenzierterer Ansatz erforderlich ist. Die Lösung von Apple kombiniert die aufkommenden Prinzipien der sprachbasierten Eingabeaufforderung mit den Code-Generierungsfähigkeiten von LLMs.

Der Prozess der Animation mit Keyframer ist sowohl intuitiv als auch detailliert. Zu Beginn lädt der Benutzer eine skalierbare Vektorgrafik (SVG) hoch, z. B. eine Weltraumrakete. Dann gibt der Benutzer eine beschreibende Eingabeaufforderung ein, z. B. „Erstelle drei Designs, bei denen der Himmel in verschiedene Farben übergeht und die Sterne funkeln“. Keyframer nimmt diese Anweisung auf und generiert den entsprechenden CSS-Code, um diese Animation zum Leben zu erwecken.

Mit Keyframer können Benutzer ihre Animationen weiter verfeinern. Dies kann entweder durch direkte Bearbeitung des generierten CSS-Codes oder durch Eingabe zusätzlicher Texteingaben geschehen. Dieser duale Ansatz richtet sich sowohl an erfahrene Designer, die die praktische Programmierung bevorzugen, als auch an diejenigen, die die Einfachheit von Spracheingaben bevorzugen. Die Flexibilität und Benutzerfreundlichkeit von Keyframer soll einen bedeutenden Fortschritt im Bereich des KI-gesteuerten Designs darstellen und macht damit komplexe Animationsaufgaben leichter zugänglich und weniger zeitaufwändig.

Die Rückmeldungen von professionellen Animationsdesignern und -ingenieuren, die in der Forschungsarbeit von Apple zitiert werden, unterstreichen die Effizienz und Effektivität von Keyframer. Einer der Studienteilnehmer bemerkte: „Ich glaube, das war viel schneller als vieles, was ich bisher gemacht habe. Ich glaube, so etwas zu machen, hätte früher einfach Stunden gedauert.“

Apples KI-Fortschritte

Keyframer ist nur einer von vielen Fortschritten, die Apple derzeit auf dem Gebiet der künstlichen Intelligenz macht. Kürzlich haben Apple-Forscher mit dem bereits erwähnten Tool MGIE ein KI-Modell vorgestellt, das in der Lage ist, Bilder auf Pixelebene zu bearbeiten. Benutzer können per Texteingabe verschiedene Bildaspekte ändern, einschließlich globaler Fotoverbesserungen wie Helligkeit, Kontrast und künstlerische Effekte.

Darüber hinaus hat Apple Ende Dezember seine Fortschritte beim Einsatz von LLMs auf Geräten mit begrenztem Speicher, wie iPhones und iPads, bekannt gegeben. Das Unternehmen stellte eine Methode vor, die den Datentransfer vom Flash-Speicher zum RAM minimiert, wodurch LLMs auf Geräten mit begrenztem RAM bis zu 25 Mal schneller arbeiten können. Zudem gibt es zahlreiche Gerüchte, dass Apple an einem eigenen generativen KI-Modell arbeitet, das den Codenamen „Ajax“ trägt, das mit OpenAIs GPT-3 und GPT-4 konkurrieren soll. Das Modell soll ein hohes Maß an Komplexität und Fähigkeiten im Bereich des Sprachverständnisses und der Generierung bieten.

Aller Voraussicht werden sich Apples Fortschritte im Bereich der künstlichen Intelligenz schon bald auch für Endbenutzer bemerkbar machen. Es wird erwartet, dass Apple auf der diesjährigen WWDC mit der Vorstellung von iOS 18 auch eine Reihe von KI-basierten Tools ankündigen wird. Analysten gehen davon aus, dass sich iOS 18 stark auf generative KI konzentrieren und Siri möglicherweise in einen fortschrittlicheren Sprachassistenten verwandeln wird. Sowohl MGIE als auch Keyframer befinden sich derzeit in einem sehr frühen Stadium, sodass sie wahrscheinlich noch nicht Teil von iOS 18 sein werden.

Keyframer: Apples neuestes KI-Tool kann ein Bild auf der Grundlage von Texteingaben animieren

14. Feb 2024 | 16:22 Uhr | 0 Kommentare

Benutzerfreundlichkeit und Design-Flexibilität

Apples KI-Fortschritte

0 Kommentare

Schreibe einen Kommentar Antworten abbrechen