Alibaba Cloud hat mehr als 100 seiner neu eingeführten Large Language Models Qwen 2.5 weltweit als Open Source veröffentlicht. Die Ankündigung erfolgte auf der Apsara-Konferenz, der jährlichen Hauptveranstaltung des Unternehmens.
Darüber hinaus hat Alibaba Cloud eine vollständig überarbeitete Full-Stack-Infrastruktur vorgestellt, die den steigenden Anforderungen an leistungsstarke KI-Anwendungen gerecht wird. Die neue Infrastruktur umfasst innovative Cloud-Produkte und -Dienste, die die Rechenleistung, die Netzwerkleistung und die Rechenzentrumsarchitektur optimieren, um die Entwicklung und den Einsatz von KI-Modellen voranzutreiben. Die neu vorgestellten Qwen 2.5 Open-Source-Modelle mit einer Grössenordnung von 0,5 bis 72 Milliarden Parametern bieten erweitertes Wissen und verbesserte Funktionen in Mathematik und Programmierung. Sie unterstützen über 29 Sprachen und eignen sich für eine breite Palette von KI-Anwendungen, sowohl in der Cloud als auch am Edge. Zu den Branchen, in denen sie zum Einsatz kommen, zählen unter anderem die Automobilindustrie, die Gaming-Branche sowie die Forschung. Seit ihrer Einführung im April 2023 verzeichnen die Qwen-Modelle, das Portfolio der proprietären Large Language Models von Alibaba Cloud, eine äusserst positive Entwicklung. Bis heute wurden sie mehr als 40 Millionen Mal auf Plattformen wie Hugging Face und ModelScope, einer Open-Source-Plattform von Alibaba, heruntergeladen. Darüber hinaus haben sie die Entwicklung von über 50.000 weiteren Modellen auf Hugging Face inspiriert. Mit der Veröffentlichung der Qwen 2.5-Serie stehen über 100 Modelle als Open Source zur Verfügung. Das umfassende Angebot umfasst Basismodelle, Anleitungsmodelle und quantisierte Modelle mit unterschiedlichen Genauigkeitsstufen und Methoden. Es deckt verschiedene Modalitäten wie Text, Audio und Bildverarbeitung ab. Zudem sind spezialisierte Modelle für die Codeverarbeitung und mathematische Aufgaben enthalten.
„Heute feiern wir einen wichtigen Schritt mit der Einführung unserer bisher grössten Open-Source-Initiative“, sagte Jingren Zhou, Chief Technology Officer von Alibaba Cloud Intelligence. „Diese Initiative wird Entwicklern und Unternehmen aller Grössen helfen, KI-Technologien besser zu nutzen und das Wachstum der Open-Source-Community fördern.“
Erweiterte Multimodalität
Alibaba Cloud präsentierte im Rahmen der Reihe "Tongyi Wanxiang" ein neues Text-zu-Video-Modell. Die Reihe umfasst bereits eine Reihe großer Sprachmodelle. Das Modell ist in der Lage, hochwertige Videos in verschiedenen visuellen Stilen zu erzeugen, darunter realistische Szenen und 3D-Animationen. Das Modell verarbeitet Textanweisungen in Chinesisch und Englisch und verwandelt statische Bilder in dynamische Videos. Zur Verbesserung der Video-Rekonstruktionsqualität wird eine fortschrittliche Diffusion-Transformer-(DiT)-Architektur genutzt. Darüber hinaus präsentiert Alibaba Cloud ein bedeutendes Update für sein Vision-Language-Modell Qwen2-VL. Das Modell ist in der Lage, Videos mit einer Länge von über 20 Minuten zu analysieren und Fragen auf Basis von Videoinhalten zu beantworten. Dank fortschrittlicher Analyse- und Entscheidungsfunktionen ist Qwen2-VL ideal für die Integration in Mobiltelefone, Autos und Roboter geeignet. Es erleichtert die Automatisierung spezieller Aufgaben und trägt so zur Effizienzsteigerung bei. Im Bereich der Softwareentwicklung präsentiert Alibaba Cloud zudem einen AI Developer, einen KI-Assistenten auf Basis von Qwen. Der AI Developer automatisiert Aufgaben wie Anforderungsanalyse, Codierung und das Identifizieren sowie Beheben von Softwarefehlern. Dadurch können sich Entwickler besser auf wesentliche Aufgaben konzentrieren und ihre Fähigkeiten weiter ausbauen.