ETH Zürich, EPFL und CSCS präsentieren Apertus, ein vollständig offenes und mehrsprachiges Sprachmodell mit 8 und 70 Milliarden Parametern.
ETH Zürich, EPFL und das Schweizer Supercomputing Zentrum haben das Sprachmodell Apertus vorgestellt. Es gehört zu den grössten offenen KI Modellen der Schweiz. Architektur, Trainingsdaten und Dokumentation sind vollständig zugänglich. Apertus wird in zwei Versionen angeboten, mit 8 und 70 Milliarden Parametern. Es steht unter einer offenen Lizenz für Forschung, Bildung und kommerzielle Anwendungen zur Verfügung. Apertus wurde mit 15 Billionen Token in über 1000 Sprachen trainiert, davon 40 Prozent in nicht englischen Sprachen, darunter Schweizerdeutsch und Rätoromanisch. Es wurden ausschliesslich öffentlich verfügbare Daten genutzt, und die Suchmaschinen respektieren die maschinenlesbaren Ausschlussregeln von Webseiten. Damit grenzt sich das Projekt bewusst von Praktiken anderer KI Firmen ab, die kritisiert oder gar verklagt wurden, weil sie Inhalte ohne Erlaubnis genutzt haben. Der Zugriff erfolgt über Swisscom, Hugging Face und das Public AI Netzwerk. Ziel ist es, Transparenz, Vielfalt und Reproduzierbarkeit zu fördern und eine vertrauenswürdige Grundlage für Gesellschaft, Wirtschaft und Forschung zu schaffen. (aso)