SEOUL, Südkorea, 11. Juni 2026 /PRNewswire/ -- Nota AI, ein auf die Komprimierung und Optimierung von KI-Modellen spezialisiertes Unternehmen, gab bekannt, dass zwei seiner Beiträge zu MoE-spezifischen Quantisierungsalgorithmen für den Workshop „Resource-Adaptive Foundation Model Inference (AdaptFM)" im Rahmen der ICML 2026, einer der weltweit führenden Konferenzen für maschinelles Lernen, angenommen wurden.
Die ICML gilt allgemein als eine der weltweit führenden Konferenzen im Bereich des maschinellen Lernens und der künstlichen Intelligenz und vereint die neuesten Forschungsergebnisse von globalen Technologieunternehmen, führenden Universitäten und bedeutenden Forschungseinrichtungen. Der AdaptFM-Workshop konzentriert sich auf Technologien, die es ermöglichen, groß angelegte KI-Modelle unter begrenzten Rechenressourcen effizient auszuführen. Forscher von globalen Unternehmen und Forschungseinrichtungen, darunter Amazon und Meta, sind im Organisationskomitee vertreten, während Forscher von führenden KI-Unternehmen wie NVIDIA, Qualcomm AI Research, OpenAI, Apple und Microsoft ebenfalls als Mitglieder des Programmkomitees teilnehmen.
Diese Leistung ist von großer Bedeutung, da sie das gesammelte technische Know-how von Nota AI bei der Optimierung von Mixture-of-Experts (MoE)-Modellen würdigt – einer Architektur, die zunehmend als Kernstruktur für große Sprachmodelle (LLMs) angesehen wird. MoE-Modelle verbessern sowohl die Leistung als auch die Effizienz, indem sie je nach Bedarf nur eine Teilmenge von Expertenmodellen aktivieren. Ihre komplexe Struktur erfordert jedoch einen anderen Ansatz bei der Quantisierung – dem Prozess, Modelle kleiner und effizienter zu machen – als bei herkömmlichen Modellarchitekturen.
Nota AI gewann zuvor sowohl seinen eigenen Track als auch den Gesamtwettbewerb beim NVIDIA Nemotron Hackathon mit einer datengesteuerten MoE-Quantisierungsmethode. Mit der Annahme dieser beiden Beiträge wird Nota AI erneut Forschungsergebnisse, die speziell für MoE-Architekturen entwickelt wurden, auf einer globalen Forschungsbühne präsentieren.
Der erste angenommene Beitrag, „DREAM-MoE", schlägt eine Methode vor, um Veränderungen im Entscheidungsfluss eines Modells zu reduzieren, die auftreten können, wenn groß angelegte KI-Modelle über mehrere Segmente hinweg quantisiert werden. Die Methode konzentriert sich auf die Tatsache, dass selbst ein kleiner Fehler in einem früheren Segment die Expertenauswahl in späteren Segmenten beeinflussen kann. DREAM-MoE hilft dem quantisierten Modell dabei, Experten so auszuwählen, dass das Ergebnis näher am ursprünglichen Modell bleibt.
Die zweite Arbeit, „SRA-MoE", schlägt eine Methode vor, die wichtige Eingaben identifiziert und priorisiert, die einen größeren Einfluss auf die endgültige Ausgabe des Modells haben. Anstatt alle Eingaben gleich zu behandeln, ist SRA-MoE darauf ausgelegt, zu verhindern, dass die Expertenauswahl für diese Schlüssel-Eingaben erheblich gestört wird, was dazu beiträgt, die Modellqualität unter begrenzten Ressourcen effektiver aufrechtzuerhalten.
Beide Studien zeigten eine höhere Leistung im Vergleich zu den neuesten MoE-spezifischen Quantisierungsmethoden. Dies zeigt, dass groß angelegte KI-Modelle mit weniger Speicher und weniger Rechenressourcen ausgeführt werden können, während Qualitätsverluste reduziert werden. Weil die Kosten, der Stromverbrauch und die Hardware-Belastung beim Betrieb großer KI-Modelle weiter steigen, gewinnen MoE-spezifische Quantisierungstechnologien zunehmend an Bedeutung.
Nota AI hat seine Forschungs- und Entwicklungsbemühungen proaktiv auf die Optimierung großer KI-Modelle konzentriert, die erhebliche Speicher- und Rechenressourcen erfordern. Das Unternehmen treibt die Optimierung groß angelegter Modelle, darunter Solar MoE, als Teil des vom Upstage-Konsortium geleiteten Sovereign-Foundation-Model-Projekts voran. Zudem erweitert es seine Erfahrung bei der Quantisierung von NVIDIA Nemotron 3 Nano auf neuere große Modelle wie Nemotron Ultra und erweitert damit den Anwendungsbereich seiner Optimierungstechnologien weiter.
„Die Annahme dieses Beitrags spiegelt die kontinuierlichen Fortschritte von Nota AI bei MoE-spezifischen Quantisierungstechnologien wider", sagte Myungsu Chae, CEO von Nota AI. „Nach unserem Gesamtsieg beim NVIDIA Nemotron Hackathon freuen wir uns, unsere Forschungsergebnisse auf dem ICML 2026 AdaptFM Workshop zu präsentieren. Wir werden weiterhin Optimierungstechnologien entwickeln, die einen effizienteren und praktischeren Einsatz großer KI-Modelle ermöglichen."
Darüber hinaus wird Nota AI während der ICML 2026 im COEX in Seoul die „Nota AI – Korea Efficient Days" veranstalten. Die Veranstaltung bringt globale Forscher, Ingenieure und Führungskräfte aus der Wirtschaft zusammen, die Korea besuchen, um Forschungstrends und industrielle Anwendungen von Efficient AI auszutauschen. Im Rahmen der Veranstaltung plant Nota AI, seine Forschungsergebnisse zur Optimierung groß angelegter KI-Modelle vorzustellen und Möglichkeiten für technische Zusammenarbeit und geschäftliche Kontakte zu erweitern.
View original content to download multimedia:https://www.prnewswire.com/de/pressemitteilungen/nota-ai-hat-zwei-beitrage-zur-moe-quantisierung-fur-den-icml-2026-workshop-eingereicht-und-beweist-damit-seine-weltweite-wettbewerbsfahigkeit-bei-der-optimierung-groW-angelegter-ki-projekte-302798010.html
Nach gut zehn Monaten Bauzeit ist die stark befahrene Bahnstrecke zwischen Hamburg und Berlin wieder vollständig in Betrieb – allerdings mit sechs Wochen Verspätung gegenüber dem ursprünglichen Zeitplan. Am frühen Morgen fuhr der erste Fernzug um 5.36 Uhr mit leichter Verspätung vom Hamburger Hauptbahnhof in Richtung Hauptstadt ab, wie die Deutsche Bahn mitteilte. Bereits seit Samstagabend nutzen Güterzüge den Korridor, seit Sonntag rollen auch wieder Fern- und Regionalzüge regulär über die sanierte Verbindung.
Für Tausende Pendlerinnen und Pendler entfällt damit der belastende Ersatzverkehr mit Bussen. Während der Generalsanierung war der Fernverkehr über Stendal und Uelzen umgeleitet worden, regionale Verbindungen zwischen Hamburg und Berlin fielen monatelang aus. Schon Mitte Mai hatte die Bahn einen ersten Teilabschnitt entlastet und die durchgehende Verbindung zwischen Hamburg und Schwerin wieder aufgenommen. Nun ist die gesamte Achse zurück im Netz – die Bahn warnt jedoch vor Anlaufschwierigkeiten und empfiehlt, Fahrzeiten vorab zu prüfen.
Die Wiederinbetriebnahme verläuft holprig. Am ersten Betriebstag sammelten sich auf der frisch sanierten Strecke Verspätungen von mindestens 15 Minuten, teils deutlich darüber. Fernzüge benötigten am Sonntag in der Regel mehr als zwei Stunden und 15 Minuten zwischen den Hauptbahnhöfen, obwohl die schnellsten ICE nach Abschluss der Arbeiten eigentlich in rund einer Stunde und 47 Minuten verkehren sollen. Hintergrund ist unter anderem, dass das für Tempo 230 ausgelegte LZB-Zugsicherungssystem auf Teilen der Trasse noch nicht abgenommen ist. Auf diesen Abschnitten gilt vorerst das PZB-System mit einer zulässigen Höchstgeschwindigkeit von 160 Stundenkilometern.
Die Bauarbeiten auf der 2025 begonnenen Generalsanierung umfassten nach Bahnangaben die Erneuerung von 165 Kilometern Gleisen und die Instandsetzung weiterer 61 Kilometer. Zudem wurden 249 Weichen eingebaut und 28 Bahnhöfe modernisiert. Der ursprünglich bis Ende April angesetzte Abschluss verzögerte sich durch einen harten Winter und gefrorenen Boden, der den Zeitpuffer aufbrauchte. Mit der jetzt abgeschlossenen Kernsanierung ist die Verbindung zwischen den beiden größten deutschen Städten infrastrukturell deutlich erneuert, ihre geplante Höchstleistung im Fahrplanbetrieb dürfte aber erst erreicht werden, wenn die technischen Zugsicherungssysteme auf der gesamten Strecke vollumfänglich verfügbar sind.