5 Minuten
ARM hat heute Lumex vorgestellt, ein produktionsbereites Compute-Subsystem (CSS) für 3nm-Fertigungstechnologien, das entwickelt wurde, um zu beschleunigen, wie Siliziumpartner leistungsstarke, energieeffiziente mobile SoCs entwerfen. Anstatt ARM zu einem Chiphersteller zu machen, liefert Lumex schlüsselfertige, foundry‑gerechte Implementierungen, die Hersteller als flexible Bausteine nutzen können — so können Partner ihre Entwicklungsressourcen auf clusterbezogene Differenzierung von CPUs und GPUs konzentrieren.
Was ist Lumex CSS?
Lumex ist eine modulare Chipset‑Vorlage für moderne Smartphones, Wearables und andere Edge‑Geräte. Sie bündelt ARMs nächste CPU‑Kern‑Generation, die Mali‑G1‑GPU‑Familie, ein skalierbares System‑Interconnect und sicherheitsorientierte Speichersubsysteme, alles optimiert für mehrere 3nm‑Foundries. Ziel ist es, Entwicklungszyklen zu verkürzen, gleichbleibende Leistung über Fabriken hinweg zu gewährleisten und fortschrittliche Funktionen wie sichere Virtualisierung und einen hocheffizienten Systemcache OEMs breit verfügbar zu machen.
Wesentliche Hardware‑Bausteine
- Skalierbare CPU‑Cluster über die neue C1‑DSU (Design System Unit): unterstützt Designs von 1 bis 14 CPU‑Kernen und bis zu drei Kern‑Typen, ausgewählt aus vier C1‑Optionen.
- Mali‑G1‑GPU‑Familie: skaliert von 1 bis 24 Shader‑Kernen, inklusive einer High‑End‑Variante Mali‑G1 Ultra.
- System Interconnect L1 & SLC: eine systemweite Cache‑Implementierung, die Leckströme gegenüber herkömmlichen RAM‑Ansätzen um etwa 71% reduziert und den Leerlaufverbrauch senkt.
- MMU L1: eine für sichere und kosteneffiziente Virtualisierung optimierte Memory‑Management‑Unit, die Multi‑OS‑ und partitionierte Workloads auf einem einzelnen SoC ermöglicht.

CPU‑Reihe und Leistungsklassen
ARMs C1‑Serie deckt alles ab — von Spitzenleistung in Flaggschiffen bis hin zu extrem energieeffizienten Wearables. Die Produktpalette und typische Einsatzbereiche umfassen:
- C1‑Ultra — Flaggschiff‑Einzelthread‑Leistung mit rund +25% Gewinn bei Single‑Thread und zweistelligen IPC‑Verbesserungen im Jahresvergleich. Ideal für Large‑Model‑Inference, computational photography, Content‑Creation und generative KI‑Workloads.
- C1‑Premium — Ähnliche Spitzenleistung wie C1‑Ultra, jedoch mit verbesserter Flächeneffizienz (etwa 35% kleinere Die‑Fläche). Geeignet für obere Mittelklassegeräte, Multitasking und Always‑on‑Sprachassistenten.
- C1‑Pro — Auf anhaltende Effizienz ausgelegt mit +16% nachhaltiger Leistung; zielt auf verlängerte Videowiedergabe, Streaming‑Inference und lang andauernde Hintergrundaufgaben.
- C1‑Nano — Ultra‑energieeffizienter, kompakter Kern mit bis zu +26% Effizienz in den kleinsten Formfaktoren wie Wearables und winzigen IoT‑Geräten.
GPU, KI und Matrix‑Beschleunigung
Die Mali‑G1‑GPU‑Familie skaliert breit, um verschiedene Marktsegmente abzudecken. ARM gibt an, dass die Mali‑G1 Ultra etwa 20% bessere Rasterisierungsleistung und bis zu doppelt so schnelle Raytracing‑Leistung gegenüber dem Vorgänger Immortalis‑G925 erreicht. Bei Inferenz‑Workloads soll die G1‑GPU rund 20% schneller sein als die vorige Generation.

Im Zentrum von ARMs KI‑Strategie steht die Scalable Matrix Extension 2 (SME2). SME2 beschleunigt die Matrixrechenoperationen, die für moderne neuronale Netze entscheidend sind; ARM berichtet, dass CPU‑seitige ML‑Workloads bis zu 5x höhere Durchsatzraten und bis zu 3x bessere Effizienz im Vergleich zu früheren Designs erreichen können, wodurch leistungsfähigere Modelle direkt auf Geräten praktikabel werden.
Plattformweite Effizienz und Sicherheit
Lumex legt Wert auf energieeffizientes Subsystem‑Design. Das System Interconnect L1 und sein systemweiter Cache (SLC) verringern Leckströme deutlich und reduzieren so den Leerlaufverbrauch — ein wichtiger Gewinn für die Akkulaufzeit. Die MMU L1 stellt Hardware‑Primitive für sichere Virtualisierung bereit, sodass Anbieter Hardware für mehrere Betriebssysteme partitionieren oder sensible Workloads mit geringerem Overhead als bei rein softwarebasierten Ansätzen isolieren können.

Benchmarks, Vergleiche und Aussagen
ARM berichtet, dass ein C1‑CPU‑Compute‑Cluster seine vorherigen Kerne in sechs Branchenbenchmarks im Durchschnitt um 30% übertrifft. Die realen Verbesserungen variieren je nach Workload: Gaming und Streaming zeigen rund 15% Mehrleistung, während Alltagsaufgaben wie Videowiedergabe, Surfen und soziale Apps die Effizienz im Schnitt um etwa 12% steigern. Im Vergleich zum Cortex‑X925 bietet der C1‑Ultra zweistellige IPC‑Verbesserungen, was ARMs Kurs in Richtung stärkerer Single‑Thread‑ und KI‑Leistung untermauert.
Anwendungsfälle und Marktrelevanz
Lumex ist für ein breites Spektrum an Geräten konzipiert: Flaggschiff‑Smartphones, die maximale Leistung und fortschrittliche On‑Device‑KI benötigen; obere Mittelklassegeräte, die von flächeneffizienten Premium‑Kernen profitieren; stromsensitiven Tablets und Streaming‑Geräten; sowie kleine Wearables, die extreme Effizienz verlangen. Für OEMs und Siliziumpartner verspricht Lumex schnellere Time‑to‑Market, konsistente 3nm‑Implementierungen über verschiedene Foundries hinweg und einen klaren Weg, leistungsfähigere On‑Device‑KI zu integrieren, ohne Akkulaufzeit und thermischen Spielraum zu opfern.
Reaktionen der Branche
Mehrere ARM‑Partner begrüßten Lumex als strategischen Beschleuniger. Führende OEMs und Siliziumteams hoben hervor, dass ein einsatzbereites, anpassbares Compute‑Subsystem einen Großteil der low‑level Integrationsarbeit eliminiert und ihnen erlaubt, sich auf produktbezogene Differenzierung zu konzentrieren — sei es Kameraverarbeitung, KI‑Funktionen oder systemweite Leistungsoptimierung. Große Plattformanbieter bemerkten außerdem, dass SME2 dazu beitragen wird, fortschrittliche Modelle auf eine breitere Palette von Geräten zu bringen, Latenzen zu senken und die Privatsphäre zu verbessern, indem lokale Inferenz ermöglicht wird.
Fazit
Lumex stellt eine bemerkenswerte Veränderung darin dar, wie ARM sein IP‑Angebot für das 3nm‑Zeitalter bündelt: nicht als Chipfertiger, sondern als Anbieter eines umfassenden, anpassbaren und produktionsreifen Substrats, das Designzyklen verkürzt und High‑End‑Funktionen wie sichere Virtualisierung und Matrix‑Beschleunigung standardisiert. Für Gerätehersteller, die sich auf On‑Device‑KI, Grafikleistung und akkuschonende Performance konzentrieren, soll Lumex ein pragmatischer Shortcut zu mobiler Rechenleistung der nächsten Generation sein.
Quelle: gsmarena
Kommentare