NVIDIA GTC 2026

Deshalb wird das „Five-Layer-Cake“-Modell für AI entscheidend

Im Rahmen seiner jährlichen Leitmesse und globalen AI-Konferenz GTC 2026 hat NVIDIA seine Sicht auf den AI‑Markt geschärft – und das sogenannte „Five-Layer-Cake“-Modell vorgestellt. Dieses Modell sei in Zukunft für AI-Lösungen essenziell. 

20. März 2026

|

Lesedauer: ca. 2 Min.

nvidia-gtc-2026

Bild: © CANCOM

Fortschritte im AI-Bereich können nur auf Basis eines ganzheitlichen Technologie-Stacks erzielt werden. Das betonte NVIDIA-CEO Jensen Huang auf der GTC 2026. Der Stack setze sich aus fünf Bausteinen zusammen: Energie, Chips, Infrastruktur, AI-Modelle und -Anwendungen. Entsprechend bezeichnete der NVIDIA-CEO den Stack als „Five-Layer-Cake“-Modell. Erst wenn alle Bausteine reibungslos miteinander zusammenspielen, sei das technologische Fundament geschaffen, um AI-Lösungen erfolgreich einzusetzen.

Vera Rubin als innovative AI-Rechenzentrumsplattform

Wie der IT-Konzern auf der globalen AI-Konferenz hervorhob, leistet NVIDIA einen zentralen Beitrag zur erfolgreichen Umsetzung des „Five Layer Cake“-Modells. So kündigte der Hersteller unter anderem die Vera Rubin Platform an. Als AI-Rechenzentrumsplattform der nächsten Generation setzt Vera Rubin auf vollständig integrierte Rack-Systeme, in denen GPUs, CPUs, spezialisierte Inference‑Beschleuniger, DPUs zur effizienten Abwicklung von Netzwerk‑, Daten‑ und Sicherheitsprozessen, Storage‑ und Energie‑Management‑Komponenten sowie ein durchgängiger Software‑Stack als skalierbare Einheit zusammenarbeiten.

Ein solches Rack-System enthält laut NVIDIA über eine Million Komponenten und liefert etwa das Zehnfache der Leistung pro Watt im Vergleich zur Vorgängerplattform Grace-Blackwell. Diese Effizienzsteigerung sei auch nötig, um den steigenden Energiebedarf beim Ausbau von AI-Rechenzentren zu bewältigen.

AI-Agenten werden künftig dominieren

Weiterhin präsentierte NVIDIA mit NemoClaw eine Plattform für die sichere Entwicklung und Governance von AI-Agenten, die vorab definierte Geschäftsprozesse automatisiert übernehmen können. Wie NVIDIA hervorhebt, lässt sich NemoClaw an unternehmensspezifische Anwendungsfälle und Compliance‑Vorgaben anpassen.

Nach eigenen Angaben reagiert der Hersteller damit auf die vermehrte Nutzung von agentenbasierten Anwendungen. Diese geht laut NVIDIA mittlerweile so weit, dass AI-Agenten weitere Agenten selbständig orchestrieren, um komplexe Aufgaben zu erledigen. Dadurch steige jedoch auch die Anzahl der generierten Token massiv an – was die Kosten für AI in die Höhe treibe. Zu diesem Schluss kommen auch Marktforscher wie Deloitte. Demnach führt die vermehrte Nutzung von AI-Agenten zu einem wachsenden Einsatz der AI-Inferenz in Unternehmen – mit dem Ergebnis steigender Kosten.

Um dieser Entwicklung entgegenzuwirken, benötigt es schnellere und vor allem noch effizientere Inferenz-Plattformen. Das betonte NVIDIA und stellte mit Triton (als Teil moderner AI Factories) eine entsprechende Lösung vor: Dadurch könnten Firmen insbesondere die Skalierbarkeit und Ressourcenauslastung von AI-Workloads automatisiert kontrollieren und steuern. Außerdem hätten Unternehmen die Möglichkeit, AI-Training und -Inferenz konsistent über die gesamte IT-Infrastruktur zu betreiben.

Fazit

Mit dem „Five-Layer-Cake“-Modell machte NVIDIA auf der GTC 2026 deutlich: Für den erfolgreichen Einsatz von AI-Lösungen und -Agenten benötigt es einen durchgängigen Technologie-Stack – anstatt einzelner Insellösungen. Dabei präsentierte NVIDIA mit der Vera Rubin Platform, NemoClaw oder Triton zentrale Bausteine dieses Stacks.

Der ganzheitliche Ansatz von NVIDIA im technologischen Bereich fügt sich indes nahtlos in die Leistungen von CANCOM im AI-Bereich ein. Das hebt CANCOM hervor: So bietet der IT-Konzern im AI-Umfeld mit dem „One-4-All-Ansatz“ ein breites Portfolio an, in dem die technologische Komponente ein wesentlicher Bestandteil ist. Über 200 Datacenter-Experten von CANCOM unterstützen Unternehmen dabei, eine skalierbare AI-Infrastruktur aufzubauen und zu betreiben – etwa auf Basis von NVIDIA-Technologie.

Weitere zentrale Bestandteile der CANCOM-Services im AI-Umfeld sind unter anderem Beratung, Use Case-Definition und Change Management.

Sie möchten sich weiter zu den CANCOM-Leistungen im AI-Bereich informieren? Dann besuchen Sie gerne die exklusive Themenseite. Dort finden Sie sowohl nähere Informationen in allgemeiner Hinsicht als auch speziell auf AI-Infrastruktur bzw. NVIDIA bezogen.

 

Dieser Beitrag ist der Auftakt einer kleinen Artikelreihe, in der wir auf zentrale Themen der NVIDIA GTC 2026 eingehen. In Folgeartikeln werden wir insbesondere beleuchten, welches Ziel NVIDIA mit NemoClaw verfolgt und wie Unternehmen in der Praxis von der Lösung profitieren könnten. Außerdem werden wir das Thema AI-Inferenz genauer unter die Lupe nehmen und aufzeigen, wie NVIDIA auf die Herausforderungen in diesem Umfeld konkret reagiert.

Mehr zum Thema „Artificial Intelligence“

240508_hpe_private_cloud_ai

Erfolgreicher AI-Einsatz braucht mehr als Technologie

Erst das Zusammenspiel aus Strategie, Infrastruktur und Know-how macht AI produktiv nutzbar. HPE Private Cloud AI und CANCOM bieten eine integrierte Lösung.

Lesedauer: 2 Min.

generative-ki

Generative KI: Ein Game-Changer für Unternehmen?

Generative KI hält zunehmend Einzug in Unternehmen. Mit Microsoft Copilot reagiert Microsoft auf diesen Trend. Doch was zeichnet die generative KI aus?

Lesedauer: 6 Min.

251021_cci_prompt_injection

Wenn AI nicht mehr handelt, wie sie soll: Was steckt hinter Prompt Injection?

AI-Technologien sind hilfreich, können aber manipuliert werden. Erfahren Sie mehr über Bedrohungen wie Prompt Injection und warum Unternehmen handeln sollten.

Lesedauer: 2 Min.