Die Zeit für agentenbasierte KI ist gekommen, doch um ihr Potenzial voll auszuschöpfen, braucht es mehr als gute Modelle. Dazu gehören auch leistungsstarke Hardware, sichere Laufzeitumgebungen, eine reaktionsschnelle Datenschicht und Modelle, die für langfristiges logisches Denken optimiert sind. NVIDIA und Microsoft stellen Entwicklern diese Komplettlösung für Windows-Geräte, die Azure-Cloud und lokale Installationen zur Verfügung.
Auf der Microsoft Build nahm NVIDIA-Gründer und CEO Jensen Huang per Livestream aus Taipeh an der Keynote von Microsoft-Chef Satya Nadella teil, um über die erweiterte Partnerschaft zu sprechen: NVIDIA RTX Spark und DGX Station für Windows, NVIDIA GPU-beschleunigtes Microsoft Fabric, NVIDIA Open-Modelle auf Microsoft Foundry, die sichere Laufzeitumgebung NVIDIA OpenShell in GitHub Copilot und die nächste Generation von NVIDIA-gestützten KI-Fabriken.
Windows für Agenten neu erfinden: Von RTX Spark zu DGX Station für Windows
NVIDIA und Microsoft gestalten Windows-PCs für das Zeitalter der KI-Agenten neu. Mit RTX Spark Laptops und kleinen Desktop-PCs sowie den mobilen KI-Supercomputern DGX Station für Windows können Entwickler Agenten nativ unter Windows erstellen, optimieren und ausführen.

RTX Spark markiert einen Neuanfang und treibt die weltweit ersten Windows-PCs an, die speziell für persönliche Assistenten entwickelt wurden. Sie bieten eine KI-Leistung von 1 Petaflop, bis zu 128 GB Arbeitsspeicher, ganztägige Akkulaufzeit und volle KI- und Grafikleistung auch im Akkubetrieb. Die Systeme, die auf über 30 Jahren NVIDIA-Innovation basieren, darunter CUDA, RTX, DLSS und TensorRT, sind ab Herbst bei Microsoft Surface, ASUS, Dell, HP, Lenovo und MSI erhältlich.
Die DGX Station für Windows ist der leistungsstärkste mobile KI-Supercomputer für die Entwicklung und den Betrieb von Agenten in Windows-Unternehmensanwendungen und -Workflows. Ausgestattet mit dem NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip, bis zu 748 GB kohärentem Speicher und 20 Petaflops FP4-Leistung, führt sie hochmoderne Modelle mit bis zu einer Billion Parametern für permanent aktive Unternehmensagenten aus. Systeme von ASUS, Dell, GIGABYTE, HP, MSI und Supermicro werden im vierten Quartal erwartet. Beide Produkte nutzen NVIDIA OpenShell, eine von Grund auf sichere Laufzeitumgebung für autonome Agenten.
Lesen Sie mehr dazu in diesem Microsoft-Blog: „ Ein neues, leistungsstarkes Kapitel für Windows-PCs, beschleunigt durch NVIDIA RTX Spark “
Agentische Workflows im Unternehmensmaßstab mit NVIDIA Open Models auf Microsoft Foundry ermöglichen

Agentic AI basiert auf einem System von Modellen. Dank der Modelle von NVIDIA, Anthropic und OpenAI sowie der speziellen Hermes-Agenten, die jetzt auf den gehosteten Agenten im Foundry Agent Service verfügbar sind, können Unternehmen agentenbasierte Systeme mit integrierter Identitäts- und Governance-Funktionalität auf Azure implementieren. Die Claude-Modelle von Anthropic laufen nun nativ auf NVIDIA GB300 Blackwell Ultra-Systemen auf Azure und werden in den kommenden Wochen für Kunden verfügbar sein.
NVIDIA Nemotron 3 Ultra, ein neues, offenes Frontier-Reasoning-Modell für langlaufende Agenten in Programmier-, Forschungs- und Unternehmens-Workflows, ist ab diesem Monat auf Foundry Managed Compute verfügbar, zusammen mit Nemotron 3.5 ASR für Spracherkennung und Nemotron 3.5 Content Safety. Entwickler können Nemotron mit Frontier- und lokalen Modellen kombinieren und so Kosten und Qualität für jeden Workflow optimieren.
Das offene Modellportfolio von NVIDIA auf Foundry umfasst nun agentenbasierte, physikalische und wissenschaftliche KI. NVIDIA Cosmos 3 , das erste vollständig offene Omnimodell für physikalische KI, bietet Bildverarbeitung, Weltsimulation und Aktionsgenerierung. Die KI-Wettermodelle von NVIDIA Earth-2 sind über Microsoft Planetary Computer Pro und Foundry für Unternehmensprognosen und Risikoanalysen verfügbar.
NVIDIA Agent Toolkit und NVIDIA NemoClaw Blueprints bieten Entwicklern eine Open-Source-Plattform zum Erstellen von Produktionsagenten auf Foundry. NVIDIA CUDA-X-Bibliotheken wie cuDF, cuOpt, AI-Q und NeMo stehen Agenten nun als domänenspezifische Skills zur Verfügung.
Erfahren Sie mehr in dieser Build-Breakout-Session: „ Orchestrieren von Spezialagenten mit NVIDIA Nemotron-Modellen auf Microsoft Foundry “.
Beschleunigung von Enterprise Data Warehouses für das KI-Zeitalter
Daten sind die Grundlage für agentenbasierte KI, und ein schneller Zugriff darauf ist entscheidend.
Die NVIDIA-beschleunigte Datenverarbeitung ist jetzt in Microsoft Fabric Data Warehouse integriert. Laut internen Benchmarks von Microsoft ist die SQL-Ausführung bis zu 6-mal schneller als bei der CPU-basierten Basislösung und bis zu 7-mal schneller als bei drei anderen führenden Cloud-Data-Warehouse-Anbietern für Workloads mit hoher Parallelität.
Die Enterprise-Datenschicht kann nun mit KI-Agenten Schritt halten, die kontinuierlich Daten abfragen und analysieren. Dies ist das Ergebnis jahrelanger intensiver technischer Zusammenarbeit zwischen NVIDIA und Microsoft, von der Forschung bis zur Produktion.
Lesen Sie mehr dazu in diesem Microsoft-Blog: „ Microsoft Build 2026: Entwicklung agentenbasierter Anwendungen mit Microsoft Fabric und Microsoft-Datenbanken “.
Fortschritte bei physikalischer KI und autonomen Systemen
Physikalische KI ist die nächste Herausforderung für Agenten.
Microsoft integriert NVIDIAs Open-Source-KI-Funktionen und -Tools für physikalische Anwendungen in Azure und dessen Physical AI Toolchain . Entwickler erhalten so eine einheitliche Plattform, basierend auf der Mixture-of-Transformers-Architektur von Cosmos 3, um autonome Systeme wie Roboter, autonome Fahrzeuge und industrielle Systeme zu simulieren, zu trainieren und einzusetzen. Diese Systeme können in der Lage sein, die physikalische Welt wahrzunehmen, zu analysieren, zu planen und zu handeln. Cosmos 3 belegt bei wichtigen Benchmarks für Bildverarbeitung, Weltgenerierung und Aktionsgenerierung den ersten Platz unter den offenen Modellen.
Erweiterung von Azure Local und Foundry Local mit NVIDIA RTX PRO 6000 Blackwell Server Edition und Nemotron-Modellen
Agentic AI geht über die Cloud hinaus.
Microsoft bringt Foundry Local auf Azure Local auf die NVIDIA RTX PRO 6000 Blackwell Server Edition Plattform. In Kombination mit der offenen Modellfamilie NVIDIA Nemotron können Unternehmen leistungsstarke KI-Workloads dort ausführen, wo sich ihre Daten befinden – ob in lokalen, hybriden oder souveränen Umgebungen – ohne Kompromisse bei Leistung oder Governance.
Foundry Local auf Azure Local unterstützt jetzt Multi-Node-Bereitstellungen und die vLLM-Laufzeitumgebung und ermöglicht so die Skalierung der Inferenz für die Bereiche Fertigung, Energie, souveräne Rechenzentren und andere latenzempfindliche Szenarien.
Weitere Informationen finden Sie in diesen Microsoft-Blogs: „ Die Möglichkeiten physischer KI mit Foundry Local und Azure Local ausschöpfen “ und „ Lokale KI mit Foundry Local auf Azure Local skalieren “.
Sichere Agentenentwicklung auf GitHub Copilot mit NVIDIA OpenShell
Wenn Agenten von der Unterstützung bei der Codierung zur autonomen Ausführung übergehen, benötigen sie echte Fähigkeiten ohne echte Anmeldeinformationen.
NVIDIA OpenShell, jetzt in GitHub Copilot integriert, löst dieses Problem: Jeder Agent läuft isoliert in einem eigenen Sandbox-Container, und jeder ausgehende Anruf wird anhand von Richtlinien geprüft, bevor er auf Dateien, Netzwerke oder Anmeldeinformationen zugreifen kann. Richtlinien werden als Code geschrieben, im Repository versioniert und können dynamisch aktualisiert werden. OpenShell ist Open Source unter der Apache-2.0-Lizenz, modellunabhängig und für On-Premise-, Hybrid- und Cloud-Umgebungen geeignet.
Erfahren Sie mehr in dieser Build Lightning-Session: „ Sichere Agenten-Workflows mit GitHub Copilot und NVIDIA OpenShell “ .
Fairwater Wisconsin geht live, validiert für NVIDIA Vera Rubin

Microsofts KI-Rechenzentrum in Fairwater, Wisconsin, ist – früher als geplant – in Betrieb und betreibt Hunderttausende NVIDIA Grace Blackwell-Systeme als zentrales KI-Netzwerk. Dieses ist mit einem ähnlichen Rechenzentrum in Georgia verbunden, um ein skalierbares und verteiltes KI-System für anspruchsvollste Zukunftsmodelle bereitzustellen. Durch gemeinsame Entwicklungsarbeit in den Bereichen Stromversorgung, Kühlung, NVIDIA Spectrum-X Ethernet und dem neuen Transportprotokoll Multipath Reliable Connection (MRC) optimiert Microsofts KI-Rechenzentrum in Fairwater die Token-Ökonomie.
Darüber hinaus hat Microsoft die NVIDIA Vera Rubin Plattform, die sich nun im vollen Produktionsbetrieb befindet , bereits für den Einsatz in Azure-Rechenzentren validiert.
Vera Rubin lässt sich ohne Nachrüstungen nahtlos in Blackwell integrieren und bietet eine bis zu zehnmal höhere Inferenzleistung pro Megawatt bei gleichzeitiger Reduzierung der Kosten pro Agenten-Token um eine Größenordnung. Die integrierte NVIDIA Confidential Computing-Funktion schützt Modelle und Daten, während Agenten in großem Umfang arbeiten. Das NVIDIA Dynamo- Inferenzframework erweitert diese Vorteile auf Software, beschleunigt den Kaltstart von Modellen auf AKS und ermöglicht die Kubernetes-native, verteilte Inferenzorchestrierung über NVIDIA Grove .
