NVIDIA kooperiert mit Microsoft bei der Entwicklung einer einheitlichen Plattform für die Bereitstellung agentenbasierter KI - MYC Media

Die Zeit für agentenbasierte KI ist gekommen, doch um ihr Potenzial voll auszuschöpfen, braucht es mehr als gute Modelle. Dazu gehören auch leistungsstarke Hardware, sichere Laufzeitumgebungen, eine reaktionsschnelle Datenschicht und Modelle, die für langfristiges logisches Denken optimiert sind. NVIDIA und Microsoft stellen Entwicklern diese Komplettlösung für Windows-Geräte, die Azure-Cloud und lokale Installationen zur Verfügung.

Auf der Microsoft Build nahm NVIDIA-Gründer und CEO Jensen Huang per Livestream aus Taipeh an der Keynote von Microsoft-Chef Satya Nadella teil, um über die erweiterte Partnerschaft zu sprechen: NVIDIA RTX Spark und DGX Station für Windows, NVIDIA GPU-beschleunigtes Microsoft Fabric, NVIDIA Open-Modelle auf Microsoft Foundry, die sichere Laufzeitumgebung NVIDIA OpenShell in GitHub Copilot und die nächste Generation von NVIDIA-gestützten KI-Fabriken.

Windows für Agenten neu erfinden: Von RTX Spark zu DGX Station für Windows

NVIDIA und Microsoft gestalten Windows-PCs für das Zeitalter der KI-Agenten neu. Mit RTX Spark Laptops und kleinen Desktop-PCs sowie den mobilen KI-Supercomputern DGX Station für Windows können Entwickler Agenten nativ unter Windows erstellen, optimieren und ausführen.

RTX Spark markiert einen Neuanfang und treibt die weltweit ersten Windows-PCs an, die speziell für persönliche Assistenten entwickelt wurden. Sie bieten eine KI-Leistung von 1 Petaflop, bis zu 128 GB Arbeitsspeicher, ganztägige Akkulaufzeit und volle KI- und Grafikleistung auch im Akkubetrieb. Die Systeme, die auf über 30 Jahren NVIDIA-Innovation basieren, darunter CUDA, RTX, DLSS und TensorRT, sind ab Herbst bei Microsoft Surface, ASUS, Dell, HP, Lenovo und MSI erhältlich.

Die DGX Station für Windows ist der leistungsstärkste mobile KI-Supercomputer für die Entwicklung und den Betrieb von Agenten in Windows-Unternehmensanwendungen und -Workflows. Ausgestattet mit dem NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip, bis zu 748 GB kohärentem Speicher und 20 Petaflops FP4-Leistung, führt sie hochmoderne Modelle mit bis zu einer Billion Parametern für permanent aktive Unternehmensagenten aus. Systeme von ASUS, Dell, GIGABYTE, HP, MSI und Supermicro werden im vierten Quartal erwartet. Beide Produkte nutzen NVIDIA OpenShell, eine von Grund auf sichere Laufzeitumgebung für autonome Agenten.

Lesen Sie mehr dazu in diesem Microsoft-Blog: „ Ein neues, leistungsstarkes Kapitel für Windows-PCs, beschleunigt durch NVIDIA RTX Spark “

Agentische Workflows im Unternehmensmaßstab mit NVIDIA Open Models auf Microsoft Foundry ermöglichen

Agentic AI basiert auf einem System von Modellen. Dank der Modelle von NVIDIA, Anthropic und OpenAI sowie der speziellen Hermes-Agenten, die jetzt auf den gehosteten Agenten im Foundry Agent Service verfügbar sind, können Unternehmen agentenbasierte Systeme mit integrierter Identitäts- und Governance-Funktionalität auf Azure implementieren. Die Claude-Modelle von Anthropic laufen nun nativ auf NVIDIA GB300 Blackwell Ultra-Systemen auf Azure und werden in den kommenden Wochen für Kunden verfügbar sein.

NVIDIA Nemotron 3 Ultra, ein neues, offenes Frontier-Reasoning-Modell für langlaufende Agenten in Programmier-, Forschungs- und Unternehmens-Workflows, ist ab diesem Monat auf Foundry Managed Compute verfügbar, zusammen mit Nemotron 3.5 ASR für Spracherkennung und Nemotron 3.5 Content Safety. Entwickler können Nemotron mit Frontier- und lokalen Modellen kombinieren und so Kosten und Qualität für jeden Workflow optimieren.

Das offene Modellportfolio von NVIDIA auf Foundry umfasst nun agentenbasierte, physikalische und wissenschaftliche KI. NVIDIA Cosmos 3 , das erste vollständig offene Omnimodell für physikalische KI, bietet Bildverarbeitung, Weltsimulation und Aktionsgenerierung. Die KI-Wettermodelle von NVIDIA Earth-2 sind über Microsoft Planetary Computer Pro und Foundry für Unternehmensprognosen und Risikoanalysen verfügbar.

NVIDIA Agent Toolkit und NVIDIA NemoClaw Blueprints bieten Entwicklern eine Open-Source-Plattform zum Erstellen von Produktionsagenten auf Foundry. NVIDIA CUDA-X-Bibliotheken wie cuDF, cuOpt, AI-Q und NeMo stehen Agenten nun als domänenspezifische Skills zur Verfügung.

Erfahren Sie mehr in dieser Build-Breakout-Session: „ Orchestrieren von Spezialagenten mit NVIDIA Nemotron-Modellen auf Microsoft Foundry “.

Beschleunigung von Enterprise Data Warehouses für das KI-Zeitalter

Daten sind die Grundlage für agentenbasierte KI, und ein schneller Zugriff darauf ist entscheidend.

Die NVIDIA-beschleunigte Datenverarbeitung ist jetzt in Microsoft Fabric Data Warehouse integriert. Laut internen Benchmarks von Microsoft ist die SQL-Ausführung bis zu 6-mal schneller als bei der CPU-basierten Basislösung und bis zu 7-mal schneller als bei drei anderen führenden Cloud-Data-Warehouse-Anbietern für Workloads mit hoher Parallelität.

Die Enterprise-Datenschicht kann nun mit KI-Agenten Schritt halten, die kontinuierlich Daten abfragen und analysieren. Dies ist das Ergebnis jahrelanger intensiver technischer Zusammenarbeit zwischen NVIDIA und Microsoft, von der Forschung bis zur Produktion.

Lesen Sie mehr dazu in diesem Microsoft-Blog: „ Microsoft Build 2026: Entwicklung agentenbasierter Anwendungen mit Microsoft Fabric und Microsoft-Datenbanken “.

Fortschritte bei physikalischer KI und autonomen Systemen

Physikalische KI ist die nächste Herausforderung für Agenten.

Microsoft integriert NVIDIAs Open-Source-KI-Funktionen und -Tools für physikalische Anwendungen in Azure und dessen Physical AI Toolchain . Entwickler erhalten so eine einheitliche Plattform, basierend auf der Mixture-of-Transformers-Architektur von Cosmos 3, um autonome Systeme wie Roboter, autonome Fahrzeuge und industrielle Systeme zu simulieren, zu trainieren und einzusetzen. Diese Systeme können in der Lage sein, die physikalische Welt wahrzunehmen, zu analysieren, zu planen und zu handeln. Cosmos 3 belegt bei wichtigen Benchmarks für Bildverarbeitung, Weltgenerierung und Aktionsgenerierung den ersten Platz unter den offenen Modellen.

Erweiterung von Azure Local und Foundry Local mit NVIDIA RTX PRO 6000 Blackwell Server Edition und Nemotron-Modellen

Agentic AI geht über die Cloud hinaus.

Microsoft bringt Foundry Local auf Azure Local auf die NVIDIA RTX PRO 6000 Blackwell Server Edition Plattform. In Kombination mit der offenen Modellfamilie NVIDIA Nemotron können Unternehmen leistungsstarke KI-Workloads dort ausführen, wo sich ihre Daten befinden – ob in lokalen, hybriden oder souveränen Umgebungen – ohne Kompromisse bei Leistung oder Governance.

Foundry Local auf Azure Local unterstützt jetzt Multi-Node-Bereitstellungen und die vLLM-Laufzeitumgebung und ermöglicht so die Skalierung der Inferenz für die Bereiche Fertigung, Energie, souveräne Rechenzentren und andere latenzempfindliche Szenarien.

Weitere Informationen finden Sie in diesen Microsoft-Blogs: „ Die Möglichkeiten physischer KI mit Foundry Local und Azure Local ausschöpfen “ und „ Lokale KI mit Foundry Local auf Azure Local skalieren “.

Sichere Agentenentwicklung auf GitHub Copilot mit NVIDIA OpenShell

Wenn Agenten von der Unterstützung bei der Codierung zur autonomen Ausführung übergehen, benötigen sie echte Fähigkeiten ohne echte Anmeldeinformationen.

NVIDIA OpenShell, jetzt in GitHub Copilot integriert, löst dieses Problem: Jeder Agent läuft isoliert in einem eigenen Sandbox-Container, und jeder ausgehende Anruf wird anhand von Richtlinien geprüft, bevor er auf Dateien, Netzwerke oder Anmeldeinformationen zugreifen kann. Richtlinien werden als Code geschrieben, im Repository versioniert und können dynamisch aktualisiert werden. OpenShell ist Open Source unter der Apache-2.0-Lizenz, modellunabhängig und für On-Premise-, Hybrid- und Cloud-Umgebungen geeignet.

Erfahren Sie mehr in dieser Build Lightning-Session: „ Sichere Agenten-Workflows mit GitHub Copilot und NVIDIA OpenShell “ .

Fairwater Wisconsin geht live, validiert für NVIDIA Vera Rubin

Microsofts KI-Rechenzentrum in Fairwater, Wisconsin, ist – früher als geplant – in Betrieb und betreibt Hunderttausende NVIDIA Grace Blackwell-Systeme als zentrales KI-Netzwerk. Dieses ist mit einem ähnlichen Rechenzentrum in Georgia verbunden, um ein skalierbares und verteiltes KI-System für anspruchsvollste Zukunftsmodelle bereitzustellen. Durch gemeinsame Entwicklungsarbeit in den Bereichen Stromversorgung, Kühlung, NVIDIA Spectrum-X Ethernet und dem neuen Transportprotokoll Multipath Reliable Connection (MRC) optimiert Microsofts KI-Rechenzentrum in Fairwater die Token-Ökonomie.

Darüber hinaus hat Microsoft die NVIDIA Vera Rubin Plattform, die sich nun im vollen Produktionsbetrieb befindet , bereits für den Einsatz in Azure-Rechenzentren validiert.

Vera Rubin lässt sich ohne Nachrüstungen nahtlos in Blackwell integrieren und bietet eine bis zu zehnmal höhere Inferenzleistung pro Megawatt bei gleichzeitiger Reduzierung der Kosten pro Agenten-Token um eine Größenordnung. Die integrierte NVIDIA Confidential Computing-Funktion schützt Modelle und Daten, während Agenten in großem Umfang arbeiten. Das NVIDIA Dynamo- Inferenzframework erweitert diese Vorteile auf Software, beschleunigt den Kaltstart von Modellen auf AKS und ermöglicht die Kubernetes-native, verteilte Inferenzorchestrierung über NVIDIA Grove .

Cookie	Dauer	Beschreibung
_gat	1 minute	This cookies is installed by Google Universal Analytics to throttle the request rate to limit the colllection of data on high traffic sites.
ADRUM_BT1		This cookie is used to optimize the visitor experience on the website by detecting errors on the website and share the information to support staff.
ADRUM_BTa		This cookie is used to optimize the visitor experience on the website by detecting errors on the website and share the information to support staff.

Cookie	Dauer	Beschreibung
_ga	2 years	This cookie is installed by Google Analytics. The cookie is used to calculate visitor, session, campaign data and keep track of site usage for the site's analytics report. The cookies store information anonymously and assign a randomly generated number to identify unique visitors.
_gid	1 day	This cookie is installed by Google Analytics. The cookie is used to store information of how visitors use a website and helps in creating an analytics report of how the website is doing. The data collected including the number visitors, the source where they have come from, and the pages visted in an anonymous form.
CONSENT	16 years 4 months 12 days 4 hours	These cookies are set via embedded youtube-videos. They register anonymous statistical data on for example how many times the video is displayed and what settings are used for playback.No sensitive data is collected unless you log in to your google account, in that case your choices are linked with your account, for example if you click “like” on a video.
UserID1	3 months	The cookie sets a unique anonymous ID for a website visitor. This ID is used to continue to identify users across different sessions and track their activities on the website. The data collected is used for analysis.

Cookie	Dauer	Beschreibung
test_cookie	15 minutes	doubleclick.net sets this cookie to determine if the user's browser supports cookies.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.
YSC	session	This cookies is set by Youtube and is used to track the views of embedded videos.
yt-remote-connected-devices	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt-remote-device-id	never	YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt.innertube::nextId	never	This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.
yt.innertube::requests	never	This cookie, set by YouTube, registers a unique ID to store data on what videos from YouTube the user has seen.

Cookie	Dauer	Beschreibung
__Secure-ROLLOUT_TOKEN	6 months	Description is currently not available.
awpv11354	3 days	No description available.
AWSESS	session	No description available.
betterlinks_visitor	1 year	No description
cookielawinfo-checkbox-functional	1 year	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-others	1 year	No description
DPX	1 hour	No description
lc_4414043	30 minutes	No description
SameSite	session	No description available.
spbc_secfw_ip_wl	1 month	No description
srp	session	No description available.
VISITOR_PRIVACY_METADATA	5 months 27 days	Description is currently not available.

Cookie	Dauer	Beschreibung
__cf_bm	30 minutes	This cookie, set by Cloudflare, is used to support Cloudflare Bot Management.
yt-player-headers-readable	never	The yt-player-headers-readable cookie is used by YouTube to store user preferences related to video playback and interface, enhancing the user's viewing experience.
yt-remote-cast-installed	session	The yt-remote-cast-installed cookie is used to store the user's video player preferences using embedded YouTube video.
yt-remote-fast-check-period	session	The yt-remote-fast-check-period cookie is used by YouTube to store the user's video player preferences for embedded YouTube videos.
yt-remote-session-app	session	The yt-remote-session-app cookie is used by YouTube to store user preferences and information about the interface of the embedded YouTube video player.
yt-remote-session-name	session	The yt-remote-session-name cookie is used by YouTube to store the user's video player preferences using embedded YouTube video.
ytidb::LAST_RESULT_ENTRY_KEY	never	The cookie ytidb::LAST_RESULT_ENTRY_KEY is used by YouTube to store the last search result entry that was clicked by the user. This information is used to improve the user experience by providing more relevant search results in the future.

Diese Webseite verwendet Cookies