Back to Browse

Lumeric Briefing · 2026-05-07

7 views
May 7, 2026
5:35

Google dominiert heute mit TPU-8, Project-Mariner-Ende und Remy-Agent – während Anthropics $200B-Google-Cloud-Deal und DeepSeeks $45B-Bewertung die Kapitalrunde im KI-Infrastrukturrennen markieren. Dazu: Praxis-Tools für Agenten-Memory, Bildverarbeitung und Validierung. Googles heutiger Nachrichtentag lässt sich als konzentrierte Infrastruktur-Offensive lesen. Mit der achten TPU-Generation präsentiert das Unternehmen zwei spezialisierte Chips: Der TPU 8t ist auf massives Training ausgerichtet — ein einzelner Superpod skaliert auf 9.600 Chips und zwei Petabyte gemeinsamen Hochbandbreitenspeichers, mit nahezu dreifacher Rechenleistung gegenüber der Vorgängergeneration und der Fähigkeit, linear auf eine Million Chips in einem lokalen Cluster zu skalieren. Der TPU 8i hingegen adressiert Inferenz und Agenten-Loops: 288 GB Speicher, halbierter Netzwerkdurchmesser durch die neue Boardfly-Architektur und 80 Prozent bessere Performance pro Dollar. Parallel dazu wird Project Mariner eingestellt — der eigenständige Web-Agenten-Assistent, der seit Dezember 2024 lief und zuletzt bis zu zehn parallele Aufgaben übernehmen konnte, ist seit dem 4. Mai Geschichte. Seine Technologie fließt in Gemini Agent und AI Mode ein. Das Muster ist unverkennbar: Experimente werden konsolidiert, Kapazitäten gebündelt — passend zum Google I/O-Termin am 19. Mai. In dieses Bild fügt sich der interne Agenten-Test Remy nahtlos ein. Laut einem internen Dokument und zwei mit dem Projekt vertrauten Personen wird der "24/7 personal agent" derzeit als Dog-fooding-Projekt unter Google-Mitarbeitern getestet. Remy soll sich tief in Google-Dienste integrieren, Nutzerpräferenzen erlernen und komplexe Aufgaben eigenständig erledigen — explizit mit dem Anspruch, Kontrolle und Transparenz in den Vordergrund zu stellen. Googles eigene Research-Leitlinien, auf die der Bericht verweist, fordern klar definierte menschliche Kontrolleure, beobachtbare Aktionen und das Prinzip minimaler Rechtevergabe. Technische Details zur Architektur oder zum Autonomiegrad wurden nicht veröffentlicht. Ob und wann Remy öffentlich ausgerollt wird, ist offen. Während Google seine Plattform-Strategie verfestigt, werden die Kapitalströme im breiteren KI-Infrastrukturrennen immer gigantischer. Anthropic verpflichtet sich über fünf Jahre zu rund 200 Milliarden Dollar Cloud-Ausgaben bei Google — das entspricht etwa 40 Prozent von Googles gesamtem Cloud-Backlog. Zusammen mit OpenAI macht Anthropic damit ungefähr die Hälfte der zwei Billionen Dollar an committed revenue aus, die bei Amazon, Microsoft, Google und Oracle gebunden sind. Die Frage, ob die angestrebten 20- bis 30-fachen Umsatzsteigerungen bis 2029 diese Verpflichtungen tragen können, bleibt der entscheidende Stresstest für das Geschäftsmodell großer KI-Startups. Auf der anderen Seite des Pazifiks setzt DeepSeek mit einer Finanzierungsrunde auf rund 45 Milliarden Dollar Bewertung ein Gegenzeichen: Chinas staatlicher Chip-Fonds führt die Runde an — ein klares Signal tiefer staatlicher Unterstützung für heimische Modellentwickler im Wettbewerb mit US-amerikanischen Konkurrenten. Auf Modell- und Stack-Ebene reagiert die Industrie auf die wachsende Komplexität von Agenten-Pipelines mit Integrationsversuchen. NVIDIAs Nemotron 3 Nano Omni — angekündigt am 28. April 2026 — positioniert sich als einheitliches Wahrnehmungs- und Reasoning-Modell für Agenten-Workflows: Video, Audio, Bild und Text werden gemeinsam verarbeitet, statt über separate Spezialmodelle…

Download

0 formats

No download links available.

Lumeric Briefing · 2026-05-07 | NatokHD