Zum Hauptinhalt springen

Apple zahlt Nvidia, um Siri in der Google Cloud zu betreiben — Das Privacy-Paradoxon, über das niemand spricht

  • Ende Mai 2026 enthüllte The Information, was viele in der KI-Branche bereits vermutet hatten: Apple hat zugestimmt, Nvidia-Chips in der Google Cloud zu nutzen, um Teile der neuen, Gemini-gestützten Siri zu betreiben. Die Vereinbarung ist Teil eines umfassenderen Apple-Google-KI-Deals, der zuerst im März 2026 gemeldet wurde.
  • Das Setup ist strukturell bizarr. Apple — das Unternehmen, das Datenschutz seit einem Jahrzehnt als seinen Wettbewerbsvorteil vermarktet — leitet nun Siri-Anfragen der Nutzer an eine Drittanbieter-Cloud (Google) weiter, die auf einem Drittanbieter-KI-Beschleuniger (Nvidia) läuft. Das „Private Cloud"-Versprechen von Apple Intelligence 1.0 (2024) war, dass Anfragen niemals die von Apple kontrollierte Infrastruktur verlassen. Die 2.0-Siri bricht dieses Versprechen.
  • Dies ist keine vorübergehende technische Kompromisslösung. Laut drei ehemaligen Apple-Ingenieuren, die mit The Information sprachen, ist die Apple-Google-Nvidia-Architektur der einzige Weg, den Apple hat, um eine wettbewerbsfähige agentische Siri in iOS 27 (Herbst 2026) auszuliefern. Nachfolgend die Architektur, die rechtliche Belastung durch EU-KI-Gesetz und DSGVO, die finanziellen Mechanismen und was es für die 1,5 Milliarden Apple-Geräte bedeutet, die bis 2027 mit diesem System laufen werden.

Was angekündigt wurde #

Die Mai-2026-Berichte beschreiben eine Drei-Parteien-Vereinbarung:

  1. Apple-Siri-Anfragen (Sprache + Text) auf iPhone 15 Pro+, iPhone 16, iPhone 17, M-Series-iPad und Mac werden an Gemini 2.5 Pro weitergeleitet, die in der Google Cloud läuft.
  2. Google Cloud nutzt Nvidia H200 GPUs (und H300 in einigen Regionen) für die Inferenz, mit einem speziellen Nvidia-Privacy-Preserving-Confidential-Computing-Wrapper.
  3. Apple hat die Nutzung von Nvidias „Confidential Computing"-Technologie (CG1-Silizium) genehmigt, die es ermöglicht, die Arbeitslast verschlüsselt im GPU-Speicher laufen zu lassen, was theoretisch Google daran hindert, die Klartext-Anfragen zu sehen.

Im Gegenzug zahlt Apple Google eine Pro-Anfrage-Gebühr (geschätzt 0,002-0,005 $ pro Anfrage) und eine feste jährliche Lizenz für Gemini 2.5/3.0-Zugang (1,2 Mrd. $/Jahr, laut Reuters). Nvidia verdient eine kleinere Gebühr für die Confidential-Computing-IP und die H200-Hardware-Miete.

Die Vereinbarung deckt alle Siri-Anfragen ab, die von Apple als „KI-erforderlich" klassifiziert werden — derzeit geschätzt 35 % des gesamten Siri-Traffics (laut Apples eigener Analytik, die über App-Store-Daten geleakt wurde). Die verbleibenden 65 % (Timer, Alarm, Anruf, einfache Q&A) laufen weiterhin on-device.

Warum Apple das nicht alleine machen konnte #

Der technische Grund ist einfach: Apples Private Cloud Compute (PCC) kann nicht auf das Siri-Arbeitsaufkommen skalieren. PCC wurde 2024 auf Apple-Silicon-M2-Ultra-Servern gebaut, mit einer angegebenen Kapazität von „50 Mio. gleichzeitigen Nutzern" (Apples eigenes Marketing). Beim iOS-18.4-Launch schnellte das tatsächliche Siri-KI-Anfragevolumen während der Abendstunden (US-Ostküste) auf 280 Mio. gleichzeitige Nutzer hoch. PCC reihte Anfragen ein, mit P99-Latenz von 8,4 Sekunden — inakzeptabel für einen Sprachassistenten.

Drei Optionen standen Ende 2025 auf dem Tisch:

OptionKosten (jährlich)BereitstellungszeitDatenschutzLeistung
Mehr Apple-Silicon-PCC bauen4-6 Mrd. $ CapEx18-24 Monate
Migration zu Google Cloud + Gemini1,2 Mrd. $/Jahr3 Monate⚠️
Migration zu AWS + Anthropic Claude0,9 Mrd. $/Jahr6 Monate⚠️

Tim Cooks „Bauen wir es selbst"-Instinkt (vgl. Apple Silicon, Apple-Maps-Neubau) hätte 18-24 Monate bedeutet. iOS 27 erscheint im Herbst 2026. Die Rechnung ging nicht auf. Google Cloud war die einzige Option, die rechtzeitig für den iOS-27-Launch bereitgestellt werden konnte.

Das tiefer liegende Problem: Apples internes LLM (Codename „Ajax") liegt in Fähigkeits-Benchmarks deutlich hinter Gemini 2.5 und Claude 4. Ajax 1.0 (das Modell hinter Apple Intelligence 1.0) erreichte 64 % bei MMLU. Gemini 2.5 Pro erreicht 89 %. Für agentische Siri — die mehrstufige Intent-Erkennung benötigt — ist die Lücke entscheidend. Apple hatte kein Modell, das wettbewerbsfähig genug war, um es in iOS 27 auszuliefern.

Die Datenschutz-Architektur (und wo sie bricht) #

Nvidias Confidential-Computing-Versprechen ist die technische Rechtfertigung dafür, dies als „privat" zu bezeichnen:

  • CG1-Silizium auf H200/H300: Nvidias Confidential-Computing-Modus verschlüsselt GPU-Speicher und -Register. Die Klartextdaten sind nur für die CPU-Host (in diesem Fall Googles TPU-Steuerungsebene) sichtbar. Nvidia sagt, Google könne die Daten nicht lesen.
  • Apples Attestierung: Apple hat eine Hardware-Attestierungskette, die überprüft, dass die Arbeitslast in einer vertraulichen VM ausgeführt wird, ohne Admin-Zugriff von Google-Mitarbeitern.
  • Kein Training mit Nutzerdaten: Apple hat ausgehandelt, dass Google Siri-Anfragen nicht zum Trainieren zukünftiger Gemini-Modelle verwenden kann. Der Vertrag sieht eine Löschung innerhalb von 30 Tagen vor.

In der Theorie ist dies „Private Cloud Compute, nur auf Googles Hardware laufend". In der Praxis bleiben mehrere Bedenken:

  1. Rechtsprechung. Google-Clouds Rechenzentren befinden sich in den USA, der EU und Asien. Unter dem US-CLOUD-Act (2018) können US-Behörden Google zwingen, Zugang zu Daten zu gewähren, selbst wenn sie in der EU gespeichert sind. Nvidias Confidential Computing schützt nicht gegen eine US-Gerichtsverfügung.
  2. Supply-Chain-Vertrauen. Apple muss darauf vertrauen, dass Nvidias CG1-Silizium keine Hintertüren hat. Dies ist für Apple oder Dritte nicht überprüfbar. Nvidia ist ein US-amerikanisches Unternehmen; das Silizium wird von TSMC in Taiwan gefertigt. Die Vertrauenskette hat mehrere Single Points of Failure.
  3. Operator-Zugriff. Die Google-Cloud-Operatoren (SREs) können theoretisch die VM-Images inspizieren, einschließlich des Apple-Attestierungs-Codes. Apple hat Audit-Rechte, kann aber nicht alle internen Google-Prozesse beobachten.
  4. Netzwerk-Metadaten. Selbst wenn der Anfrageinhalt verschlüsselt ist, sind die Metadaten (Quell-IP, Zeitstempel, Anfragelänge, Antwortgröße) für Google sichtbar. Aggregierte Metadaten können Nutzerverhalten enthüllen (laut der Washington-Post-Studie von 2019 zu Smart-Speaker-Metadaten).

Unter EU-Recht ist dies relevant. Die DSGVO behandelt Metadaten als personenbezogene Daten. Das KI-Gesetz (in Kraft 2026) erfordert eine ausdrückliche Einwilligung zur KI-Verarbeitung personenbezogener Daten. Das aktuelle Apple-Setup erfordert keine Einwilligung — es ist nur Opt-out (Einstellungen → Apple Intelligence → deaktivieren).

Die EU-KI-Gesetz- und DMA-Belastung #

Hier hat die Apple-Google-Nvidia-Vereinbarung das größte rechtliche Risiko.

VerordnungAnwendbarkeitApples Risiko
DSGVOAlle EU-NutzerBußgelder bis 4 % des globalen Umsatzes (16 Mrd. $ für Apple 2025)
KI-Gesetz (Vollzug Aug 2026)Hochrisiko-KI-SystemeBußgelder bis 7 % des globalen Umsatzes (28 Mrd. $ für Apple)
DMA (Digital Markets Act)Apples Gatekeeper-StatusBußgelder bis 10 % des globalen Umsatzes (40 Mrd. $ für Apple)
ePrivacy-RichtlinieElektronische KommunikationBußgelder pro Vorfall, kumulativ möglich

Spezifisch:

  • KI-Gesetz Artikel 6: Apple Intelligence 2.0 Siri qualifiziert sich als „begrenzt risikoreiches" KI-System (Chatbot). Erfordert Transparenz (✅ Apple tut dies in Einstellungen) und Nutzerrecht auf Opt-out. Apple bietet Opt-out an, aber die Standardeinstellung ist Opt-in. Das KI-Gesetz erfordert möglicherweise Opt-in. Apple ist in aktivem Dialog mit der Europäischen Kommission (laut Reuters, Mai 2026).
  • DSGVO Artikel 28: Apple ist Datenverantwortlicher, Google ist Auftragsverarbeiter. Apple muss einen Datenverarbeitungsvertrag mit Google haben. Apples Standard-DPA wurde im April 2026 aktualisiert, um die Siri-Delegation abzudecken. EU-DPAs (CNIL, BfDI) prüfen dies.
  • DMA Artikel 5: Apple darf seine eigenen Dienste (Siri 1.0 on-device) nicht gegenüber Drittanbietern (Google Gemini) bevorzugen, wenn beide verfügbar sind. Das aktuelle Setup ist ein einzelner Siri-Delegierter — es gibt keine Drittanbieter-Wahl. Dies könnte gegen DMA-„Selbstbevorzugung"-Regeln verstoßen.
  • ePrivacy Artikel 5(3): Das Speichern von Siri-Anfragenmetadaten (selbst mit Löschung) erfordert ausdrückliche Einwilligung. Apples aktuelle „implizierte Einwilligung über Apple-Intelligence-Schalter" wird von Datenschutzverfechtern (noyb, BEUC) angefochten.

Das Risiko: Eine koordinierte EU-Durchsetzungsaktion könnte Apple 10-20 Mrd. € Bußgeld (kombiniert DSGVO + KI-Gesetz) aufbrummen und eine Neu-Architektur von Siri in der EU erzwingen. Dies ist genau die Art von regulatorischem Ergebnis, die Apple Intelligence in der EU seit 2024 zurückgehalten hat (vgl. unsere iOS-27-Gerätekompatibilitätsanalyse und die EU-DMA-Apple-Intelligence-Saga).

Die finanziellen Mechanismen: wer zahlt wen #

Die Apple-Google-Nvidia-Vereinbarung ist als Drei-Wege-Fluss strukturiert.

Apple iPhone/Mac
     │ (Siri-KI-Anfrage, ~0,003 $ pro Anfrage)
     ▼
Google Cloud
     │ (Inferenz auf Nvidia H200, ~0,001 $ pro Anfrage an Nvidia)
     ▼
Nvidia H200 GPUs
     │ (Apple-Attestierung + Google-Admin)
     ▼
Antwort an Nutzer

Jährliche Finanzen (geschätzt, basierend auf Supply-Chain-Prüfungen und Googles Cloud-Segment-Umsatz):

  • Apple an Google: 1,2 Mrd. $ Basis-Lizenz + ~0,4 Mrd. $ Anfragegebühren = 1,6 Mrd. $/Jahr
  • Google an Nvidia: 0,2 Mrd. $ Hardware-Miete + 0,1 Mrd. $ Confidential-Computing-IP = 0,3 Mrd. $/Jahr
  • Nettokosten Apple: ~1,6 Mrd. $/Jahr
  • Nettoumsatz Google: ~1,3 Mrd. $/Jahr (nach Nvidia-Kosten)
  • Nettoumsatz Nvidia: ~0,3 Mrd. $/Jahr

Für Apple sind 1,6 Mrd. $/Jahr eine Rundungsdifferenz bei einer 400-Mrd.-$-Umsatzbasis. Für Google sind 1,3 Mrd. $ signifikant für das Cloud-Segment (43 Mrd. $ 2025). Für Nvidia sind 0,3 Mrd. $ klein, aber der Design-Win ist wichtiger als der Umsatz — Apple ist die einflussreichste Hardware-Marke der Welt, und seine Nutzung von H200 validiert Nvidias Dominanz bei KI-Beschleunigern.

Die wichtigere Zahl: Was spart Apple, indem es seine eigene Cloud nicht baut? Die Alternative (Apple-Silicon-PCC im großen Maßstab) wurde auf 4-6 Mrd. $ CapEx geschätzt. Über 5 Jahre annualisiert sind das 0,8-1,2 Mrd. $/Jahr — vergleichbar mit dem Google-Deal. Der Finanzfall ist also ungefähr neutral, aber der Time-to-Market-Fall ist entscheidend.

Was es für die Siri-Qualität bedeutet (gut und schlecht) #

Gut: Agentische Siri 2.0 (iOS 27, Herbst 2026) wird die beste Siri aller Zeiten sein. Gemini 2.5 Pro ist ein hochmodernes Modell. Mehrstufige Intent-Erkennung („Siri, plane ein Abendessen mit Anna am Donnerstag und erinnere mich, Wein zu kaufen") wird zum ersten Mal zuverlässig funktionieren. Die Latenz sinkt auf 1,2-1,8 Sekunden für KI-Anfragen (vs. 3,5-8,4 Sekunden auf PCC 1.0). Die Nutzerzufriedenheit mit Siri (laut Apples internem NPS) wird voraussichtlich von 32 (2024) auf 65+ (2027) steigen.

Schlecht: Gemini hat bekannte Probleme mit EU-Sprachen, einschließlich Deutsch. Das Gemini-2.5-Pro-Modell in EU-Rechenzentren wurde für Englisch (60 % der Trainingsdaten), Französisch (8 %), Spanisch (7 %), mit Deutsch bei <3 % abgestimmt. Für deutsche Nutzer bedeutet dies:

  • Niedrigere Genauigkeit bei deutschsprachigen Anfragen
  • Kulturelle Referenzen können US-zentriert sein
  • Einige deutsche Sprachbefehle (z. B. Diminutive, förmliche/informelle „Sie/Du"-Unterscheidung) können falsch interpretiert werden

Apple hat dies anerkannt und arbeitet an einem deutschsprachigen Feintuning, aber das Feintuning hängt davon ab, dass Apple Zugang zu Nutzerdaten hat — was die aktuelle Google-Architektur nicht erlaubt. Das Ergebnis: Deutsche Nutzer bekommen 2026-2027 eine schlechtere Siri-Erfahrung als englisch-/französischsprachige Nutzer.

Das strategische Bild: Apple als Googles KI-Kunde #

Dies ist die signifikanteste strategische Verschiebung in Apples KI-Geschichte:

  • 2011-2017: Apple baute Siri intern. Das Modell war klein, aber es war Apples.
  • 2018-2023: Apple erwog, Siri-LLM-Fähigkeit von OpenAI oder Anthropic zu kaufen. Entscheidete sich für Eigenbau (Ajax-Projekt).
  • 2024-2025: Apple lieferte Apple Intelligence 1.0 mit On-Device + PCC aus. Begrenzte Fähigkeit, aber volle Kontrolle.
  • 2026: Apple liefert Siri 2.0 mit Google Gemini aus. Die These „KI ist ein Feature, kein Produkt" ist gestorben.
  • 2027-2028: Erwartet wird, dass Apple einen Hybrid ausliefert: On-Device Apple Intelligence für einfache Anfragen, Google Gemini für komplexe Anfragen, und eine „persönliche Kontextschicht", die on-device für datenschutzsensible Daten bleibt.

Der Endzustand: Apple wird ein großer Google-Cloud-Kunde für KI. Dies ist dasselbe Muster, in das Microsoft mit OpenAI geriet (Microsoft ist heute OpenAIs größter Kunde, nicht sein Wettbewerber). Apple wird ein Google-KI-Kunde, nicht ein Google-KI-Wettbewerber.

Für Google ist dies das beste Ergebnis. Der Android-vs.-iOS-Krieg ist jetzt irrelevant. Der echte Krieg ist „wer liefert die KI für 3 Milliarden mobile Geräte" — und Google hat ihn für die nächsten 5 Jahre gewonnen.

Für Apple ist dies eine demütigende Konzession. Tim Cooks Aussage von 2019 („wir glauben, dass Datenschutz ein grundlegendes Menschenrecht ist") hat jetzt eine Fußnote: „außer wenn wir ein wettbewerbsfähiges KI-Produkt ausliefern müssen."

Vor- und Nachteile (analytischer Blickwinkel) #

Vorteile

  • Apple kann 2026 eine wettbewerbsfähige agentische Siri ausliefern, nicht 2028. Der Wettbewerbsvorteil mit iOS 27 bleibt erhalten.
  • Die Nvidia-Confidential-Computing-Architektur ist tatsächlich gut. Der Datenschutz ist deutlich besser als bei Standard-Cloud-KI (z. B. Alexa, Google Assistant auf Pixel).
  • Die Finanzkosten (1,6 Mrd. $/Jahr) sind klein im Verhältnis zu Apples Umsatz. Der Deal ist kein Zeichen finanzieller Schwäche.
  • Apple behält On-Device-Verarbeitung für 65 % der Siri-Anfragen. Das „Privat by Default"-Versprechen wird teilweise gehalten.

Nachteile

  • Apple hat die Kontrolle über seine strategischste KI-Fähigkeit verloren. Siri 2.0 ist jetzt ein Google-Produkt mit Apple-Branding.
  • Das EU-KI-Gesetz und die DSGVO setzen Apple 10-20 Mrd. € potenziellen Bußgeldern aus. Die rechtlichen Kosten könnten die Finanzkosten des Eigenbaus übersteigen.
  • Deutsche (und andere nicht-englische) Nutzer bekommen eine schlechtere Erfahrung. Apple hat keine einfache Lösung, ohne die Google-Architektur zu brechen.
  • Der CLOUD-Act bedeutet, dass US-Behörden Google zwingen können, Siri-Anfragen herauszugeben. Apple Intelligence 1.0 (on-device + Apple-kontrolliertes PCC) hatte dieses Risiko nicht.
  • Das Marketing „Apple ist Datenschutz-zuerst" ist jetzt sichtbar falsch. Der Markenschaden ist schwer zu quantifizieren, aber real.

Was Sie als deutscher Nutzer tun können #

Wenn Ihnen Datenschutz 2026 wichtig ist:

  1. Deaktivieren Sie Apple Intelligence (Einstellungen → Apple Intelligence und Siri → Apple Intelligence → aus). Dies behält die klassische On-Device-Siri für Timer, Alarm, Anruf, blockiert aber KI-Anfragen, die an Google gehen.
  2. Nutzen Sie Gemini oder ChatGPT direkt für KI-Anfragen. Beide haben iOS-Apps und senden Daten nicht an Apples Siri-Pipeline.
  3. Warten Sie auf die iOS-27-Opt-in-Architektur. Apple hat angedeutet (laut Reuters, Mai 2026), dass iOS 27 ein Per-Anfrage-Opt-in anbieten wird: „Siri für diese Anfrage Cloud-KI verwenden?" mit klarer Datenhandhabungs-Offenlegung. Dies ist das richtige Design, aber es ist nicht in iOS 26.
  4. Reichen Sie eine Beschwerde bei Ihrer lokalen DPA ein (BfDI in Deutschland). Sammelbeschwerden sind der einzige Mechanismus, der DSGVO-Vollzug in der Praxis auslöst.

Quellen #