Zum Hauptinhalt springen

Siri 2.0 mit Google Gemini: Was sich auf dem iPhone tatsächlich ändert

Was passiert: Apple wird Google-Gemini-Modelle zur Steuerung des neuen Siri nutzen, Berichten zufolge gegen eine jährliche Zahlung von 1 Mrd. $ (~0,92 Mrd. €).

Warum es wichtig ist: Siri wandelt sich von einem Sprachassistenten zu einem kontextbewussten KI-Agenten, der den Bildschirm, Nutzergewohnheiten und mehrstufige Aufgaben versteht.

Datenschutz-Abwägung: On-Device-Verarbeitung für die meisten Abfragen. Cloud-Fallback erfolgt über Private Cloud Compute (flüchtig, verschlüsselt, keine Protokolle).

Risiko: Apple überträgt eine Kernkompetenz der KI an einen Drittanbieter. Sollte die Partnerschaft scheitern, verfügt Siri über keine Ersatz-Engine.

Status: Ankündigung wird auf der WWDC26 (8.–12. Juni 2026) erwartet.


Das Problem mit Siri (und warum Apple Gemini kauft) #

Siri ist seit über einem Jahrzehnt ein Running Gag. Während ChatGPT, Gemini und Copilot zu leistungsfähigen KI-Assistenten gereift sind, blieb Siri ein sprachgesteuerter Suchdienst mit gelegentlichen nützlichen Funktionen.

Interne Apple-Dokumente aus dem späten Jahr 2025 zeigten, dass selbst Mitarbeiter Siri in iOS 26.4 als „langsam und unzuverlässig“ empfanden. Die Lücke zwischen den KI-Ambitionen von Apple und den tatsächlichen Fähigkeiten von Siri wurde unübersehbar.

Apples Lösung besteht darin, Google-Gemini-Modelle zu lizenzieren, anstatt eine eigene Frontier-KI von Grund auf neu zu entwickeln.


Was Gemini innerhalb von Siri bewirkt #

Kontextbewusste Konversationen #

Das neue Siri kann den Kontext über mehrere Gesprächsrunden hinweg beibehalten. Es ist nicht erforderlich, sich zu wiederholen oder jede Frage umzuformulieren. Das System erinnert sich an das Besprochene und baut darauf auf.

Bildschirmverständnis #

Siri erhält die Fähigkeit, den Inhalt des Bildschirms zu sehen und zu interpretieren. Wenn man sich in Maps ein Restaurant ansieht, kann man fragen: „Wie sind deren Öffnungszeiten?“, ohne den Namen des Restaurants zu nennen. Siri erkennt den Kontext automatisch.

Ausführung mehrstufiger Aufgaben #

Anstatt nur einen Befehl nach dem anderen zu verarbeiten, kann Siri 2.0 Aktionen verketten: „Buche einen Tisch für zwei Personen in diesem Restaurant für Freitagabend und schicke Sarah dann die Adresse per SMS.“ Ein Befehl, mehrere sequenziell ausgeführte Aktionen.

On-Device-Reasoning #

Apples Strategie ist es, eine destillierte Version von Gemini direkt auf der Neural Engine des iPhones auszuführen. Die meisten alltäglichen Abfragen bleiben auf dem Gerät. Komplexe Abfragen, die eine Cloud-Verarbeitung erfordern, werden an Private Cloud Compute gesendet.


Die Datenschutzfrage #

In diesem Punkt unterscheidet sich Apples Ansatz grundlegend von Google und Microsoft.

On-Device-First #

Die Mehrheit der Siri-Abfragen wird lokal auf dem iPhone verarbeitet. Die Daten verlassen das Gerät nicht. Es gibt keine Cloud-Daten, die kompromittiert werden könnten.

Private Cloud Compute (PCC) #

Wenn eine Abfrage die Kapazitäten des Geräts überschreitet, wird sie an Apples Private Cloud Compute-Server gesendet:

  • Die Daten sind Ende-zu-Ende verschlüsselt.
  • Die Verarbeitung erfolgt auf Apple Silicon.
  • Die Daten werden sofort nach der Verarbeitung gelöscht.
  • Es werden keine Protokolle gespeichert.
  • Unabhängige Sicherheitsforscher können den Code auditieren.

Google sieht nichts #

Wenn Gemini eine Abfrage über PCC verarbeitet, erhält Google keine personenbezogenen Daten. Apple fungiert als Datenschutzschild, indem IP-Adressen und Identifikatoren maskiert werden. Der Nutzer wird vor jeder Datenweitergabe an externe Anbieter explizit um Zustimmung gebeten.


Die praktische Umsetzung #

Vorher (Siri im Jahr 2025) #

  • „Hey Siri, stelle einen Timer auf 10 Minuten“ — funktioniert.
  • „Hey Siri, finde Restaurants in meiner Nähe“ — einfache Suche.
  • „Hey Siri, fasse diese E-Mail zusammen“ — nicht verfügbar.
  • „Hey Siri, buche einen Flug und füge ihn meinem Kalender hinzu“ — unmöglich.

Nachher (Siri 2.0 mit Gemini) #

  • „Hey Siri, stelle einen Timer auf 10 Minuten“ — funktioniert (unverändert).
  • „Hey Siri, finde Restaurants in meiner Nähe, die jetzt geöffnet haben und Außenplätze bieten“ — kontextbasierte Suche mit Filtern.
  • „Hey Siri, fasse diese E-Mail zusammen und entwirf eine Antwort“ — mehrstufig mit Bildschirmkontext.
  • „Hey Siri, buche einen Flug nach Barcelona für nächsten Donnerstag unter 200 € und füge ihn meinem Kalender hinzu“ — Aufgaben auf Agenten-Ebene.

Das Risiko für Apple #

Abhängigkeit von Google #

Apple zahlt 0,92 Mrd. € pro Jahr für eine Fähigkeit, die es nicht selbst kontrolliert. Sollte Google die Lizenzbedingungen ändern, die Preise erhöhen oder den Zugang einschränken, bricht Apples KI-Strategie über Nacht zusammen.

Wettbewerbsbedingte Schwäche #

Google kann Gemini-Funktionen auf Android anbieten, die Siri auf iOS nicht erreichen kann, da Google sowohl das Modell als auch die Plattform kontrolliert. Apple ist Kunde, kein Entwickler.

Die „Genug ist gut“-Falle #

Wenn die von Gemini unterstützte Siri lediglich „gut genug“ statt außergewöhnlich ist, werden Nutzer für ernsthafte KI-Aufgaben weiterhin ChatGPT oder die Gemini-Apps verwenden. Siri wird dann lediglich eine Komfortschicht, aber kein primäres KI-Werkzeug.


Was Apple richtig macht #

Hardware-Software-Integration #

Kein anderes Unternehmen kann ein destilliertes Gemini-Modell mit der Effizienz von Apple auf einem mobilen Chip ausführen. Die Neural Engine im A19 Pro ist speziell für diese Arbeitslast konzipiert.

Installierte Basis #

2,5 Milliarden aktive iOS-Geräte. Selbst eine mittelmäßige Siri 2.0 wird am ersten Tag der Veröffentlichung der am weitesten verbreitete KI-Agent der Welt sein.

Vertrauen #

Apples Marke basiert auf Datenschutz und Sicherheit. Nutzer, die Google niemals ihre Daten anvertrauen würden, werden Siri vertrauen — weil es „Apples KI“ ist, die auf „ihrem Gerät“ verarbeitet wird.


Fazit #

Die Integration von Siri 2.0 und Gemini ist kein technischer Durchbruch. Es ist ein strategischer Wendepunkt: Apple gibt zu, dass es Frontier-KI nicht allein entwickeln kann, und entscheidet sich dafür, das beste verfügbare Modell zu lizenzieren und gleichzeitig seine Datenschutzarchitektur beizubehalten.

Für die Nutzer ist die praktische Auswirkung erheblich: Siri wird endlich für komplexe Aufgaben nützlich. Für die Branche signalisiert es, dass es im KI-Wettlauf nicht mehr darum geht, wer das beste Modell baut, sondern wer es am sichersten integriert.

Die WWDC26 (8.–12. Juni) wird entscheiden, ob dieses Wagnis aufgeht.


Verwandte Artikel #


Quellen #