Immer mehr Marketer stellen sich dieselbe Frage: Erscheint meine Marke wirklich in ChatGPT? Und die Frustration folgt schnell, denn wie soll man das messen? KI-Antworten erscheinen in keinem Dashboard, sie ändern sich jedes Mal, und kein klassisches SEO-Tool zeigt sie an. Das klingt beinahe unmessbar. Ist es aber nicht. KI-Sichtbarkeit wird messbar, sobald man sie in drei Schichten aufschlüsselt. Das ist die quantifizierbare Seite von GEO, dem umfassenderen Bereich, bei dem es darum geht, von KI-Systemen zitiert zu werden. Dieser Leitfaden erklärt diese KPI-Struktur, gestützt auf Studien, und zeigt, wie Sie noch heute beginnen können.
Warum das Messen von KI-Sichtbarkeit dringend ist
KI-Sichtbarkeit ist kein Randphänomen mehr, sie definiert die Grundlagen digitaler Sichtbarkeit neu. Gartner beschreibt seit 2024 generative KI als „substitutive Antwortmaschinen“: Systeme, die Suchanfragen übernehmen, die früher über Google liefen. Gartner relativiert seither, dass KI-Suche eher ergänzt als ersetzt, aber die Richtung ist klar.
Die Zahlen bestätigen das, auch wenn sie hauptsächlich aus internationalen (vor allem amerikanischen) Studien stammen und eher als Richtwerte denn als exakte Werte für den deutschsprachigen Raum zu verstehen sind:
- Laut Bain & Company (Februar 2025, Umfrage vom Dezember 2024) vertrauen rund 80 % der Nutzer KI-Zusammenfassungen mindestens 40 % der Zeit, und rund 60 % der Suchanfragen enden ohne Klick auf eine andere Website.
- Google AI Overviews erreichen laut TechCrunch (Juli 2025) rund 2 Milliarden Nutzer pro Monat.
- Das Pew Research Center (Juli 2025) stellte fest, dass Nutzer nur noch in 8 % der Fälle auf ein normales Suchergebnis klicken, wenn eine KI-Zusammenfassung erscheint, gegenüber 15 % ohne Zusammenfassung. Ahrefs maß eine um 58 % niedrigere Klickrate für das erste organische Ergebnis bei Vorhandensein eines AI Overview.
Das Fazit liegt nahe: Ein großer Teil Ihrer Zielgruppe erhält seine Antwort direkt von einer KI, ohne jemals auf einen Link zu klicken. Ob Ihre Marke in dieser Antwort erscheint oder nicht, bestimmt zum Teil Ihre Präsenz in der Kaufentscheidung. Und das können Sie nur durch Messen herausfinden. Den übergreifenden Rahmen finden Sie im Artikel der Unterschied zwischen GEO und SEO.
Warum KI-Sichtbarkeit so schwer zu messen ist
KI-Sichtbarkeit ist schwer zu messen, weil KI-Antworten nicht deterministisch sind: Dieselbe Frage liefert jedes Mal eine andere Antwort. Das ist die wichtigste Erkenntnis der gesamten Disziplin und der Grund, warum eine einmalige Überprüfung nichts taugt.
Eine Studie aus dem Jahr 2026 (Don't Measure Once) hat identische Prompts innerhalb derselben Stunde an dieselbe KI-Suchmaschine übermittelt. Die zitierten Quellen überschnitten sich nur zu 32 bis 43 %, die erwähnten Marken zu 33 bis 48 %. Anders gesagt: Wenn Sie heute einmalig abfragen, ob ChatGPT Ihre Marke zitiert, kann die Antwort wenige Minuten später bereits wesentlich anders ausfallen. Die Variation innerhalb eines einzigen Tages ist ähnlich groß wie die zwischen verschiedenen Tagen, was zeigt, dass sie hauptsächlich vom Modell selbst stammt und nicht von einem Algorithmus-Update.
Die praktischen Konsequenzen sind erheblich:
- Eine einzelne Messung sagt nichts aus. Ihre KI-Sichtbarkeit ist keine feste Position, sondern eine Wahrscheinlichkeitsverteilung. Sie messen sie nur zuverlässig, indem Sie denselben Prompt wiederholt stellen.
- Markenerwähnungen sind stabiler als einzelne Quell-URLs. In derselben Studie wechselten 58 bis 66 % der zitierten Quellen von Tag zu Tag, während Markensets stabiler blieben (45 bis 59 % Überschneidung). Konzentrieren Sie sich daher zuerst auf Markenerwähnungen, nicht auf einzelne Links.
Genau deshalb ist automatisiertes, wiederholtes Monitoring kein Luxus, sondern eine Messbedingung. Veesie misst jeden Prompt wiederholt über vier KI-Modelle, für Marketer und Agenturen, damit Sie einen stabilen Durchschnitt sehen statt zufälliges Rauschen.
Die drei Schichten der KI-Sichtbarkeitsmessung
Der zuverlässigste Ansatz zur Messung von KI-Sichtbarkeit ist ein mehrschichtiger, weil kein einzelnes Tool das vollständige Bild sieht. Marketing-Experten einigen sich auf drei Schichten, die gemeinsam die Frage beantworten: Werden Sie erwähnt, wie stehen Sie im Vergleich zu Wettbewerbern, und was bringt das konkret? (Search Engine Land, Oktober 2025).
Schicht 1: Erwähnungsrate, werden Sie überhaupt zitiert?
Die Erwähnungsrate ist die Basismetrik: In wie viel Prozent der relevanten KI-Antworten erscheint Ihre Marke? Das ist der Grundwert der KI-Sichtbarkeit. Wer dort nicht erscheint, hat nichts zu optimieren.
Machen Sie hier eine wichtige Unterscheidung, die auch Tools wie Semrush anwenden (KI-SEO-Metriken): Eine Erwähnung ist ein textlicher Verweis auf Ihre Marke, eine Quellenangabe ist ein Verweis, bei dem das Modell Ihre Domain als Quelle anführt. Beides zählt, aber eine Quellenangabe generiert auch Traffic.
Messen Sie Ihre Erwähnungsrate über ein festes, repräsentatives Set von Fragen. Ein breites Set aus mehreren Hundert High-Intent-Prompts liefert ein zuverlässigeres Bild Ihres Marktes als einige wenige Einzelprüfungen. Veesie stellt mehr als 60 Prompt-Vorlagen pro Branche bereit, für Marketer und Agenturen, die messen möchten, wie ihre Marke in ChatGPT, Claude, Gemini und Perplexity positioniert ist. Auf Basis dieser Daten stellen Sie Ihr eigenes Prompt-Set zusammen.
Schicht 2: Share of Voice, wie stehen Sie im Vergleich zu Wettbewerbern?
Share of Voice misst Ihren Anteil an KI-Antworten im Vergleich zu Ihren Wettbewerbern. Eine Erwähnungsrate von 30 % klingt niedrig, aber wenn der Marktführer bei 35 % liegt, stehen Sie gut da. Ohne Wettbewerbsvergleich fehlt Ihrer Zahl der Kontext.
Gute Share-of-Voice-Messungen sind positionsgewichtet: Eine Erwähnung am Anfang einer Antwort zählt mehr als eine am Ende. Achtung: Diese Scores sind noch kein Branchenstandard. Jeder Anbieter berechnet sie leicht unterschiedlich, vergleichen Sie daher vor allem Ihre eigene Entwicklung und relative Position, nicht absolute Zahlen zwischen Tools. Das Wettbewerber-Tracking von Veesie zeigt pro KI-Modell, wer in Ihrer Nische an Boden gewinnt oder verliert.
Schicht 3: KI-Referenztraffic und Conversion, was bringt das konkret?
Die unterste Schicht misst, was Ihre KI-Sichtbarkeit konkret einbringt: Besucher und Anfragen. Seit 2026 verfügt Google Analytics 4 über einen integrierten Kanal „AI Assistant“, der Traffic von ChatGPT, Gemini, Copilot, Claude und anderen Assistenten über den verweisenden Domainnamen erkennt (chatgpt.com, perplexity.ai, gemini.google.com usw.).
Zwei Hinweise sind wesentlich:
- Unterschätzung. Ein großer Teil des KI-Traffics kommt ohne Referrer an, etwa aus Apps oder kopierten Links, und landet im Kanal „Direkt“. Ihr tatsächlicher KI-Traffic ist also höher als GA4 anzeigt.
- AI Overviews sind nicht enthalten. Der AI-Assistant-Kanal erfasst Chatbots, nicht Google AI Overviews oder den AI Mode.
Ergänzen Sie diese Messung daher mit Ihrer Markensuche in der Google Search Console. Das typische Muster ist zweistufig: Jemand entdeckt Ihre Marke in einer KI-Antwort und sucht anschließend direkt nach Ihrem Namen. Ein Anstieg markenbezogener Suchanfragen ist oft der erste greifbare Effekt einer verbesserten KI-Sichtbarkeit.
Sentiment, Modellabdeckung und Position: die zusätzlichen Dimensionen
Neben der Präsenz messen Sie drei Qualitätsdimensionen, die den Wert einer Erwähnung bestimmen. Zitiert zu werden ist die erste Frage, aber nicht die einzige.
- Sentiment: Werden Sie positiv, neutral oder negativ beschrieben? Eine negative Erwähnung kann eher schaden als nützen.
- Modellabdeckung: Von wie vielen der großen Modelle (ChatGPT, Claude, Gemini, Perplexity) werden Sie zitiert? Sichtbarkeit in nur einem Modell ist fragil.
- Position in der Antwort: Erscheinen Sie am Anfang oder am Ende der Antwort? Die akademische Forschung zur Generative Engine Optimization (Princeton und Georgia Tech, KDD 2024) gewichtet Sichtbarkeit explizit nach der Position Ihrer Erwähnung in der Antwort.
Der GEO Score von Veesie fasst diese Dimensionen in einer einzigen Zahl zusammen, gewichtet nach ihrem Einfluss auf Ihre Sichtbarkeit in KI-Antworten. So sehen Sie auf einen Blick, ob ein Anstieg aus mehr Erwähnungen oder einer besseren Position kommt.
Wie oft sollte man KI-Sichtbarkeit messen?
Häufiger, als ein Mensch es manuell tun kann. Da KI-Antworten jedes Mal variieren, ist eine einzelne Messung nicht aussagekräftig. Dieselbe Studie zum Nicht-Determinismus empfiehlt mindestens sieben Messungen pro Prompt und Tag für ein stabiles Bild der Erwähnung Ihrer Marke und mindestens acht, wenn Sie auch die zitierten Quellen verfolgen möchten.
Rechnen Sie nach: 300 Prompts, vier KI-Modelle, sieben Wiederholungen pro Tag. Das sind mehr als 8.000 Messungen täglich, jeden Tag. Manuell ist das unmöglich, und genau deshalb ist automatisiertes Monitoring der einzig praktikable Ansatz. Ein wöchentlicher Bericht, der dieses Rauschen glättet, liefert Ihnen einen zuverlässigen Trend statt einer zufälligen Momentaufnahme.
Welche Tools und Methoden gibt es?
Es gibt im Wesentlichen zwei Wege, KI-Sichtbarkeit zu messen, jeder mit seinen Grenzen.
Prompts manuell testen. Kostenlos und zugänglich: Sie stellen Ihre Fragen selbst in ChatGPT oder Perplexity und notieren, ob Ihre Marke erscheint. Der Nachteil ist grundlegend: Es ist eine Momentaufnahme, ohne Verlauf, ohne Wettbewerbsvergleich und ohne Wiederholung. Aufgrund der Variation zwischen Sitzungen lassen sich keine belastbaren Schlüsse ziehen.
Automatisierte Tracker. Tools wie Veesie, Semrush, Otterly, Profound und SE Ranking senden Ihre Prompts systematisch und wiederholt an mehrere Modelle und fassen die Ergebnisse in Scores und Trends zusammen. Wichtiger Hinweis: Jeder Anbieter wendet seine eigene, nicht austauschbare Messmethode an. Vergleichen Sie daher Ihre eigene Entwicklung innerhalb eines Tools, nicht absolute Scores zwischen Tools.
Veesie unterscheidet sich durch sprachgenaue Messung (Niederländisch, Französisch, Englisch separat), vier KI-Modelle, wöchentliche Wiederholung und ein GEO-Benchmark nach Branche, damit Sie wissen, wo Sie im Vergleich zu Ihrem Markt stehen.
In vier Schritten mit dem Messen beginnen
KI-Sichtbarkeit zu messen muss nicht kompliziert sein. Mit einem strukturierten Ansatz sind Sie schnell startklar:
- Stellen Sie Ihr Prompt-Set zusammen. Sammeln Sie die Fragen, die Ihre Zielgruppe wirklich stellt: Definitionen, Vergleiche, Empfehlungen. Streben Sie ein repräsentatives Set aus High-Intent-Prompts an.
- Messen Sie wiederholt über mehrere Modelle. Stellen Sie jeden Prompt wiederholt an ChatGPT, Claude, Gemini und Perplexity, damit die Variabilität geglättet wird.
- Verfolgen Sie alle drei Schichten. Erwähnungsrate, Share of Voice und KI-Referenztraffic zusammen, nicht nur eine einzelne Zahl.
- Berichten Sie wöchentlich und passen Sie an. Vergleichen Sie Ihren Trend, nicht Ihre Momentaufnahme, und verknüpfen Sie jede Optimierung mit der beobachteten Entwicklung.
Für konkrete Optimierungen, die Ihren Score verbessern, lesen Sie 8 konkrete Tipps zur Verbesserung Ihres GEO Score. Wenn Sie trotzdem unsichtbar bleiben, prüfen Sie zuerst Ihre technische AI-Readiness, denn was die KI nicht lesen kann, kann sie auch nicht erwähnen. Welche GEO-Mythen Sie getrost beiseitelegen können, lesen Sie in den 8 GEO-Mythen, die Marketer noch immer glauben. Für die technischen Grundlagen nutzen Sie die GEO-Audit-Checkliste. Möchten Sie Ihre Null-Messung jetzt durchführen? Erstellen Sie Ihr Veesie-Konto kostenlos und starten Sie Ihre erste Messung.
Fazit: Messen ist nicht unmöglich, nur anders
KI-Sichtbarkeit scheint unmessbar, weil sie in gewöhnlichen SEO-Dashboards nicht auftaucht und weil sich KI-Antworten ständig verändern. Sobald Sie sie aber in Erwähnungsrate, Share of Voice und KI-Referenztraffic aufschlüsseln und wiederholt statt einmalig messen, wird sie genauso steuerbar wie klassisches SEO.
Der Unterschied zwischen Marken, die morgen in KI-Antworten erscheinen, und solchen, die fehlen, ist kein Zufall. Er entsteht durch Messen, Verstehen und Anpassen, Woche für Woche. Veesie macht diese drei Schichten für Marketer und Agenturen sichtbar, damit jede Entscheidung auf einer Messung beruht und nicht auf einer Vermutung.
