Wir haben unsere Agentur gegen ChatGPT getestet
KI-Sichtbarkeit | 7 min |

Wir haben unsere Agentur gegen ChatGPT getestet

Inhaltsverzeichnis · 8 Sektionen

  1. Warum wir diesen Artikel schreiben — auch wenn er uns schlecht aussehen lässt
  2. Der Kontext: Eine Studie hat alles verändert
  3. Unser Test: dotrockets gegen Claude
  4. Das Ergebnis: 44 von 100
  5. Das ist unbequem. Und ehrlich.
  6. Was wir jetzt tun
  7. Was du daraus lernen kannst
  8. Fazit: Wir setzen uns nackt aus. Weil Ehrlichkeit konvertiert.

Warum wir diesen Artikel schreiben — auch wenn er uns schlecht aussehen lässt

Warum machen wir ein eigenes Versagen öffentlich? Wir bauen gerade ein Tool, das prüft, wie sichtbar ein Unternehmen in KI-Antworten ist, etwa bei ChatGPT, Claude, Perplexity und Gemini. Bevor wir damit Kunden helfen, haben wir es gegen uns selbst laufen lassen und dabei nur 44 von 100 möglichen Punkten erreicht. Das Ergebnis war für uns ehrlich gesagt ernüchternd, und genau deshalb erzählen wir dir hier offen davon. Ehrlichkeit ist nämlich das Einzige, was diese neue Generation der Suche von dir und deiner Marke am Ende wirklich belohnt.

Der Kontext: Eine Studie hat alles verändert

Was hat sich 2026 eigentlich grundlegend verschoben? Im Frühjahr 2026 hat Peec AI zusammen mit AN Digital die viel beachtete Studie „State of AI Search 2026" veröffentlicht. Dafür wurden beispielsweise 11.000 echte Suchanfragen durch sechs verschiedene KI-Modelle geschickt, über elf Branchen hinweg und in den Märkten DACH und USA. Das zentrale Ergebnis dieser breit angelegten Untersuchung ist unbequem und glasklar zugleich. Es lautet nämlich: 76 Prozent aller Quellen, die ChatGPT, Gemini und Perplexity überhaupt zitieren, stammen am Ende von nur 100 Domains weltweit.

Wie eng ist dieser Flaschenhals wirklich? Die Top 10 Domains allein bekommen etwa 32 Prozent aller Zitate, das ist fast ein volles Drittel des gesamten Kuchens. Wikipedia führt nämlich mit 2,97 Prozent, Reddit folgt als Zweiter mit 1,33 Prozent, und dahinter reihen sich YouTube, große Vergleichsportale und etablierte Fachmedien ein. Der gesamte Rest des offenen Internets teilt sich am Ende die verbleibenden 24 Prozent auf. Für ein junges Unternehmen bedeutet das beispielsweise einen brutalen Verdrängungswettbewerb um sehr wenige zitierfähige Plätze.

Was heißt das konkret für dein eigenes Unternehmen? Dein klassisches SEO-Ranking kann technisch absolut perfekt sein und trotzdem komplett ins Leere laufen. Wenn die KI dich nämlich nicht kennt, empfiehlt sie dich auch nicht, und wenn sie dich nicht empfiehlt, hörst du von diesem potenziellen Kunden überhaupt nie etwas. Über 24 Prozent aller Such-Sessions laufen 2026 bereits über KI-Antworten statt über die klassische blaue Linkliste. Dieser wachsende Teil deiner künftigen Kundschaft entscheidet sich beispielsweise lange, bevor jemand deine Website auch nur sieht.

Unser Test: dotrockets gegen Claude

Wie haben wir unsere eigene Sichtbarkeit eigentlich gemessen? Wir haben dazu einen Check über drei klar und fair gewichtete Dimensionen gebaut. Die KI-Empfehlung zählt nämlich 40 Punkte und prüft, ob dotrockets in echten Branchen-Prompts auftaucht. Die Website-Struktur bringt 35 Punkte für Schema.org, FAQ-Markup, Hierarchie, robots.txt und Sitemap. Die Ökosystem-Präsenz schließlich gibt 25 Punkte für Spuren auf Wikipedia, Reddit, Reviews und in den Fachmedien. Die Tabelle hier zeigt dir nun alle drei Bereiche und unser ganz ehrliches Ergebnis im direkten Vergleich dazu.

DimensionMaximaldotrocketsWas es misst
Website-Struktur35 Punkte35/35Schema.org, FAQ, robots.txt, Sitemap
Ökosystem-Präsenz25 Punkte9/25Wikipedia, Reddit, Reviews, Fachmedien
KI-Empfehlung40 Punkte0/40Nennung in 3 Branchen-Prompts
Gesamt100 Punkte44/100Gelber Bereich

Welche Fragen haben wir der KI konkret gestellt? Wir haben Claude beispielsweise drei realistische Kunden-Prompts vorgelegt, so wie sie ein suchender Geschäftsführer tatsächlich tippen würde. Der erste fragte nach 5 konkreten KI-Automatisierungs-Anbietern in DACH mit Website. Der zweite suchte ganz allgemein einen seriösen Dienstleister für KI-Automatisierung im DACH-Raum. Der dritte wollte die Top 5 KI-Automatisierungs-Agenturen in DACH für 2026 und wer dort führend ist. Drei Prompts, drei echte Chancen, gesehen zu werden, und genau hier wurde es nämlich richtig schmerzhaft für uns.

Das Ergebnis: 44 von 100

Wie liest sich unser Score ungeschönt im Detail? Bei der Website-Struktur holten wir die vollen 35 von 35 Punkten, also Schema.org, FAQ-Markup, saubere H1-Hierarchie und eine robots.txt, die alle KI-Crawler ausdrücklich erlaubt. Bei der Ökosystem-Präsenz waren es nur magere 9 von 25 Punkten, denn Claude findet bloß vage Reddit-Spuren. Bei der KI-Empfehlung standen wir am Ende bei katastrophalen 0 von 40 Punkten. In null von drei Prompts fiel beispielsweise unser Name, stattdessen empfahl Claude Mindbreeze, Parloa und die Alexander Thamm GmbH.

Was sagt diese Zahl über unsere Lage aus? Mit 44 von 100 landen wir nämlich klar im gelben Bereich, dessen Verdikt brutal ehrlich lautet: Die KI findet Spuren von dir, aber sie empfiehlt dich nicht. Genau das ist die Lücke, die zwischen technischer Perfektion und echter Sichtbarkeit klafft. Wir haben beispielsweise 35 von 35 Struktur-Punkten und kommen trotzdem in keiner einzigen Empfehlung vor. Die Wahrheit ist nämlich, dass über 56 Prozent unseres möglichen Scores schlicht im toten Winkel der KI verschwinden.

Das ist unbequem. Und ehrlich.

Warum reden wir dieses 44-Punkte-Ergebnis nicht einfach schön? Wir verkaufen KI-Sichtbarkeit und sind selbst noch nicht sichtbar, und das ist ein Widerspruch, den wir hier nicht wegmoderieren wollen. Es ist aber zugleich ein Problem, das beispielsweise fast jedes der rund 3,5 Millionen KMU im gesamten DACH-Raum gerade hat. Genau deshalb exerzieren wir es hier ganz öffentlich durch, statt es vor dir zu verstecken. Wer dir nämlich verspricht, deine KI-Sichtbarkeit in nur 7 Tagen komplett zu fixen, hat das Spiel schlicht nicht verstanden und verkauft dir heiße Luft.

Warum existiert dieser tote Winkel technisch überhaupt? LLMs haben harte Training-Cutoffs, und Claude Opus 4.6 wurde beispielsweise erst im Mai 2025 final trainiert. dotrockets gibt es zwar schon seit 2024, doch die Marke ist jung und ihre Präsenz in den Quellen, die das Modell während des Trainings gelesen hat, ist minimal. Das lässt sich in einer einzigen Woche nicht ändern, sondern braucht nämlich viele Monate konsequenter Arbeit. Genau deshalb ist KI-Sichtbarkeit kein kurzer Sprint, sondern ein Langstreckenlauf über mindestens 6 bis 12 Monate.

Was wir jetzt tun

Wie sieht unser konkreter Vier-Wochen-Plan im Detail aus? Wir legen ihn hier komplett offen, damit du ihn für dein eigenes Unternehmen direkt eins zu eins nachbauen kannst. In Woche 1 geht es nämlich um das Basis-Ökosystem: Google-Profil füllen, die LinkedIn-Seite optimieren, ProvenExpert und Trustpilot einrichten und dort beispielsweise die ersten 10 echten Reviews sammeln, dazu ein Crunchbase-Profil anlegen. Das sind eher unspektakuläre Hausaufgaben, aber genau diese frühen Basis-Signale liest die KI später als wichtigen Vertrauensbeweis und als harten Existenznachweis für dich aus.

Was passiert in den Wochen 2 bis 4 konkret? In Woche 2 bespielen wir nämlich Agentur-Marktplätze wie Sortlist.de, Clutch.co, The Manifest, GoodFirms und DesignRush und bereiten drei Case Studies auf, etwa zu Studio Babelsberg und Glööckler. In Woche 3 pitchen wir Fachmedien wie t3n oder Heise und starten eine LinkedIn-Serie. In Woche 4 reichen wir beispielsweise einen Wikipedia-Artikel und einen Wikidata-Eintrag ein. Unser realistisches Ziel über drei Monate lautet nämlich: von 44 auf 65 bis 75 Punkte, denn die volle 100 braucht schlicht Zeit.

Was du daraus lernen kannst

Was ist die wichtigste Lehre aus unserem eigenen Test? Technische KI-Readiness ist nämlich das Fundament, niemals schon das eigentliche Ziel. Wir haben beispielsweise 35 von 35 Punkten in der Struktur und es reicht trotzdem nicht für eine einzige Empfehlung. Schema.org, FAQ-Markup und eine saubere Heading-Hierarchie sind nämlich reine Hygienefaktoren. Ohne sie verlierst du garantiert, mit ihnen gewinnst du aber noch lange nicht von ganz allein. Sie sind die bloße Eintrittskarte ins Spiel, nicht der Sieg, und genau das verwechseln die meisten Anbieter da draußen.

Wo liegt also der eigentliche Hebel für dich? Der echte Hebel sitzt nämlich im Ökosystem, also bei Wikipedia, Reddit, Vergleichsportalen und Fachmedien. Wer dort nicht vorkommt, wird von der KI beispielsweise mit 0 von 40 Empfehlungspunkten schlicht ignoriert, genau wie wir aktuell. Das ist die unbequeme Arbeit, die kaum jemand machen will, und genau deshalb baut sie deinen Vorsprung aus. Es dauert nämlich: Wer heute startet, sieht in 3 Monaten erste Effekte und in 12 Monaten die volle Wirkung dieser Aufbauarbeit.

Fazit: Wir setzen uns nackt aus. Weil Ehrlichkeit konvertiert.

Warum legen wir ausgerechnet unser schwächstes Ergebnis offen? 44 von 100 Punkten ist unser ehrlicher Ausgangspunkt, und wir werden diesen Score in den nächsten Wochen Schritt für Schritt öffentlich dokumentieren. Was gut klappt, was nicht und was wir uns beispielsweise vorher völlig anders vorgestellt haben. Keine Fake-Metriken, kein Success-Theater, sondern allein der echte und ungeschönte Verlauf. Genau diese radikale Transparenz ist nämlich das, was eine ehrliche Agentur 2026 von den vielen Versprechen-Verkäufern unterscheidet, die dir lieber eine geschönte Zahl präsentieren.

Wie kannst du deinen eigenen Stand jetzt selbst herausfinden? Unser KI-Sichtbarkeits-Check steckt aktuell noch in der internen Beta und liefert dir denselben dreigeteilten Score über volle 100 Punkte. Schreib uns dafür einfach eine kurze Nachricht, dann schicken wir dir beispielsweise den persönlichen Zugangslink. Es gibt nämlich keine Registrierung, keine Payment-Wall und keinen versteckten Haken, sondern nur ehrliches Feedback zu deiner aktuellen Lage. Du erfährst in wenigen Minuten, ob die KI dich kennt oder ob du gerade noch im toten Winkel stehst.

Und warum machen wir ein Tool öffentlich, das uns selbst nur 44 Punkte gibt? Weil genau das der Beweis ist, dass wir nicht verkaufen, was wir nicht verstehen. Wir verstehen das Spiel nämlich bis ins Detail, wir arbeiten Woche für Woche sichtbar daran, und wir dokumentieren beispielsweise jeden einzelnen Schritt offen. Genau das solltest auch du für dein Unternehmen tun, statt auf das schnelle Versprechen hereinzufallen. Sichtbarkeit in der KI verdient man sich nämlich, man kauft sie nicht über Nacht.

Häufige Fragen

Wie teste ich, ob mein Unternehmen in KI-Antworten auftaucht?
Drei Schritte: 1) Liste die 20 Fragen, die deine Kunden stellen könnten; 2) Stelle sie an ChatGPT, Claude, Perplexity und Gemini; 3) Zähle: wie oft kommt dein Name? Welche Quellen werden zitiert? Wer taucht als Konkurrent auf, der dir bisher nicht auffiel?
Warum zitieren AI-Modelle nur 100 Domains?
Weil LLMs bei Quellenauswahl Autorität und Häufigkeit priorisieren. Wenn eine Domain in 10.000 Trainingsdokumenten zum Thema "KI-Agenten" vorkommt, wird sie zitiert, nicht deine Domain mit 3 Artikeln. Das ist nicht böse, das ist Statistik.
Wie werde ich in AI-Antworten häufiger zitiert?
Drei Hebel: 1) eigene Daten publizieren (Reports, Benchmarks, Studien) — die werden überproportional zitiert, 2) auf den 100 Top-Domains erwähnt werden (Gast-Artikel, Podcast-Auftritte, Wikipedia-Einträge), 3) strukturierte Daten (Schema.org) und llms.txt, damit Crawler deine Inhalte sauber verstehen.
Ist GEO der neue SEO?
Nein, GEO ist eine Ergänzung zu SEO. Für 2026–2028 brauchst du beides: SEO für Google-Traffic (noch 60–70 % aller Such-Sessions), GEO für AI-Answer-Sessions (steigend). Wer nur auf eins setzt, riskiert die andere Hälfte seines Traffics.
Wie misst man GEO-Performance?
Nicht mit Klicks — in AI-Antworten klickt oft niemand. Relevante Metriken: Brand-Mentions in AI-Responses, Referral-Traffic aus AI-Tools (Perplexity, Copilot haben Click-throughs), Share-of-Voice im Vergleich zu Konkurrenten, und direkte Anfragen mit Formulierungen wie "ich hab dich bei ChatGPT gefunden".

Visibility-Audit · Pilot 990 €

Wo steht deine Website
in dieser Verteilung?

Ich messe deine Site gegen denselben 6-Dimensionen-Stack, der die 411 Pool-Sites in dieser Analyse bewertet hat. Du bekommst PDF-Audit, AI-Suche-Snapshot, und drei sofort umgesetzte Quick-Wins. Lieferung in 7 Werktagen.

Pilot-Phase · noch 10 Plätze à 990 € · danach regulär 1.490 €

6

Dimensionen

7

Werktage

3

Quick-Wins live

Björn Puls

Über den Autor

Björn Puls

Gründer dotrockets · Koh Phangan, Thailand

Seit Mitte der 90er im digitalen Business — als Freelancer bei Heinrich Bauer Verlag mit tvmovie.de gestartet, danach 35+ Projekte für Studio Babelsberg, Harald Glööckler, Burda Verlag und artvoll. Heute baut Björn KI-Agenten, Quiz-Funnels und Audit-Tools von Koh Phangan aus.

Mit Herzschlag der Erde hat er eine Community mit 60.000+ Followern organisch aufgebaut — ohne Ads, rein durch Content. Der dotrockets Website Roaster analysiert mit KI hunderte DACH-Websites pro Monat.

Alle Artikel