Wie KI-generierte Texte das Internet verändern

Künstliche Intelligenz hat die Art, wie Inhalte im Internet entstehen, grundlegend verändert. Seit der Veröffentlichung von ChatGPT Ende 2022 ist der Anteil KI-generierter oder KI-gestützter Texte auf Websites rasant gestiegen. Eine umfassende Studie von Forschenden des Imperial College London, des Internet Archive und der Stanford University hat diesen Wandel erstmals systematisch untersucht – mit Ergebnissen, die teilweise überraschen und für jeden Website-Betreiber relevant sind.

Inhaltsverzeichnis

Rund 35 Prozent neuer Websites enthalten KI-generierte Texte
Was die Öffentlichkeit glaubt – und was die Daten tatsächlich zeigen
Die sechs untersuchten Hypothesen im Detail
Zusammenfassung der Ergebnisse
Was bedeutet das für deine Website?
Fazit: KI verändert das Internet – aber anders als gedacht

Homepage Baukasten: Deine Website mit dogado

Gestalte deine Website genauso, wie du sie dir vorstellst. Mit dem Drag-and-drop-Editor platzierst du Texte, Bilder und weitere Elemente mühelos an der gewünschten Stelle – ganz ohne eine einzige Zeile Code.

Homepage Baukasten

Mehrere Geräte (Monitor, Laptop, Tablet, Smartphone) zeigen dieselbe Website auf blauem Hintergrund, Pflanze rechts.

Rund 35 Prozent neuer Websites enthalten KI-generierte Texte

Die zentrale Erkenntnis der Studie: Bis Mitte 2025 wurden etwa 35 Prozent aller neu veröffentlichten Websites als KI-generiert oder KI-gestützt eingestuft. Vor dem Launch von ChatGPT im November 2022 lag dieser Wert praktisch bei null. Innerhalb von weniger als drei Jahren hat sich die Zusammensetzung der Inhalte im Internet also massiv verschoben.

Um diese Zahl zu ermitteln, griffen die Forschenden auf das Wayback Machine des Internet Archive zurück und erstellten eine statistisch repräsentative Stichprobe öffentlich zugänglicher Webseiten aus dem Zeitraum 2022 bis 2025. Das ist methodisch anspruchsvoll, da es keinen zentralen Index des Internets gibt und populäre Domains in den meisten Crawls überrepräsentiert sind. Mit einem mehrdimensionalen, stratifizierten Sampling-Ansatz näherten sie sich einer gleichmäßigen Zufallsstichprobe an.

Für die Erkennung von KI-generierten Inhalten testeten die Forschenden vier etablierte Detektoren – Binoculars, Desklib, DivEye und Pangram v3 – und unterzogen diese eigenen Robustheitsprüfungen über Textlänge, Sprache, HTML-Kontext und verschiedene KI-Modellfamilien hinweg. Pangram v3 erwies sich dabei als zuverlässigster Detektor.

Was die Öffentlichkeit glaubt – und was die Daten tatsächlich zeigen

Die Studie kombiniert die quantitative Analyse des Internets mit einer repräsentativen Umfrage unter 853 US-amerikanischen Erwachsenen. Dabei wurde erhoben, welche negativen Auswirkungen von KI-generierten Texten die Befragten vermuten. Das Ergebnis ist aufschlussreich: Die Mehrheit der Befragten glaubt an alle sechs untersuchten negativen Hypothesen. Die Daten bestätigen allerdings nur zwei davon. Diese Diskrepanz zwischen öffentlicher Wahrnehmung und messbarer Realität ist einer der bemerkenswertesten Befunde der Studie.

Die sechs untersuchten Hypothesen im Detail

Semantische Verengung – bestätigt

Die Hypothese lautete: Je mehr KI-generierte Texte im Netz kursieren, desto stärker schrumpft die Bandbreite einzigartiger Ideen und Perspektiven. Die statistische Analyse bestätigt diese Annahme mit einer Korrelation von ρ = 0,47 bei einer Signifikanz von p = 0,004. Konkret wiesen KI-generierte Websites eine um 33 Prozent höhere semantische Ähnlichkeit auf als von Menschen geschriebene Inhalte (0,0701 gegenüber 0,0526, gemessen als durchschnittliche paarweise Kosinus-Ähnlichkeit semantischer Embeddings).

Für Website-Betreiber bedeutet das: Wer KI-Texte unbearbeitet veröffentlicht, riskiert, in einem immer gleichförmigeren Content-Meer unterzugehen. Die thematische Differenzierung und die Einbringung eigener Perspektiven werden als Qualitätsmerkmal wichtiger denn je.

Verfall der Faktengenauigkeit – nicht bestätigt

75,1 Prozent der Befragten gaben an, dass sie durch KI-Inhalte häufiger auf faktisch falsche Informationen stoßen. Die quantitative Analyse konnte diesen Zusammenhang jedoch nicht belegen. Die Korrelation zwischen der Häufigkeit faktischer Fehler und dem KI-Anteil lag bei ρ = −0,19 mit einem p-Wert von 0,27 – statistisch nicht signifikant.

Das bedeutet nicht, dass KI-Halluzinationen kein Problem sind. Auf der Ebene einzelner Generierungen sind sie gut dokumentiert. Auf der Makroebene des gesamten Internets lässt sich ein messbarer Anstieg faktischer Fehler im Zusammenhang mit dem steigenden KI-Anteil aber bislang nicht nachweisen. Möglicherweise gleichen redaktionelle Nachbearbeitung und die Qualität neuerer KI-Modelle diesen Effekt teilweise aus.

Positivitätsverschiebung – bestätigt

Die stärkste Bestätigung erhielt die Hypothese, dass KI-generierte Texte den Ton im Internet in eine künstlich positive Richtung verschieben. Die Korrelation liegt bei ρ = 0,56 mit einer hohen Signifikanz von p = 0,0003. KI-generierte Websites wiesen einen um 107 Prozent höheren Anteil positiver Sentiment-Scores auf als nicht-KI-generierte Seiten (0,7042 gegenüber 0,3400).

Dieser Befund spiegelt eine bekannte Eigenschaft großer Sprachmodelle wider: ihre Tendenz zur Gefälligkeit, die in der Forschung als Sycophancy bezeichnet wird. Für die Glaubwürdigkeit von Websites ist das relevant – übertrieben positive Texte ohne kritische Einordnung können das Vertrauen informierter Leser untergraben.

Epistemische Inseln – nicht bestätigt

Die Vermutung, dass KI-generierte Inhalte seltener auf externe Quellen verlinken und so isolierte Informationsinseln schaffen, ließ sich nicht belegen. Die Korrelation zwischen ausgehender Linkdichte und KI-Anteil war mit ρ = −0,12 und p = 0,48 statistisch nicht signifikant.

Entropie-Verdünnung – nicht bestätigt

Auch die Hypothese, dass KI-Texte bei zunehmender Wortanzahl eine geringere semantische Dichte aufweisen, fand keine Bestätigung. Die Korrelation lag praktisch bei null (ρ = −0,02, p = 0,89), gemessen über das Gzip-Kompressionsverhältnis als Proxy für Informationsdichte.

Stilistische Monokultur – nicht bestätigt

83 Prozent der Befragten waren der Meinung, dass KI-generierte Texte individuelle Schreibstile zugunsten einer generischen, einheitlichen Stimme verdrängen. Die Daten stützen diese weit verbreitete Annahme allerdings nicht. Die durchschnittliche paarweise Jaccard-Ähnlichkeit von Zeichen-3-Grammen zeigte keine statistisch signifikante Korrelation mit dem KI-Anteil (ρ = 0,24, p = 0,17).

Dieses Ergebnis ist möglicherweise darauf zurückzuführen, dass die stilistische Variation zwischen verschiedenen Domains, Sprachen und Texttypen so groß ist, dass der Einfluss von KI auf Zeichenebene noch nicht dominant durchschlägt. Es schließt nicht aus, dass innerhalb bestimmter Kategorien – etwa Blogposts oder Produktbeschreibungen – eine stärkere stilistische Angleichung stattfindet.

Zusammenfassung der Ergebnisse

Hypothese	Korrelation (ρ)	Signifikanz (p)	Bestätigt?	Öffentliche Zustimmung
Semantische Verengung	0,47	0,004	Ja	Mehrheit
Verfall der Faktengenauigkeit	−0,19	0,27	Nein	75,1 %
Positivitätsverschiebung	0,56	0,0003	Ja	Mehrheit
Epistemische Inseln	−0,12	0,48	Nein	Mehrheit
Entropie-Verdünnung	−0,02	0,89	Nein	Mehrheit
Stilistische Monokultur	0,24	0,17	Nein	83,0 %

Was bedeutet das für deine Website?

Die Studienergebnisse haben direkte Konsequenzen für jeden, der eine Website betreibt oder plant. Die beiden bestätigten Effekte – semantische Verengung und Positivitätsverschiebung – erzeugen ein Umfeld, in dem sich KI-generierte Inhalte zunehmend ähneln und ein künstlich optimistischer Grundton dominiert. Wer sich davon abheben will, muss bewusst auf inhaltliche Tiefe, eigenständige Argumentation und einen authentischen Tonfall setzen.

Suchmaschinen reagieren bereits auf diese Entwicklung. Google hat mit den Helpful Content Updates signalisiert, dass Inhalte mit echtem Mehrwert, fundierter Expertise und originären Informationen bevorzugt werden. Websites, die ausschließlich auf generische KI-Texte setzen, laufen Gefahr, in den Rankings abzurutschen – nicht weil sie KI verwenden, sondern weil ihre Inhalte semantisch austauschbar sind.

Technische Grundlage als Voraussetzung für guten Content

Hochwertige Inhalte allein reichen nicht aus, wenn die technische Basis nicht stimmt. Ladezeiten, Server-Verfügbarkeit, saubere Domain-Struktur und eine professionelle E-Mail-Kommunikation sind Faktoren, die sowohl das Nutzererlebnis als auch das Suchmaschinenranking beeinflussen.

Wenn du eine neue Website aufsetzen oder deine bestehende Präsenz technisch auf solide Beine stellen möchtest, bietet dogado die passenden Produkte. Mit dem Webhosting von dogado bekommst du eine performante Serverumgebung, die schnelle Ladezeiten und hohe Verfügbarkeit sicherstellt. Für WordPress-basierte Projekte gibt es speziell optimiertes WordPress Hosting, das auf die Anforderungen des CMS zugeschnitten ist. Wer mehr Kontrolle braucht, kann auf einen VPS von dogado zurückgreifen und die Serverumgebung individuell konfigurieren.

Sichtbarkeit durch strategische Inhalte sichern

In einem Internet, in dem ein wachsender Anteil der Inhalte semantisch homogen ist, wird durchdachte Suchmaschinenoptimierung zum entscheidenden Differenzierungsmerkmal. Es reicht nicht mehr, Keywords abzudecken – du musst inhaltlich dort ansetzen, wo KI-generierte Texte systematisch schwach sind: bei einzigartigen Perspektiven, aktuellen Brancheneinblicken und konkreten Erfahrungswerten.

Die SEO-Dienstleistungen von dogado helfen dir dabei, deine Inhalte strategisch zu positionieren und die Sichtbarkeit deiner Website nachhaltig zu verbessern. Ergänzend dazu kannst du mit den SEA-Dienstleistungen gezielt bezahlte Kampagnen aufsetzen, um in einem zunehmend umkämpften Umfeld schnell sichtbar zu werden.

Der richtige Startpunkt für dein Webprojekt

Falls du erst am Anfang stehst, brauchst du zunächst eine passende Domain. Bei dogado findest du eine große Auswahl an Domain-Endungen, die du direkt mit dem gewünschten Hosting-Paket kombinieren kannst. Für die schnelle Umsetzung einer professionellen Webpräsenz ohne tiefe Programmierkenntnisse eignet sich der Homepage-Baukasten von dogado. Wenn du eine individuellere Lösung benötigst, unterstützt dich die Website-Erstellung von dogado bei der Konzeption und Umsetzung. Professionelle E-Mail-Adressen mit eigener Domain runden den Auftritt ab und sorgen für Vertrauen bei Kunden und Geschäftspartnern.

Fazit: KI verändert das Internet – aber anders als gedacht

Die Studie zeigt eindrücklich, dass die öffentliche Wahrnehmung der KI-Auswirkungen und die tatsächlich messbaren Effekte deutlich auseinanderklaffen. Die realen Gefahren liegen weniger in faktischen Fehlern oder dem Verschwinden individueller Schreibstile, sondern in einer schleichenden inhaltlichen Gleichförmigkeit und einem künstlich positiven Grundton, der die Informationslandschaft verzerrt.

Für Website-Betreiber ergibt sich daraus eine klare Handlungsempfehlung: KI als Werkzeug nutzen, aber Inhalte mit eigener Expertise, kritischer Einordnung und thematischer Tiefe anreichern. Wer auf eine solide technische Infrastruktur setzt und seine Inhalte strategisch differenziert, kann von der aktuellen Entwicklung sogar profitieren – denn in einem Meer generischer Texte stechen authentische, fundierte Inhalte umso stärker hervor.

Quelle: https://ai-on-the-internet.github.io/

Webhosting: Schnell, sicher & flexibel für jedes Projekt

Entdecke skalierbare Webhosting-Pakete mit SSL-Zertifikat, inklusiver Domain und SSD-Speicher

Zum Webhosting

Server-Racks mit blauer Beleuchtung, Frontpaneele mit Laufwerkschächten, Lüftungsgitter und Netzwerkausrüstung.

Preise exkl. MwSt. Angebote sind nur für begrenzte Zeit gültig und sind teils abhängig von Mindestvertragslaufzeiten. Hier findest du unsere Allgemeinen Geschäftsbedingungen.

Wie KI-generierte Texte das Internet verändern

Inhaltsverzeichnis

Homepage Baukasten: Deine Website mit dogado

Rund 35 Prozent neuer Websites enthalten KI-generierte Texte

Was die Öffentlichkeit glaubt – und was die Daten tatsächlich zeigen