Google-Leak: Diese Auswirkungen hat das Datenleck von Google auf SEO

a leaking google logo, symbolizing the google leak from 2024

Artikel teilen​

In den letzten Wochen wurde ein bedeutender Google-Leak bekannt, das die interne Dokumentation des Google Content API Warehouse offenlegt. Diese Dokumentation bietet Einblicke in die Daten, die Google sammelt und in seinen Suchmaschinen-Algorithmen und Ranking-Systemen verwendet. In diesem Blog-Beitrag analysieren wir einige spannende Module aus dem Leak und geben abschliessend praktische Tipps zur Umsetzung einer umfassenderen Strategie für Unternehmen und SEO-Consultants.

Hintergrundinformationen über den Google-Leak 

Das Datenleck von Google wurde von Erfan Azimi erkannt. Dieser kontaktierte Rand Fishkin, der zusammen mit Mike King das Dokument entschlüsselte. Die durchgesickerten Unterlagen wurden anschliessend auf GitHub, einer beliebten Plattform für den Austausch von Code, veröffentlicht.

Was Sie über die gesammelten Daten wissen müssen

Obwohl wir wissen, dass diese Daten erhoben werden, bleibt unklar, wie sie genau von Google verwendet und die einzelnen Module gewichtet werden. Daher können wir nur Vermutungen anstellen, doch sind wir dem Verständnis dieser Prozesse inzwischen näher gekommen als noch vor einem Monat.

Erkenntnisse über Rankingsysteme und -prozesse

 
    • Komplexität
      Die API-Dokumentation enthält 2.596 Module und 14.014 Attribute

    • Herabstufungsmechanismen (Demotion Mechanisms)
      Das Vorhandensein von Herabstufungsmodulen weist darauf hin, dass Google den Rang eines Inhalts aktiv senken kann.

    • Twiddlers
      Wie von Mike King erläutert, handelt es sich bei Twiddlers um Parameter oder Faktoren, die zur Feinabstimmung der Suchergebnisse verwendet werden. Dies bedeutet, dass Google den Ranking-Algorithmus auf der Grundlage bestimmter Signale anpassen kann.

    • Entitätserkennung (Entity Recognition):
      Module zur Identifizierung von Personen, Organisationen und Orten deuten darauf hin, dass Google diese Entitäten beim Ranking von Inhalten berücksichtigt. Dies kann sich darauf auswirken, wie Inhalte, die sich auf diese Entitäten beziehen, in den Suchergebnissen erscheinen.

 

    • Geografische Faktoren (Geospatial Factors):
      Die Module für die Geolokalisierung deuten darauf hin, dass Google die geografische Relevanz in die Suchergebnisse einbezieht. Das bedeutet, dass der Standort eines Nutzers die angezeigten Suchergebnisse beeinflussen kann.
Die Erkenntnisse aus dem Google-Datenleck unterstreichen die Notwendigkeit eines umfassenden Ansatzes für den SEO-Erfolg, dem viele SEO-Consultants, einschliesslich mir, schon lange zustimmen. Mein Team und ich haben daher bereits vor Jahren begonnen, das Branding als wichtige SEO-Massnahme zu priorisieren.
Sara Moccand-Sayegh
Team Lead SEO BlueGlass Team Farner

Erkenntnisse aus den verschiedenen Modulen

Die durch den Google Leak enthüllten Module liefern uns eine Vielzahl wichtiger Erkenntnisse. Im Folgenden werden wir einige der aus unserer Sicht relevantesten Module vorstellen und analysieren:

QualityNavboostCrapsCrapsData

Anhand der gesammelten Daten lässt sich ableiten, dass der Hauptzweck dieses Moduls darin besteht, das Nutzerverhalten zu analysieren und Webseiten basierend auf Faktoren wie Klicks, Impressionen, Standort, Sprache, Gerät und Nutzungsmuster einer Qualitätsbewertung zu unterziehen.

 

QualityNsrNsrData

Die durchgesickerten Daten deuten darauf hin, dass das Modul “QualityNsrNsrData ” darauf ausgerichtet ist, die Qualität von Websites und ihrem Inhalt zu analysieren und zu bewerten. Es handelt sich höchstwahrscheinlich um eine Komponente des Google-Suchalgorithmus, die sich auf das Ranking und die Bewertung von Websites anhand von Faktoren wie Inhaltsqualität, Nutzererfahrung und Website-Autorität fokussiert. Zusätzlich deutet das Attribut  «ChromeInTotal»  in diesem Modul darauf hin, dass Chrome-Nutzerdaten erfasst und höchstwahrscheinlich verwendet werden.

CompressedQualitySignals

Diese Module geben möglicherweise Einblick darüber, wie Google verschiedene Qualitätssignale bewertet und komprimiert, um sie in seinem Ranking-Algorithmus zu verwenden.

QualityAuthorityTopicEmbeddingsVersionedItem

Basierend auf den vorliegenden Daten lässt sich schlussfolgern, dass die Kernfunktion dieses Moduls darin besteht, die Autorität und Relevanz einer Website zu einem bestimmten Thema zu bewerten. Dies erfolgt durch die Analyse des Inhalts und der Struktur der Website, um zu beurteilen, inwiefern sie sich auf das gegebene Thema konzentriert und wie konsistent ihre Seiten in diesem Zusammenhang sind.

Anchors

Die vorliegenden Daten indizieren, dass die Hauptfunktion des Moduls “Anchors” darin besteht, Ankertextdaten von Webseiten zu analysieren und zu verarbeiten. Es scheint somit für die Extraktion, Verarbeitung und Speicherung von Ankertextdaten verantwortlich zu sein.

RepositoryAnnotationsGeo

Wir können aus der Dokumentation schliessen, dass das Hauptziel dieses Moduls darin besteht, die geografische Relevanz eines Dokuments oder einer Webseite für einen bestimmten Ort zu bestimmen.

AppsPeopleOzExternalMergedpeopleapiAboutMeExtendedData

Basierend auf den vorliegenden Daten lässt sich schliessen, dass das Hauptziel dieses Moduls darin besteht, nutzergenerierte Inhalte zu analysieren und zu verstehen, wobei der Schwerpunkt auf dem Profil, dem Namen und den Fotos des Nutzers liegt. Es scheint darauf ausgerichtet zu sein, Informationen im Zusammenhang mit der Online-Identität eines Benutzers zu identifizieren und zu verarbeiten. Zur Erinnerung: Benutzergenerierte Inhalte sind Inhalte, die von Personen erstellt und auf Online-Plattformen wie sozialen Medien, Foren oder Blogs hochgeladen werden.

YoutubeCommentsSentimentSentiment

Die vorliegenden Daten legen nahe, dass dieses Modul für die Analyse und das Verständnis der Stimmung von YouTube-Kommentaren zuständig ist, um deren positiven, negativen oder neutralen Charakter zu bestimmen. Dies ermöglicht es Google, ein Gespür dafür zu bekommen, wie ein spezifisches Video oder Thema allgemein wahrgenommen wird.

RepositoryWebrefEntityLinkMetadata

Basierend auf den gesammelten Daten lässt sich feststellen, dass der primäre Zweck dieses Moduls darin liegt, die Natur der Verbindungen zwischen Web-Entitäten wie Websites, Artikeln oder anderen Online-Inhalten zu untersuchen und zu begreifen.
Komplette Moduldokumentationen
Das Dokument und die darin aufgeführten Module sind äusserst technisch. Trotzdem haben einige Mitglieder der SEO-Community Tools entwickelt, die es jedem, nicht nur Entwicklern, ermöglichen, das Google-Leak besser zu verstehen.

Komplette Moduldokumentationen

Das Dokument und die darin aufgeführten Module sind äusserst technisch. Trotzdem haben einige Mitglieder der SEO-Community Tools entwickelt, die es jedem, nicht nur Entwicklern, ermöglichen, den Google-Leak besser zu verstehen.

Strategische Implikationen aus dem Google-Leak

Vor dem Hintergrund dieser Erkenntnisse wird deutlich, dass sich eine kurzfristige Fokussierung auf die Optimierung einzelner Seiten als unzureichend erweist. Es ist daher ratsam, einen umfassenderen Ansatz zu verfolgen. In diesem Sinne könnte es von Vorteil sein, bei der Suchmaschinenoptimierung folgende Prioritäten zu setzen:

  • Stärkung der Markenautorität
  • Klare Verdeutlichung des Tätigkeitsbereichs auf der Webseite
  • Generierung von ansprechenden und hochwertigen Inhalten
  • Stärkung der Präsenz auf Plattformen wie YouTube und idealerweise Förderung eines positiven Stimmungsbilds
  • Optimierung der Nutzererfahrung (User Experience

Fazit

Der Google-Leak hat tiefe Einblicke in das Google Content API Warehouse gegeben, die weit über die üblichen Vermutungen und Spekulationen hinausgehen. Es unterstreicht die Notwendigkeit für Unternehmen, nicht nur auf oberflächliche SEO-Taktiken zu setzen, sondern einen ganzheitlichen Ansatz zu verfolgen, der die Qualität der Inhalte, die Nutzererfahrung und das Markenimage berücksichtigt. Als SEO-Agentur sind wir davon überzeugt, dass eine solide Strategie, die diese Elemente integriert, langfristigen Erfolg gewährleistet.