In den letzten Wochen wurde ein bedeutender Google-Leak bekannt, das die interne Dokumentation des Google Content API Warehouse offenlegt. Diese Dokumentation bietet Einblicke in die Daten, die Google sammelt und in seinen Suchmaschinen-Algorithmen und Ranking-Systemen verwendet. In diesem Blog-Beitrag analysieren wir einige spannende Module aus dem Leak und geben abschliessend praktische Tipps zur Umsetzung einer umfassenderen Strategie für Unternehmen und SEO-Consultants.
Hintergrundinformationen über den Google-Leak
Das Datenleck von Google wurde von Erfan Azimi erkannt. Dieser kontaktierte Rand Fishkin, der zusammen mit Mike King das Dokument entschlüsselte. Die durchgesickerten Unterlagen wurden anschliessend auf GitHub, einer beliebten Plattform für den Austausch von Code, veröffentlicht.
Was Sie über die gesammelten Daten wissen müssen
Obwohl wir wissen, dass diese Daten erhoben werden, bleibt unklar, wie sie genau von Google verwendet und die einzelnen Module gewichtet werden. Daher können wir nur Vermutungen anstellen, doch sind wir dem Verständnis dieser Prozesse inzwischen näher gekommen als noch vor einem Monat.
Erkenntnisse über Rankingsysteme und -prozesse
-
- Komplexität
Die API-Dokumentation enthält 2.596 Module und 14.014 Attribute
- Komplexität
-
- Herabstufungsmechanismen (Demotion Mechanisms)
Das Vorhandensein von Herabstufungsmodulen weist darauf hin, dass Google den Rang eines Inhalts aktiv senken kann.
- Herabstufungsmechanismen (Demotion Mechanisms)
-
- Twiddlers
Wie von Mike King erläutert, handelt es sich bei Twiddlers um Parameter oder Faktoren, die zur Feinabstimmung der Suchergebnisse verwendet werden. Dies bedeutet, dass Google den Ranking-Algorithmus auf der Grundlage bestimmter Signale anpassen kann.
- Twiddlers
-
- Entitätserkennung (Entity Recognition):
Module zur Identifizierung von Personen, Organisationen und Orten deuten darauf hin, dass Google diese Entitäten beim Ranking von Inhalten berücksichtigt. Dies kann sich darauf auswirken, wie Inhalte, die sich auf diese Entitäten beziehen, in den Suchergebnissen erscheinen.
- Entitätserkennung (Entity Recognition):
-
- Geografische Faktoren (Geospatial Factors):
Die Module für die Geolokalisierung deuten darauf hin, dass Google die geografische Relevanz in die Suchergebnisse einbezieht. Das bedeutet, dass der Standort eines Nutzers die angezeigten Suchergebnisse beeinflussen kann.
- Geografische Faktoren (Geospatial Factors):
Erkenntnisse aus den verschiedenen Modulen
Die durch den Google Leak enthüllten Module liefern uns eine Vielzahl wichtiger Erkenntnisse. Im Folgenden werden wir einige der aus unserer Sicht relevantesten Module vorstellen und analysieren:
QualityNavboostCrapsCrapsData
Anhand der gesammelten Daten lässt sich ableiten, dass der Hauptzweck dieses Moduls darin besteht, das Nutzerverhalten zu analysieren und Webseiten basierend auf Faktoren wie Klicks, Impressionen, Standort, Sprache, Gerät und Nutzungsmuster einer Qualitätsbewertung zu unterziehen.
QualityNsrNsrData
Die durchgesickerten Daten deuten darauf hin, dass das Modul “QualityNsrNsrData ” darauf ausgerichtet ist, die Qualität von Websites und ihrem Inhalt zu analysieren und zu bewerten. Es handelt sich höchstwahrscheinlich um eine Komponente des Google-Suchalgorithmus, die sich auf das Ranking und die Bewertung von Websites anhand von Faktoren wie Inhaltsqualität, Nutzererfahrung und Website-Autorität fokussiert. Zusätzlich deutet das Attribut «ChromeInTotal» in diesem Modul darauf hin, dass Chrome-Nutzerdaten erfasst und höchstwahrscheinlich verwendet werden.
CompressedQualitySignals
Diese Module geben möglicherweise Einblick darüber, wie Google verschiedene Qualitätssignale bewertet und komprimiert, um sie in seinem Ranking-Algorithmus zu verwenden.
QualityAuthorityTopicEmbeddingsVersionedItem
Basierend auf den vorliegenden Daten lässt sich schlussfolgern, dass die Kernfunktion dieses Moduls darin besteht, die Autorität und Relevanz einer Website zu einem bestimmten Thema zu bewerten. Dies erfolgt durch die Analyse des Inhalts und der Struktur der Website, um zu beurteilen, inwiefern sie sich auf das gegebene Thema konzentriert und wie konsistent ihre Seiten in diesem Zusammenhang sind.
Anchors
Die vorliegenden Daten indizieren, dass die Hauptfunktion des Moduls “Anchors” darin besteht, Ankertextdaten von Webseiten zu analysieren und zu verarbeiten. Es scheint somit für die Extraktion, Verarbeitung und Speicherung von Ankertextdaten verantwortlich zu sein.
RepositoryAnnotationsGeo
Wir können aus der Dokumentation schliessen, dass das Hauptziel dieses Moduls darin besteht, die geografische Relevanz eines Dokuments oder einer Webseite für einen bestimmten Ort zu bestimmen.
AppsPeopleOzExternalMergedpeopleapiAboutMeExtendedData
Basierend auf den vorliegenden Daten lässt sich schliessen, dass das Hauptziel dieses Moduls darin besteht, nutzergenerierte Inhalte zu analysieren und zu verstehen, wobei der Schwerpunkt auf dem Profil, dem Namen und den Fotos des Nutzers liegt. Es scheint darauf ausgerichtet zu sein, Informationen im Zusammenhang mit der Online-Identität eines Benutzers zu identifizieren und zu verarbeiten. Zur Erinnerung: Benutzergenerierte Inhalte sind Inhalte, die von Personen erstellt und auf Online-Plattformen wie sozialen Medien, Foren oder Blogs hochgeladen werden.
YoutubeCommentsSentimentSentiment
Die vorliegenden Daten legen nahe, dass dieses Modul für die Analyse und das Verständnis der Stimmung von YouTube-Kommentaren zuständig ist, um deren positiven, negativen oder neutralen Charakter zu bestimmen. Dies ermöglicht es Google, ein Gespür dafür zu bekommen, wie ein spezifisches Video oder Thema allgemein wahrgenommen wird.
RepositoryWebrefEntityLinkMetadata
Basierend auf den gesammelten Daten lässt sich feststellen, dass der primäre Zweck dieses Moduls darin liegt, die Natur der Verbindungen zwischen Web-Entitäten wie Websites, Artikeln oder anderen Online-Inhalten zu untersuchen und zu begreifen.
Komplette Moduldokumentationen
Das Dokument und die darin aufgeführten Module sind äusserst technisch. Trotzdem haben einige Mitglieder der SEO-Community Tools entwickelt, die es jedem, nicht nur Entwicklern, ermöglichen, das Google-Leak besser zu verstehen.
Komplette Moduldokumentationen
Das Dokument und die darin aufgeführten Module sind äusserst technisch. Trotzdem haben einige Mitglieder der SEO-Community Tools entwickelt, die es jedem, nicht nur Entwicklern, ermöglichen, den Google-Leak besser zu verstehen.
- Datenbank von Swapnil Pate und Mahendra C.: https://searchrankingfactors.com/
- Datenbank von Matt Hodson (inkl. Analyse und detaillierter Erklärung der Module und deren Attribute): https://2596.org
Strategische Implikationen aus dem Google-Leak
Vor dem Hintergrund dieser Erkenntnisse wird deutlich, dass sich eine kurzfristige Fokussierung auf die Optimierung einzelner Seiten als unzureichend erweist. Es ist daher ratsam, einen umfassenderen Ansatz zu verfolgen. In diesem Sinne könnte es von Vorteil sein, bei der Suchmaschinenoptimierung folgende Prioritäten zu setzen:
- Stärkung der Markenautorität
- Klare Verdeutlichung des Tätigkeitsbereichs auf der Webseite
- Generierung von ansprechenden und hochwertigen Inhalten
- Stärkung der Präsenz auf Plattformen wie YouTube und idealerweise Förderung eines positiven Stimmungsbilds
- Optimierung der Nutzererfahrung (User Experience)
Fazit
Der Google-Leak hat tiefe Einblicke in das Google Content API Warehouse gegeben, die weit über die üblichen Vermutungen und Spekulationen hinausgehen. Es unterstreicht die Notwendigkeit für Unternehmen, nicht nur auf oberflächliche SEO-Taktiken zu setzen, sondern einen ganzheitlichen Ansatz zu verfolgen, der die Qualität der Inhalte, die Nutzererfahrung und das Markenimage berücksichtigt. Als SEO-Agentur sind wir davon überzeugt, dass eine solide Strategie, die diese Elemente integriert, langfristigen Erfolg gewährleistet.