Pagerank - Die Google-Formel
Beginnen wir mit ein paar Binsen-Weisheiten: Das Internet ist riesig, eine Webseite dagegen winzig.
Jedes Webangebot gibt es nicht einmal, nicht zweimal, sondern zehn- oder hundertmal.
In dieser Masse hat es eine einzelne Seite schwer, sich-hervorzuheben, sich dem User zu zeigen.
Der sieht sie nur in einem Fall:
Wenn er in Google eine Suche startet und diese eine Webseite ganz oben erscheint. So hart, so darwinistisch sind die Regeln des Intenets,
die Regeln von Google.
Nur: Wenn es Hunderte ähnliche Seiten gibt — welche wird nach oben geschoben und welche auf die hinteren Platze verbannt?
Die Antwort darauf gossen die Google-Gründer Larry Page und Sergey Brin in eine einzige Formel, den Pagerank-Algorithmus.
Wer ihn kennt, versteht und nutzt, bringt seine Internetpräsentation nach vorn. Wer ihn missbraucht, wird bestraft. Doch wie funktioniert Pagerank und wann landet eine
Webseite oben in der Trefferliste?
Pagerank - So arbeitet die Formel
Hinter dem Pagerank steht ein ebenso simpler wie genialer Denkansatz:
- Zu jeder Webseite gibt es eine bestimmte Anzahl anderer Webseiten, die auf sie einen Hyperlink setzen.
- Jede dieser Webseiten hat selbst wiederum einen Pagerank.
- Der Link von einer Seite B zu Seite A wird wie in einer Abstimmung als eine Stimme von B für A gezahlt.
- Zusätzlich verleiht der Pagerank der Seite B der Stimme für A Gewicht. Je höher der Pagerank der Seite B, desto besser.
- Als weiterer Faktor fließt ein, wie viele Links sich auf Seite B insgesamt befinden. Je weniger Links insgesamt auf B sind, desto besser ist das für den Pagerank von Seite A.
- Die Summe aller Pageranks ist gleich der Summe aller Dokumente im Web. Beim Pagerank handelt es sich also um die Gewichtung eines Dokuments innerhalb des gesamten, erfassten Internets.
Wichtig: Der Pagerank wird für jede einzelne Seite berechnet, nicht für das komplette Webangebot. Deshalb kann es vorkommen, dass ein bestimmter Beitrag auf dem Webserver einen höheren Pagerank hat als die Homepage selbst.
Dampfungsfaktor - User einkalkulieren
Nach Annahme von Google repräsentiert der Pagerank die Wahrscheinlichkeit, mit der ein Surfer im Internet zufällig beim Klicken von Links auf einer Seite landet.
Da allerdings davon auszugehen ist, dass der Surfer nicht unendlich oft klickt, wurde in die Formel noch ein Dämpfungsfaktor einbezogen.
Er simuliert sozusagen den Fall, dass der Surfer einfach die Lust verliert, die Links zu verfolgen. Diese Dämpfung wird auf die Summe der Abstimmungen per Link auf die
Seite berechnet. In der Beschreibung ihres Algorithmus setzen Sergey Brin und Larry Page einen Dämpfungsfaktor von 0,85 voraus.
Man darf also annehmen, dass dieser in der Google-Realität auch in der Nähe dieses Wertes liegt.
Der wirkliche Pagerank wird übrigens im Gegensatz zu obigem Beispiel als Wahrscheinlichkeitswert zwischen 0 und 1 ermittelt.
Heraus kommen kleine Dezimalbrüche, die den Pagerank einer Webseite ergeben. Eine Seite mit dem Wert 0,01 hätte also die Wahrscheinlichkeit von einem Prozent,
dass ein Benutzer dort landet, wenn er einen zufälligen Link anklickt.
Bleibt schließlich noch ein Rätsel: Wenn der Pagerank als Zahl zwischen 0 und 1 ausgedruckt wird, warum sieht man ihn dann zum Beispiel in der
Google Toolbar als Wert zwischen 1 und 10? Die Lösung: Google rechnet den Wert um. Wie genau das geschieht, ist nicht klar.
Allerdings gehen viele Experten davon aus, dass die Umrechnung nicht linear geschieht, sonder logarithmisch. Sprich:
Der Sprung eines Toolbar-Pageranks von 1 auf 2 ist wesentlich leichter zu schaffen, als der von 9 auf die Bestnote 10.
Filter - Pageranks kleine Helfer
Anhand der Pagerank-Formel hat Google das Netz durchforstet — mit riesigem Erfolg. Doch mit dem Triumph kamen die Schmarotzer:
Webseitenbetreiber haben den Mechanismus schnell durchschaut und angefangen, ihre eigenen Angebote in den Suchmaschinen künstlich nach oben zu schieben.
In der Folge begann Google, sich mit immer neuen Verfahren gegen solche Spammer zu wehren. Daher ist der Pagerank inzwischen nur einer von vielen Faktoren,
die beeinflussen, wo eine Webseite auf den Suchergebnisseiten von Google auftaucht.
Dennoch: Häufig wird der Pagerank wie eine Wahrung gehandhabt: „Gibst Du mir zwei Links von Seiten mit PR 4, geb ich Dir einen Link von einer Seite mit PR 5".
Doch das ist naiv und überholt - ein einfacher Linktausch bringt nichts. Der Link etwa von einer Hundeseite zu einem Preisvergleich für Autos hilft dem Leser
nicht und findet auch bei Google keinen besonderen Anklang. Denn Google bewertet relevante Links hoher als solche, bei denen Herkunft und Ziel eines Querverweises
nichts miteinander zu tun haben. Bekommen Sie also eine Mail mit einem Linktausch-Angebot, prüfen Sie besser erst, ob die Seite zu Ihrer passt.
Nur wenn das der Fall ist, lohnt sich ein Tausch.
Doch zurück zu den Google-Suchalgorithmen. Der Pagerank ist nur die Spitze des Eisbergs. Unter der Oberfläche verbergen sich zig Filter und Bewertungsverfahren für
Webseiten und Suchergebnisse.