Nächste Seite: Die Verteilung mit In-/Outdegree
Aufwärts: Die Korrelationen im Webcrawl
Vorherige Seite: Die Korrelationen im Webcrawl
Inhalt
Zum Vergleich wird ausgehend von der Annahme, daß keinerlei Korrelationen zu
finden sind, ein unkorreliertes Netzwerk mit gleicher mittlerer
Konnektivität
betrachtet, wobei
die Anzahl der
Knoten und
die Anzahl der Links sind. Dieses Netzwerk soll eine
Verteilung der Knoten mit Indegree
identisch mit
des
Webcrawl haben, damit die Zusammensetzung der Indegrees von Knoten im
unkorrelierten Netzwerk mit dem Webcrawl übereinstimmt. Außerdem wird die
Zahl der Outlinks eines Knotens durch den Erwartungwert der
Outdegree-Verteilung
abgeschätzt.
Darüber hinaus werden alle Quell- und Zielknoten einer Verbindung
unabhängig und zufällig gewählt. Die Wahrscheinlichkeit, daß ein Link bei
einem bestimmten Knoten mit Indegree
endet, ist dann proportional zu
seinem Indegree. Mit der Anzahl
von Knoten mit einem
Indegree
wird die Wahrscheinlichkeit, daß eine Verbindung bei
irgendeinem Knoten mit Indegree
endet, zu
. Die Wahrscheinlichkeit, daß ein Link bei einem
Knoten mit Indegree
startet, folgt demselben Prinzip zu
. Somit entspricht die
Gesamtwahrscheinlichkeit, einen Link von einem Knoten mit Indegree
zu
einem Knoten mit Indegree
zu finden,
 |
(5.2) |
Abbildung:
Verteilung der Links
in Abhängigkeit vom Indegree des Quellknotens
und vom Indegree des Zielknotens
des Webcrawls, normiert mit der
erwarteten Verteilung
bei Netzwerken ohne Korrelationen zwischen den
Indegrees von Nachbarn (vgl. (5.2)).
 |
In Abbildung 5.4 ist die mit obiger Formel
(5.2) normierte Verteilung des
Webcrawls dargestellt, wobei die empirische Verteilung
verwendet wurde.
Man erkennt deutliche Abweichungen zwischen der gemessenen und der
theoretischen Verteilung. Insbesondere zeigt sich eine deutlich höhere Präsenz von
Links zwischen Knoten mit hohem Indegree, als es die Näherung (5.2)
wiedergibt.
Nächste Seite: Die Verteilung mit In-/Outdegree
Aufwärts: Die Korrelationen im Webcrawl
Vorherige Seite: Die Korrelationen im Webcrawl
Inhalt
Autor:Lutz-Ingo Mielsch