Nächste Seite: Tabellenverzeichnis
Aufwärts: diplom
Vorherige Seite: Der WWW-Agent zur Vervollständigung
Inhalt
- Unterschied zwischen dem Gesamtdegree in gerichteten
und
ungerichteten Netzwerken
.
- Die Entwicklung nach dem WS-Modell. Das Modell
interpoliert zwischen regulären Ringgittern und Zufallsgraphen bei
konstanter Anzahl Knoten und Verbindungen. Ausgangspunkt sind
Knoten, jeweils verbunden mit den 4 nächsten Nachbarn. Mit zunehmenden
nähert sich das Netzwerk den Zufallsgraphen (
). Aus Watts und
Strogatz [10].
- Die Wachstumsprozesse im Krapivsky et al. Modell:
(i) Hinzufügen eines neuen Knoten mit direktem Anknüpfen an einen
bestehenden Knoten. (ii) Erzeugen einer Verbindung. Aus Krapivsky et al. [8]
- Das World-Wide-Web als gerichtetes Netzwerk: Die Webseiten bilden die
Knoten mit Hyperlinks als gerichtete Verbindungen zwischen ihnen
- Umleitung/Redirect: Ein Betrachter folgt auf Seite A dem
Verweis auf Seite B. Durch die auf der Seite B eingerichteten Umleitung gelangt er
jedoch auf Seite C. Für den Betrachter sieht es nun so aus, als sei
Seite C dieselbe Seite wie B.
- Ablauf der Programme zur Aufnahme und Aufarbeitung der Daten
- Doppelt-logarithmischer Plot der Inlink-Verteilung des Netzes: Wahrscheinlichkeit
einen Knoten mit
Inlinks zu finden.
- Doppelt-logarithmischer Plot der Outlink-Verteilung des Netzes: Wahrscheinlichkeit
einen Knoten mit
Outlinks zu finden.
- Inlink-Verteilung des Webcrawl, (+) log-gebinnte Daten, (-) fit:
- Outlink-Verteilung des Webcrawl, (+) log-gebinnte Daten, (-) fit:
- Gemeinsame Verteilung
des Webcrawls.
Die Färbung gibt den Logarithmus der Wahrscheinlichkeit an, einen Knoten
mit Indegree
und Outdegree
zu finden. Die Verteilung ist auf
normiert.
- Gemeinsame Verteilung des Webcrawls
normiert mit der unkorrelierten Verteilung
.
Die Färbung gibt die Abweichung der Wahrscheinlichkeiten für einen Knoten
mit
Inlinks und
Outlinks an (lineare Farbskala).
- Diagonaler Schnitt durch die Abbildung 4.2
ausgehend von
, parallel zur hervortretenden
Diagonale. Es ist ein deutlich abweichender Verlauf zwischen der
unkorrelierten Verteilung und der Verteilung des Webcrawls zu sehen. Die
angelegte Gerade entspricht einem Exponenten von
.
- Gemeinsame Verteilung
des Modells von Krapivsky
et al. mit den
Parametern
,
und
, die nach den Gleichungen
(4.4 - 4.6) aus den Daten des Webcrawls
bestimmt wurden.
Die Färbung gibt den Logarithmus der Wahrscheinlichkeit an, einen Knoten
mit Inlinks i und Outlinks j zu finden. Die Verteilung ist
auf
normiert.
- Gemeinsame Verteilung aus dem Webcrawl
normiert mit der Verteilung des Krapivsky Modells
Die Färbung gibt die Abweichung der Wahrscheinlichkeiten an, einen Knoten
mit
Inlinks und
Outlinks zu finden (lineare Farbskala).
- Dargestellt sind je ein diagonaler Schnitt durch
Abb. 4.2 (
) und Abb. 4.5 (
),
ausgehend von
mit einer Steigung von Eins. Für
wird der
Verlauf der gemeinsamen Verteilung
gut durch das Modell
von Krapivsky et al. wiedergegeben. Die Daten sind jeweils in
logarithmischen Intervallen gemittelt und auf Werte um Eins verschoben worden.
- Mittlerer Indegree
der Nachbarn eines Knotens mit
Indegree
. Es wurde nur die Nachbarschaft betrachtet, die auf diesen
Knoten verweist (Inlink-Nachbarn).
- Korrelationen zwischen den Indegrees benachbarter
Knoten. Es werden die Verbindungen zwischen Knoten betrachtet, in
Abhängigkeit vom Indegree des Quellknotens
(hier
) und dem
Indegree des Zielknotens
(hier
).
- Verteilung der Links
des Webcrawls in Abhängigkeit vom Indegree des Quellknotens
und vom Indegree des Zielknotens
.
Die Färbung gibt den Logarithmus der Wahrscheinlichkeit an, einen solchen Link zu finden.
- Verteilung der Links
in Abhängigkeit vom Indegree des Quellknotens
und vom Indegree des Zielknotens
des Webcrawls, normiert mit der
erwarteten Verteilung
bei Netzwerken ohne Korrelationen zwischen den
Indegrees von Nachbarn (vgl. (5.2)).
- Verteilung der Links
in Abhänigikeit vom Indegree des Quellknotens
und vom Indegree des Zielknotens
, normiert mit der
Näherung
(5.5) für Netzwerke mit Korrelationen
zwischen dem In-/Outdegree eines Knotens und ohne Korrelationen zwischen den Indegrees benachbarter Knoten.
- Ein Beispielnetzwerk. Auf der linken Seite ist das
Netzwerk im benutzen Dateiformat beschrieben. Auf der rechten Seite ist
das beschriebene Netzwerk abgebildet.
- Doppelt-logarithmischer Plot der Inlink-Verteilung eines
Webcrawls der Seiten der Christian-Albrechts-Universität: Wahrscheinlichkeit
einen Knoten mit
Inlinks zu finden.
- Doppelt-logarithmischer Plot der Outlink-Verteilung eines
Webcrawls der Seiten der Christian-Albrechts-Universität: Wahrscheinlichkeit
einen Knoten mit
Outlinks zu finden.
Autor:Lutz-Ingo Mielsch