next up previous contents
Nächste Seite: Tabellenverzeichnis Aufwärts: diplom Vorherige Seite: Der WWW-Agent zur Vervollständigung   Inhalt


Abbildungsverzeichnis

  1. Unterschied zwischen dem Gesamtdegree in gerichteten $ k_{\rightleftharpoons }=k_i+k_o$ und ungerichteten Netzwerken $k$.
  2. Die Entwicklung nach dem WS-Modell. Das Modell interpoliert zwischen regulären Ringgittern und Zufallsgraphen bei konstanter Anzahl Knoten und Verbindungen. Ausgangspunkt sind $N=20$ Knoten, jeweils verbunden mit den 4 nächsten Nachbarn. Mit zunehmenden $p$ nähert sich das Netzwerk den Zufallsgraphen ($p=1$). Aus Watts und Strogatz [10].
  3. Die Wachstumsprozesse im Krapivsky et al. Modell: (i) Hinzufügen eines neuen Knoten mit direktem Anknüpfen an einen bestehenden Knoten. (ii) Erzeugen einer Verbindung. Aus Krapivsky et al. [8]
  4. Das World-Wide-Web als gerichtetes Netzwerk: Die Webseiten bilden die Knoten mit Hyperlinks als gerichtete Verbindungen zwischen ihnen
  5. Umleitung/Redirect: Ein Betrachter folgt auf Seite A dem Verweis auf Seite B. Durch die auf der Seite B eingerichteten Umleitung gelangt er jedoch auf Seite C. Für den Betrachter sieht es nun so aus, als sei Seite C dieselbe Seite wie B.
  6. Ablauf der Programme zur Aufnahme und Aufarbeitung der Daten
  7. Doppelt-logarithmischer Plot der Inlink-Verteilung des Netzes: Wahrscheinlichkeit $P(i)$ einen Knoten mit $i$ Inlinks zu finden.
  8. Doppelt-logarithmischer Plot der Outlink-Verteilung des Netzes: Wahrscheinlichkeit $P(j)$ einen Knoten mit $j$ Outlinks zu finden.
  9. Inlink-Verteilung des Webcrawl, (+) log-gebinnte Daten, (-) fit: $P_{in}\sim k^{-2.15}$
  10. Outlink-Verteilung des Webcrawl, (+) log-gebinnte Daten, (-) fit: $P_{out}\sim k^{-2.45}$
  11. Gemeinsame Verteilung $r_{crawl}(i,j)$ des Webcrawls. Die Färbung gibt den Logarithmus der Wahrscheinlichkeit an, einen Knoten mit Indegree $i$ und Outdegree $j$ zu finden. Die Verteilung ist auf $r_{crawl}(1,1)$ normiert.
  12. Gemeinsame Verteilung des Webcrawls normiert mit der unkorrelierten Verteilung $r_{crawl}(i,j)/r_0(i,j)$. Die Färbung gibt die Abweichung der Wahrscheinlichkeiten für einen Knoten mit $i$ Inlinks und $j$ Outlinks an (lineare Farbskala).
  13. Diagonaler Schnitt durch die Abbildung 4.2 ausgehend von $i=0,j=15$, parallel zur hervortretenden Diagonale. Es ist ein deutlich abweichender Verlauf zwischen der unkorrelierten Verteilung und der Verteilung des Webcrawls zu sehen. Die angelegte Gerade entspricht einem Exponenten von $0.87$.
  14. Gemeinsame Verteilung $r_{krr}(i,j)$ des Modells von Krapivsky et al. mit den Parametern $\lambda =0.96$, $\mu =1.42$ und $p=1/6.4$, die nach den Gleichungen (4.4 - 4.6) aus den Daten des Webcrawls bestimmt wurden. Die Färbung gibt den Logarithmus der Wahrscheinlichkeit an, einen Knoten mit Inlinks i und Outlinks j zu finden. Die Verteilung ist auf $r_{krr}(1,1)$ normiert.
  15. Gemeinsame Verteilung aus dem Webcrawl normiert mit der Verteilung des Krapivsky Modells $r_{crawl}(i,j)/r_{krr}(i,j)$ Die Färbung gibt die Abweichung der Wahrscheinlichkeiten an, einen Knoten mit $i$ Inlinks und $j$ Outlinks zu finden (lineare Farbskala).
  16. Dargestellt sind je ein diagonaler Schnitt durch Abb. 4.2 ($\times $) und Abb. 4.5 ($+$), ausgehend von $i=0,j=15$ mit einer Steigung von Eins. Für $n>5$ wird der Verlauf der gemeinsamen Verteilung $r_{crawl}(i,j)$ gut durch das Modell von Krapivsky et al. wiedergegeben. Die Daten sind jeweils in logarithmischen Intervallen gemittelt und auf Werte um Eins verschoben worden.
  17. Mittlerer Indegree $<I>$ der Nachbarn eines Knotens mit Indegree $i$. Es wurde nur die Nachbarschaft betrachtet, die auf diesen Knoten verweist (Inlink-Nachbarn).
  18. Korrelationen zwischen den Indegrees benachbarter Knoten. Es werden die Verbindungen zwischen Knoten betrachtet, in Abhängigkeit vom Indegree des Quellknotens $i_1$ (hier $i_1=2$) und dem Indegree des Zielknotens $i_2$ (hier $i_2=3$).
  19. Verteilung der Links $L(i_1, i_2)$ des Webcrawls in Abhängigkeit vom Indegree des Quellknotens $i_1$ und vom Indegree des Zielknotens $i_2$. Die Färbung gibt den Logarithmus der Wahrscheinlichkeit an, einen solchen Link zu finden.
  20. Verteilung der Links $L(i_1, i_2)$ in Abhängigkeit vom Indegree des Quellknotens $i_1$ und vom Indegree des Zielknotens $i_2$ des Webcrawls, normiert mit der erwarteten Verteilung $L_0(i_1,i_2)$ bei Netzwerken ohne Korrelationen zwischen den Indegrees von Nachbarn (vgl. (5.2)).
  21. Verteilung der Links $L(i_1, i_2)$ in Abhänigikeit vom Indegree des Quellknotens $i_1$ und vom Indegree des Zielknotens $i_2$, normiert mit der Näherung $L_1$ (5.5) für Netzwerke mit Korrelationen zwischen dem In-/Outdegree eines Knotens und ohne Korrelationen zwischen den Indegrees benachbarter Knoten.
  22. Ein Beispielnetzwerk. Auf der linken Seite ist das Netzwerk im benutzen Dateiformat beschrieben. Auf der rechten Seite ist das beschriebene Netzwerk abgebildet.
  23. Doppelt-logarithmischer Plot der Inlink-Verteilung eines Webcrawls der Seiten der Christian-Albrechts-Universität: Wahrscheinlichkeit $P(i)$ einen Knoten mit $i$ Inlinks zu finden.
  24. Doppelt-logarithmischer Plot der Outlink-Verteilung eines Webcrawls der Seiten der Christian-Albrechts-Universität: Wahrscheinlichkeit $P(j)$ einen Knoten mit $j$ Outlinks zu finden.


Autor:Lutz-Ingo Mielsch