Publizieren im Web

Zur Einführung...

Dies ist der Versuch einer mehr intuitiven Einführung in den Kurs Publizieren im Web mit folgenden Teilen: Alternativ: Die ältere tiefergehende, mehr theoretische Einführung gibt es auch noch.

Client und Server beim World Wide Web

Versuch eines Bildes: Client-Rechner Client
Typischerweise PC, Mac, Workstation mit Internet-Zugang (Kabel, ISDN, Modem) mit Windows, MacOS, Linux etc. und Browser-Software (Netscape Navigator/Communicator, MS Internet Explorer oder anderer).

Das ist der Rechner, vor dem der Mensch sitzt, der aus dem World Wide Web des Internet Informationen beschaffen will.

Server
Typischerweise Rechner mit festem schnellen Internet-Zugang, großen Platten, Unix-Betriebssystem und HTTP-Server-Software (z.B. Apache).

Auf diesem Rechner wurden Dokumente (Texte, Bilddateien und anderes) abgelegt, die über das Internet abgerufen werden können.

Versuch eines Bildes: Server-Rechner

Ablauf beim Download eines WWW-Dokumentes auf Seiten des Client und des Servers

Als Link wird im folgenden Beispiel der URL http://www.uni-duesseldorf.de/~cappel/WebKurs/Intro.html verwendet.

Client-Seite Server-Seite
Benutzer klickt mit der Maus auf den Hyperlink.

Der Browser

  • löst den Hostnamen www.uni-duesseldorf.de in eine IP-Adresse auf,
  • baut eine TCP-Verbindung zu dieser Adresse und Portnummer 80 auf, dem Well known Port des Hypertext Transport Protcol (HTTP) (weil URL mit http: beginnt und keine andere Portnummer hinter dem Hostnamen explizit angegeben ist), und
  • sendet HTTP-Request über die TCP-Verbindung an den Server.
Server akzeptiert den Verbindungsaufbauwusch und empfängt den HTTP-Request;
  • übersetzt den Pfad im GET-Request in realen Pfad im Unix-Dateisystem nach Regeln in der Server-Konfiguration, die der Webmaster/die System-Verantwortliche vorgegeben hat;
  • prüft Existenz und Zugriffsrechte der referierten Datei;
  • bestimmt aus der Dateieendung den MIME-Typ des Dokumentes, z.B .html -> text/html;
  • sendet HTTP-Response mit Response-Header mit u.a.
    • Content-Type:
    • Content-Length:
    • Last-Modified:
  • Als letztes loggt der Server den Zugriff auf das Dokument mit Hostnamen oder IP-Adresse und Datum und Uhrzeit.
  • Browser empfängt HTTP-Response,
  • entnimmt dem Content-Type:-Header, daß es sich um ein HTML-Dokument handelt, das er selbst - ohne externen Viewer oder Plugin - darstellen kann;
  • der Content-Length:-Header wird verwendet, um den Fortschritt der Übertragung (in Prozent) darzustellen;
  • stellt - bereits während der Übertragung der Daten (seit Netscape 0.93) - das HTML-Dokument im Textfenster dar;
  • Übertragungen von Inline-Images (Bildern, Graphiken) werden i.d.R, parallel in weiteren TCP-Verbindungen vom Server angefordert, sofern sie nicht bereits im lokalen Cache (im Speicher oder auf Platte) vorhanden sind.
  • Das HTML-Dokument und Inline-Images werden im Cache gespeichert, der URL des Dokumentes auch in der History-Liste, um einerseits die Navigation über Back- und Forward-Button und das GO-Menü zu ermöglichen, andererseits besuchte Links zu erkennen und andersfarbig darstellen zu können.


Bernd Cappel, 2.3.1998
Erstellt für eine Lehrveranstaltung des URZ der HHU im Sommersemester 1998