
Einen Einblick in die ungezählten HTML-Einführungen, die mittlerweile online im Internet verfügbar sind, finden Sie in dem Abschnitt der Virtuellen Bibliothek, zusammengestellt von Herrn Thomas Hilberer aus der ULB Düsseldorf.
Zur Einführung hier die Zusamenfassung aus der Spezifikation der Version 2.0 (RFC 1866):
The HyperText Markup Language (HTML) is a simple markup language used to create hypertext documents that are portable from one platform to another. HTML documents are SGML documents with generic semantics that are appropriate for representing information from a wide range of applications. HTML markup can represent hypertext news, mail, documentation, and hypermedia; menus of options; database query results; simple structured documents with in-lined graphics; and hypertext views of existing bodies of information.HTML has been in use by the World Wide Web (WWW) global information initiative since 1990. This specification roughly corresponds to the capabilities of HTML in common use prior to June 1994. It is defined as an application of ISO Standard 8879:1986 Information Processing Text and Office Systems; Standard Generalized Markup Language (SGML).
Allgemein bestehen SGML-Dokumente aus den drei Teilen:
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML//EN//2.0">wird i.d.R. auch fortgelassen.
Die einzelnen Elemente der Sprache HTML wie Überschriften, Absätze, Listen-Strukturen, Hervorhebungen werden angegeben in der Form
Start tag Content End tagDie öffnenden Start tags bestehen aus <, Name, evtl. Attributen und >, die zugehörigen schließenden End tags aus </, dem gleichen Namen und >. Bei einigen Tags wie <BR> gibt es kein End tag.
Die Namen werden aus (bis zu 71) Buchstaben und Ziffern gebildet, beginnend mit einem Buchstaben; Groß-/Kleinschreibung wird nicht unterschieden.
Attribute werden aus Paaren Name = Wert gebildet, teilweise bestehen sie nur aus dem Namen. Die Attributwerte werden häufig in Anführungszeichen " (Quotes) eingeschlossen; erforderlich ist dies, wenn Leerzeichen oder einige Sonderzeichen in den Werten vorkommen.
Die Zeichen, die in der Markup-Sprache eine besondere Bedeutung haben, nämlich <, > und & müssen, wenn sie im Text vorkommen sollen, selbst als Markup angegeben werden, und zwar als sog. Entities <, > bzw. &. Auch für die Nicht-ASCII-Zeichen von ISO 8859-1, z.B. die nationalen Umlaute, sind solche Entities definiert.
Zeilenwechsel, mehrfache Leer- bzw. Tabulatorzeichen werden - außerhalb des speziellen Preformatted-Elementes - als einfache Trennzeichen interpretiert und haben keine Bedeutung für Formatierung und Layout des Dokumentes. Kommentare in HTML-Dokumenten können eingegeben werden durch eine Klammerung des Kommentartextes mit <!-- und -->.
Das bekannte Beispiel: Netscape kennt HTML-Erweiterungen für die Darstellung von zentriertem und blinkendem Text, die viele Web-Autoren gerne zur Gestaltung ihrer Dokumente einsetzen. Andere Browser können solche Dokumente immer noch darstellen - nur eben ohne den beabsichtigten Effekt.
<HTML>in einen Head- und einen Body-Teil eingeteilt - ähnlich wie z.B. EMail-Messages nach RFC822.
<HEAD>
</HEAD>
<BODY>
</BODY>
</HTML>
Der Kopf (Head-Teil) enthält Information über das Dokument, nur der Body enthält den eigentlichen Dokumententext, der z.B. im Textfenster eines graphischen WWW-Browsers dargestellt wird.
Achtung: Dieser Kopf eines HTML-Dokumentes, der z.B. auch zu der auf einer Platte gespeicherten Fassung des Dokumentes gehört, ist nicht zu verwechseln mit dem HTTP-Header, der bei der HTTP-Übertragung dem Dokument vorausgeht. Beide haben unterschiedliche Funktionen, stehen evtl. aber in Beziehung über das Meta-Tag im Head-Teil.
Erweiterungen (zum Body-Tag) siehe:
<TITLE>Titel des Dokumentes</TITLE>
<META HTTP-EQUIV="HTTP-Header" CONTENT="Value " >"Meta"-Information über das Dokument, die nicht mittels eines anderen Elementes angegeben werden kann. In der ersten Form wird sie vom HTTP-Server in den HTTP-Header übernommen. Diese Methode kann z.B. benutzt werden, um den Expires:-Header zu setzen und damit den Ablauf der Gültigkeit/Relevanz eines Dokumentes bereits in seinem Kopf auszudrücken. (Andere Methoden hierfür etwa beim CERN-HTTP-Server arbeiten mit eigenen Meta-Dateien.)
<META NAME="Name" CONTENT="Value " >
<BR> hat die Bedeutung eines Zeilenwechsels (Line Break), i.d.R.
ohne zusätzlichen Zwischenraum, mit der gleichen Einrückung
wie der vorhergehende Text.
<HR> (Horizontal Rule) fügt eine waagerechte Linie in der
Breite des vorhergehenden Textes ein.
<UL>
<LI>1. Listen-Element (List Item)
<LI>2. Listen-Element
<LI>...
</UL>
Typisches Layout:
<OL>
<LI>1. Listen-Element (List Item)
<LI>2. Listen-Element
<LI>...
</OL>
Typisches Layout:
<MENU>
<LI>1. Listen-Element (List Item)
<LI>2. Listen-Element
<LI>...
</MENU>
Typisches Layout:
<DIR>
<LI>1. Listen-Element (List Item)
<LI>2. Listen-Element
<LI>...
</DIR>
Typisches Layout:
<DL>
<DT>Erster Begriff<DD>Erläuterung zum
ersten Begriff
<DT>Zweiter Begriff<DD>Erläuterung zum
zweiten Begriff
<DT>usw.
</DL>
Das erste <DT> muß gleich dem <DL> folgen; <DD> darf auch fehlen. Typisches Layout:
Dient dem Einfügen eines Bildes an dieser Stelle im Dokument. Mit dem SRC-Attribut wird die Referenz auf die Bild-Datei angegeben in genau der gleichen Form wie im HREF-Attribut bei Ankern. Als Standard für die Bildformate können GIF (Graphics Interchage Format) oder XBM (X Bitmap) angesehen werden; Netscape und andere neuere Browser unterstützten auch JPEG.
IMG-Elemente können als Inhalt von Ankern auftreten, verwendet z.B. für die Realisierung von Buttons, die nach Mausklick zu einem anderen Dokument führen oder bei kleinen Bildern als Hyperlink auf größere Bilder/Fotos. Hier ein Beispiel:
Der Text hinter ALT= kann von Linemode-Browsern verwandt werden anstelle einer Standardkennzeichnung wie [IMAGE], um z.B. die Information eines beschrifteten Buttons als Text zu liefern. Der Text kann auch leer sein, wenn das Bild sowieso keine Information vermittelt, sondern nur der Verzierung dient.
Die Angabe der Größe des Bildes in Pixeln (Breite und Höhe) ist optional, eine korrekte Angabe der Werte beschleunigt u.U. die Seitendarstellung, weil der Browser den Platzbedarf des Bildes schon vor seiner Übertragung berechnen kann.
Achtung: Bei einer falschen Größenangabe bei WIDTH=, HEIGHT= führen einige Browser ein automatisches Resize durch; man sollte sich darauf nicht verlassen, sondern immer die korrekte Größe angeben, u.U. ein gewünschtes Resize an der Grafikdatei selbst vornehmen. Weitere Attribute zu <IMG>:
Der Inhalt des PRE-Elementes ist vorformatierter Text, dessen Zeilenwechsel und Einrückungen mit mehrfachen Leerzeichen und Tabulatorzeichen erhalten bleiben sollen. Die Darstellung sollte deshalb in einem Zeichensatz mit fester Zeichenbreite erfolgen, Tabulatorzeichen werden interpretiert als Sprung zur nächsten Spaltenposition, die ein vielfaches von acht ist.
Innerhalb des PRE-Elementes sollten keine HTML-Elemente verwendet werden, die selbst Absätze und Einrückungen bewirken, wie <P>, alle Überschriften und Listen, wohl aber Anker und Hervorhebungen
Typische Anwendungen: Tabellen, die es in HTML Version 2 noch nicht gibt, Source-Listings.
Der Inhalt wird typischerweise eingerückt dargestellt. (Siehe Beispiel am Anfang dieses Dokumentes.)
Das ADDRESS-Element wird meist am Ende eines Dokumentes benutzt, um den Autor/die Autorin des Dokumentes zu nennen - häufig in Form eines Ankers, der auf eine persönliche Seite verweist. (Siehe Beispiel am Ende dieses Dokumentes.)
Der Inhalt bildet einen eigenen Absatz, oft in Italic gesetzt.
a:= 3*b + 5;