Das W3C (World Wide Web Consortium)
Webapplikationen
Sprachen im Webauthoring
Die HTML (HyperText Markup Language)
Die Hypertext Markup Language ist die Sprache zur Erstellung von Webseiten. Der Begriff setzt sich aus zwei Elementen zusammen, die gut erläutern, worum es sich bei HTML handelt: Hypertext und Markup Language.
Hypertext
- Der Begriff »Hypertext« ist definiert als nichtlineare Organisation von textueller Information. Die einzelnen voneinander unabhängigen Informationsblöcke werden Knoten genannt. Ein HTML-Dokument kann zum Beispiel ein solcher Knoten sein. Ein Link ist eine Verbindung von einem Knoten zu einem anderen. Ein Link hat zwei Enden, genannt Anker, und eine Richtung. Der Link startet im Ursprungsanker und zeigt zu einem Bestimmungsanker.
Anker heben sich üblicherweise durch andere Farben oder Textformatierungen ab (zumeist blau und unterstrichen) und können per Maus- oder Tastenklick ausgeführt werden. So simpel und selbstverständlich das klingt, eröffnet es doch erstaunliche Möglichkeiten. Sie können in Ihren Dokumenten auf Dateien verweisen, die auf einem völlig anderen Rechner am anderen Ende der Welt liegen. Sie können so die »weltweiten Verknüpfungen« aufbauen, die den Grundgedanken des World Wide Web erst ermöglicht haben.
Markup Language
- Markup bedeutet zu deutsch »Textauszeichnung«. HTML ist als Markup Language also weder eine Programmiersprache noch eine Seitenbeschreibungssprache, sondern eine Textauszeichnungssprache. Sie zeichnet die logischen Bestandteile eines Dokumentes aus, wie zum Beispiel Überschriften, Textabsätze, Tabellen, Listen oder Grafikreferenzen. Mit HTML erfolgt also lediglich eine Einteilung des Dokumentes in seine einzelnen strukturellen Bereiche, genannt Elemente. HTML wird daher nicht programmiert, sondern schlicht geschrieben.
Um HTML-Dateien anzeigen zu können, braucht man einen so genannten Browser. Die bekanntesten sind wohl der Microsoft Internet Explorer und der Netscape Navigator. Es gibt noch weitere wie Opera, iCab, Lynx, Mozilla und viele andere. Diese Browser auf den unterschiedlichsten Plattformen haben HTML längst zum weitverbreitetsten Dateiformat der Welt gemacht. Ein wenig weiter in diesem Kapitel werde ich näher auf die verschiedenen Browser eingehen.
- Von der Textverarbeitung zur Hypertext Markup Language
Ein Überblick aus dem Jahre 1995 von Hubert Partl. - Layout im Web?
Warum HTML keine Seitenbeschreibungssprache ist - von Anders Henke. - Warum es in HTML keine Befehle gibt
Eine grundlegende Erläuterung, was HTML eigentlich ist.
Von SGML (Standard Generalized Markup Language) zu modernen Auszeichnungssprachen
Dieser Abschnitt erläutert die Entwicklung der Textauszeichnungssprachen in den letzten 15 Jahren. Erfahren Sie, wie HTML sich entwickelte und warum ein Schnitt zu XHTML notwendig war.
1986 wurde SGML als ISO-8879 verabschiedet. Sie bildet heute die Basis aller Auszeichnungssprachen. Charles Goldfarb entwickelte die Sprache, um die logische Struktur von wissenschaftlichen Texten beschreiben zu können. Da SGML eine Metasprache ist, können mit ihr andere Auszeichnungssprachen wie zum Beispiel HTML definiert werden. Ursprünglich geht diese Entwicklung auf die allgemeine Codierung (Generic Coding), die von IBM 1960 entwickelt wurde, zurück. Es wurde zwischen Inhalt und Darstellung unterschieden. SGML stellt Fähigkeiten zur Verfügung, mit denen Sie explizit festlegen können, welche Auszeichnungen in Ihren Dokumenten verwendet werden. Mit Hilfe dieser Definition werden dann darauf basierende Dokumente erstellt.
Tim Berners-Lee im Jahre 2003
Bereits Anfang der 1980er hatte Tim Berners-Lee, damals Physiker im Europäischen Kernforschungszentrum in Genf, dem so genannten CERN-Institut, die Vision eines Hypertextsystems, das es ermöglichen sollte, Informationen, die auf Computern in der ganzen Welt gespeichert sind, miteinander zu verknüpfen. 1990 entwickelte er das Projekt erstmals unter dem Namen »World Wide Web«. Im Dezember des Jahres arbeitete er an seiner »Hypertext Markup Language«, die beschrieb, wie Seiten mit Hypertextverknüpfungen formatiert werden. Das heutige HTML ist aus dieser ursprünglichen HTML entstanden.
HTML 1.0 hat es offiziell nie gegeben. Eine Spezifikation gibt es erst für HTML 2.0.
HTML 2.0 wurde konsequent nach SGML-Standard entwickelt und 1995 offizieller Sprachstandard. HTML 2.0 umfasste jedoch nicht alle Möglichkeiten, die Browserhersteller wie zum Beispiel Netscape bereits implementiert hatten, so zum Beispiel das Einbinden von Frames oder Javascripts. Autoren von Webseiten setzten sich deshalb über den HTML 2.0 Standard hinweg, um die Möglichkeiten, die die Browser boten, ausschöpfen zu können. Das World Wide Web Consortium (W3C), das die Spezifikationen verabschiedet und Standards im WWW regelt, und die Browserhersteller konnten sich nicht auf eine Version 3.0 einigen, da Interessen und Verständnis vom WWW zu stark divergierten. In dieser Zeit begann eine intensivere Zusammenarbeit zwischen dem akademisch orientierten W3C und kommerziell orientierten Softwareherstellern. Im Jahre 1997 wurde dann die offizielle Version 3.2 verabschiedet.
HTML 4.0 folgte im Jahre 1998. Tim Berners-Lee sagte dazu: Die Entwicklung von HTML nähert sich ihrem Ende. Jetzt ist es eher notwendig einige lose Enden zusammenzufügen.
Ende 1999 wurde HTML 4.01 verabschiedet, das einige Fehler aus HTML 4.0 beseitigte und diese Version ersetzte.
HTML entfernte sich im Lauf der Zeit von dem, was es einmal war. Aus einer Sprache zur Strukturierung von Daten wurde eine Sprache zur Präsentationen und Formatierung von Internetseiten. HTML wurde mehr und mehr durch Elemente und Attribute durchsetzt, die nicht mehr nur reine Textauszeichnung, sondern auch optische Darstellung der Informationen ermöglichten. Dies führte dazu, dass eine Plattformunabhängigkeit nicht mehr garantiert und eine Zugänglichkeit der Informationen nicht immer gewährleistet war. Das W3C erkannte das Problem. Bereits HTML 4 unterscheidet zwischen den Sprachversionen »Transitional«, wo der ganze Umfang der Sprache erlaubt ist, und »Strict«, wo einige Präsentations-Elemente und -Attribute nicht mehr enthalten sind. XHTML setzt diese Entwicklung fort. Darüber hinaus wurde CSS entwickelt.
Die XHTML (eXtensible HyperText Markup Language)
SGML zeichnete sich durch Stabilität und Flexibilität aus, jedoch wurde diese Sprache seit ihrer Verabschiedung 1986 immer komplexer, sodass es zu Kompatibilitätsproblemen zwischen verschiedenen Plattformen geführt hat. Eine neue Lösung wurde mit XML (eXtensible Markup Language) gefunden. Die Metasprache XML ist eine Teilmenge von SGML. Die Sprache wurde entwickelt, um die Vorteile von SGML ohne deren Komplexität zu erhalten.
So wie HTML eine Anwendung von SGML ist, entstand XHTML als Anwendung von XML. XHTML ist eine Reformulierung von HTML 4 auf Basis von XML. XHTML 1.0 ist der erste Dokumenttyp der XHTML-Familie. XHTML-Dokumente können ohne weiteres mit Standard-XML-Werkzeugen betrachtet, bearbeitet und validiert werden. XHTML Dokumente können so geschrieben werden, dass sie genauso gut oder besser in bestehenden HTML 4 Benutzeragenten funktionieren wie in neuen, XHTML konformen Benutzeragenten. XHTML ist der nächste Schritt in der Weiterentwicklung des WWW. Indem Inhaltsentwickler heute auf XHTML umsteigen, können sie in die XML-Welt mit allen dazugehörigen Vorteilen einsteigen, während sie sich auf die Abwärts- wie auch die zukünftige Kompatibilität ihrer Inhalte verlassen können.
In der praktischen Anwendung unterscheiden sich HTML und XHTML nur in Details. Darauf werden wir im Laufe dieser Einführung noch eingehen.
- Tim Berner-Lee
Die offizielle Webseite von Tim Berners-Lee. - Eine kurze Geschichte der Textverarbeitung
Kapitel 2 des Buches "XML in der Praxis" von Henning Behme und Stefan Mintert aus dem Jahre 1998. - Die Wurzeln von XML sind HTML und SGML
Ein Text von Florian Hars aus dem Jahre 2000. - HTML 4.01 Specification
W3C Recommendation, 24 December 1999 - HTML 4.01-Spezifikation
W3C-Empfehlung, 24. Dezember 1999, deutsche Übersetzung von Christine Kühnel, Stefan Mintert und Stefan Schumacher - XHTML 1.0 The Extensible HyperText Markup Language (Second Edition)
W3C Recommendation, 26 January 2000, revised 1 August 2002 - XHTML 1.0: Die Extensible HyperText Markup Language (Zweite Auflage)
W3C-Empfehlung, 26. Januar 2000, überarbeitet am 1. August 2002, deutsche Übersetzung von Judith Muhr und Stefan Mintert. - Buchempfehlung: Der Web Report (Tim Berners-Lee)
Gebundene Ausgabe, 332 Seiten, Verlag Econ, ISBN 3430114683 - Buchempfehlung: XHTML, CSS und Co. - Die W3C-Spezifikation für das Web-Publishing (Herausgeber Stefan Mintert)
Gebundene Ausgabe, 884 Seiten, Verlag Addison-Wesley, ISBN 3827318726
CSS (Cascading Style Sheets)
Sie haben gelesen, dass durch die Textauszeichnungssprache HTML logische Bestandteile eines Dokumentes ausgezeichnet werden. HTML dient also (zumindest ursprünglich) lediglich dazu, Strukturen festzulegen. Daraus folgt, dass Schrift, Farb- Größen- und Positionsdefinitionen nicht Aufgabe von HTML sind, trotzdem wird HTML auch zur optischen Gestaltung der Seiten missbraucht. Als Beispiel lässt sich da das Element font
nennen, aber im Grunde genommen auch Elemente wie b
(fett) oder i
(kursiv). Mit XHTML 2.0 wird das vorbei sein. Alle nicht dem Markup dienenden Elemente werden entfernt und von zukünftigen auf XHTML ausgerichteten User-Agents womöglich auch nicht mehr angezeigt werden.
- CSS ist eine Formatierungssprache, die es Autoren und Benutzern gestattet, Formatierungen (zum Beispiel Schriften, Abstände, Rahmen, Hintergrundfarben, Positionierung) von strukturierten Dokumenten (zum Beispiel HTML-Dokumente und XML-Instanzen) durchzuführen. Mit der Trennung der Präsentation eines Dokuments vom Inhalt des Dokuments vereinfacht CSS die Erfassung von Web-Dokumenten und die Verwaltung von Sites. CSS ist wie HTML selbst ein softwareunabhängiger Textcode und wird vom W3C normiert.
Es gibt mittlerweile zwei offizielle Sprachversionen von Cascading Style Sheets: CSS 1.0 aus dem Jahre 1996 und CSS 2.0 von 1998. Die Versionen 2.1 und 3.0 sind in Arbeit.
- FAQ-O-Matic für <dciwam/> - Cascading Style Sheets
Von Björn Höhrmann. - Nützliche Informationen für HTML Autoren
Ein Ausschnitt aus der Seite über HTML des W3C - übersetzt von Michael Nahrath. - Cascading Style Sheets, level 2
W3C Recommendation, 12-May-1998 - Cascading Style Sheets, Level 2
W3C-Empfehlung, 12. Mai 1998, deutsche Übersetzung von Judith Muhr und Stefan Mintert - Buchempfehlung: XHTML, CSS und Co. - Die W3C-Spezifikation für das Web-Publishing (Herausgeber Stefan Mintert)
Gebundene Ausgabe, 884 Seiten, Verlag Addison-Wesley, ISBN 3827318726 - Buchempfehlung: Cascading Style Sheets, Zweite Auflage (Hakon W. Lie, Bert Bos)
Broschiert, 416 Seiten, Verlag Addison-Wesley Professional, ISBN 0201596253 - Buchempfehlung: CSS Praxis, Zweite Auflage (Kai Laborenz)
Gebundene Ausgabe, 482 Seiten, Verlag Galileo Press, ISBN 3898424413
Das W3C (World Wide Web Consortium)
Webapplikationen
Zum Seitenanfang