Sonderzeichen mit Entities umschreiben
Für das Schreiben des XHTML-Markups verwendete Zeichen wie <
oder "
dürfen nicht Teil eines Attributwertes oder Elementinhalts sein, da der Browser diese Zeichen sonst als Teil des Markups missinterpretieren würde. Auf dieser Seite beschreibe ich, wie Sie diese Zeichen und auch mathematische Symbole oder griechische Buchstaben in ihrem XHTML-Dokument darstellen können.
Jedes Zeichen kann in XHTML durch eine der
&
-Formen dargestellt werden, als Zeichenname (character entity reference) oder als Zeichennummer (numeric character reference). Ein Zeichenname wird auch als Entity bezeichnet.Entities werden immer nach folgendem Schema notiert:
&entity;
Ein Entity wird durch ein
&
eingeleitet und durch ein;
beendet. Dazwischen steht ein festgelegter Name.- Aus diesem Grund muss das Zeichen
&
ebenfalls umschrieben werden, da der Browser sonst glauben könnte, ein Entity würde eingeleitet.
Neben der Angabe als Entity gibt es auch die numerische Notation als Unicode. Ältere Browser unterstützen diese Schreibweise besser als die Entity-Schreibweise. Es gibt zwei Darstellungen der Zeichennummer:
- Die breiter unterstützte dezimale Darstellung:
&#number;
- Und die hexadezimale Darstellung:
&#xhhhh;
Auf diese Art und Weise können Sie jedes Zeichen des Unicode-Zeichenvorrats darstellen.
- Unicode ist ein System, in dem die Zeichen aller bekannten Zeichensysteme der Welt festgehalten werden. Die Zeichen werden nach Klassen kategorisiert und erhalten einen Zeichenwert. Die Regelungen werden vom Unicode-Konsortium erstellt, das 1991 gegründet wurde. Seit Version 2.0 entspricht das Unicode-System der internationalen Norm ISO 10646. Mehr Informationen finden Sie auf der Homepage des Unicode-Konsortiums
- Aus diesem Grund muss das Zeichen
Die wichtigsten Sonderzeichen werde ich Ihnen hier anführen. Sollten Sie anstelle eines erwarteten Zeichens nur ein Kästchen als Platzhalter sehen, interpretiert der Browser entweder das verwendete Entity oder den Unicode nicht, oder Ihre Anzeigeschriftart verfügt nicht über das darzustellende Zeichen. Eine komplette Zeichensatzreferenz entnehmen Sie bitte der HTML 4.01 Spezifikation - Character entity references in HTML 4 des W3C oder schauen Sie in die umfangreiche Zeichenreferenz von SelfHTML.
Im Markup verwendete Zeichen
Zeichen | Bedeutung | Entity | Zeichennummer |
---|---|---|---|
< | kleiner als (less than) | < | < |
> | größer als (greater than) | > | > |
" | Doppeltes Anführungszeichen (quotation mark) | " | " |
& | Kaufmännisches Und (ampersand) | & | & |
Diverse andere häufig genutzte Zeichen
Zeichen | Bedeutung | Entity | Zeichennummer |
---|---|---|---|
| Geschütztes Leerzeichen (non-breaking-space) | |   |
© | Copyright-Zeichen | © | © |
® | Geschütztes Warenzeichen | ® | ® |
² | Hoch-2-Zeichen | ² | ² |
³ | Hoch-3-Zeichen | ³ | ³ |
« | angewinkelte Anführungszeichen links | « | « |
» | angwinkelte Anführungszeichen rechts | » | » |
½ | ein Halb | ½ | ½ |
¼ | ein Viertel | ¼ | ¼ |
¾ | drei Viertel | ¾ | ¾ |
ä | a Umlaut | ä | ä |
Ä | A Umlaut | Ä | Ä |
ö | o Umlaut | ö | ö |
Ö | O Umlaut | Ö | Ö |
ü | u Umlaut | ü | ü |
Ü | U Umlaut | Ü | Ü |
ß | scharfes S | ß | ß |
™ | Warenzeichen | ™ | ™ |
€ | Euro-Symbol | € | € |
¢ | Cent-Symbol | ¢ | ¢ |
£ | Pfund-Symbol | £ | £ |
¤ | Währungs-Symbol | ¤ | ¤ |
¥ | Yen-Symbol | ¥ | ¥ |
‘ | einfaches Anführungszeichen links | ‘ | ‘ |
’ | einfaches Anführungszeichen rechts | ’ | ’ |
“ | doppeltes Anführungszeichen links | “ | “ |
” | doppeltes Anführungszeichen rechts | ” | ” |
‰ | Promille | ‰ | ‰ |
- Checkliste für die Zeichencodierung in HTML
Diese Seite behandelt Szenarien mit unterschiedlichen Zeichensätzen und spricht Empfehlungen aus, um die Zugänglichkeit auf älteren Browsern und Versionen zu verbessern. Die Betonung liegt hier eher auf deutlichen Empfehlungen - die von genügend vielen Browsern interpretiert werden können, sofern diese richtig konfiguriert wurden - als darauf, zu viele Ausnahmen und Sonderfälle zu erklären: Anderes Hilfsmaterial aus diesem Bereich sollte dazu dienen, die verschiedenen Möglichkeiten zu verstehen. Von Alan J. Flavell, übersetzt von Dominik Boecker.