![]() ![]() ![]() |
![]() |
![]() |
![]() |
---|
戻る(Z)
HTML 4.01 文字実体参照やXHTML 文字実体参照の注意点を私的に和訳し抜粋しています。
HTML 4.01 文字実体参照一覧表の私的和訳(1)は、Latin-1(2)|Special(3)|Symbols(4)に分類されています。
文字参照とは、SGMLにおいて、ある種の特別な機能を持つ文字でキーボードで直接入力できない文字 < や & などをデータ文字としてHTMLソースなどで特別な使い方をされている文字を記述し表現する場合の方法です。
文字参照の方法には、ISO/IEC-10646( Unicode )の文字コード位置を指定する方法で、数値文字参照(A)と、 DTD で宣言された名前で指定する方法の文字実体参照(B)があります。
HTML 4の文字セット(character set)は ISO 10646-1 (USC-4) となっています。現在ではBMP面(C)しか定められていません。このBMP面の文字(256×256 の65536字)は、いわゆるユニコードと呼ばれている文字セットです。HTML4.0における文字参照の数値はこの文字セットの番号(コードポイント)ということになります。
数値文字参照は、ISO/IEC-10646( Unicode )の文字コード位置を10進数または16進数で表記し指定します。例えば、<を文字コード位置にすると
10進数で指定する場合は、<
のように文字コード位置を &#と;で囲みます。
16進数で指定する場合は、<
のように文字コード位置を&#xと;で囲みます。16進数表記を指定するために#の後に小文字のxがあることと古いブラウザには認識されないことに注意してください。(XHTML文書には、必ず16進数のXを小文字にして下さい。)
文字実体参照は、< のように DTD で宣言されたシンボル的な名前で指定します。ASCII十進は 大文字小文字が区別されるので注意してください。例えば、文字実体参照「å」は「小文字であるaの上にring(リング)がついた文字」となり、「Å」は「大文字であるAの上にring(リング)がついた文字」となります。「å」は数値の「å」よりも覚えやすい事も事実です。
NN4やIE4などの HTML4.0 に対応していないブラウザでは、文字実体参照をほとんど正しく表示できません。これらのブラウザで表示させたい場合は、 数値文字参照 を用いてください。
HTMLに関して言えば他に「CSSの識別子(文字参照)」「RFC 2396のURI(文字参照)」「Unicode文字参照」などがあります。
「'」アポストロフィ(所有格符号)は、XML1.0 で新しく定義された文字実体参照なので、 ほとんどのブラウザでは正しく表示されないようです。そのため、 ' ではなく、' を使用しましょう。
数値文字参照のコード配置、文字実体参照の名前、表示、その文字の定義等の表をW3CのCharacter entity references in HTML 4 (D)を参考に製作しました。
文字実体参照 | 数値文字参照 | 説明 | ||
---|---|---|---|---|
< | < | < | < | 小なり(less-than sign) |
> | > | > | > | 大なり(greater-than sign) |
& | & | & | & | アンパサンド(ampersand) |
" | " | " | " | 二重引用符(quotation mark) |
![]() |
| ![]() |
  | スペース改行なし(no-break space) |
at sign | (なし) | @ | @ | アットマーク(at sign) |
© | © | © | © | 著作権(copyright sign) |
® | ® | ® | ® | 登録商標(registered sign) |
™ | ™ | ™ | ™ | トレードマーク(trade mark sign) |
コラム