Network Working Group T. Berners-Lee Request for Comments: 1866 MIT/W3C Category: Standards Track D. Connolly November 1995 Hypertext Markup Language - 2.0 このメモの状態(Status if this Memo) =================================== この文書は、インターネットコミュニティのための標準プロトコルを述べたもので、改良のために議論や提案を求めるものです。標準化の状況とこのプロトコルの状態は最新版の"Internet Official Protocol Standards"(STD1)を参照してください。このメモの配布は自由です。 概要(Abstract) ============== ハイパーテキストマークアップランゲージ(HTML)は、プラットホームに依存しないハイパーテキスト文書を作成するために使われるシンプルなマークアップ言語です。HTML文書はSGML文書の一種であり、幅広い分野にわたる情報を表現するのに適しています。ハイパーテキストニュース、メール、文書、そしてメニューの選択やデータベースの検索結果、絵を含んだ簡単な構造の文書、存在する大量の情報をハイパーテキスト表示させるといったハイパーメディアを表現することができます。 HTMLは1990年からワールドワイドウェブ(WWW)の全体的な情報の先駆けとして利用されています。この仕様書は1994年7月以前に一般的に使用されたHTMLの能力におおよそ一致します。HTMLはISO Standard 8879:1986 Information Processing Text and Office System; Standard Generalized Markup Language (SGML) のアプリケーションです。 この仕様書では"text/html"というInternet Media Type (RFC1590) と MIME Content Type (RFC1521) を定義しています。 目次(Table of Contents) ======================= 1. イントロダクション 1.1 ねらい 1.2 準拠 2. 用語 3. SGMLアプリケーションとしてのHTML 3.1 SGML文書 3.2 HTML語彙の構文 3.3 HTML Public Text Identifiers .......................... 17 3.4 HTML文書の例 4. インターネットメディアタイプとしてのHTML 4.1 text/htmlメディアタイプ 4.2 HTML文書の表現 5. 文書構造 5.1 文書の要素:HTML 5.2 ヘッダ:HEAD 5.3 ボディ:BODY 5.4 見出し:H1 ... H6 5.5 ブロック構成要素 5.6 リスト要素 5.7 語句マークアップ 5.8 改行:BR 5.9 水平線:HR 5.10 イメージ:IMG 6. 文字、単語、段落 6.1 HTML文書文字セット 7. ハイパーリンク 7.1 リソースへのアクセス 7.2 ハイパーリンクの有効化 7.3 画像リソースの同時表現 7.4 フラグメント識別子 7.5 質問とインデックス 7.6 イメージマップ 8. フォーム 8.1 フォーム要素 8.2 フォーム提出 9. HTMLパブリックテキスト 9.1 HTML DTD 9.2 厳密なHTML DTD 9.3 レベル1HTML DTD 9.4 厳密なレベル1HTML DTD 9.5 HTMLのSGML宣言 9.6 HTMLのSGML公開実体カタログ例 9.7 文字記号実体セット 10. セキュリティへの配慮 11. 参考文献 12. 謝辞 12.1 著者の住所 13. HTMLでコード化された文字記号セット 14. 提案された実体 1.イントロダクション(Introduction) ================================== Hypertext Markup Language(HTML)は、ハイパーテキスト文書を作成するために使われるシンプルなマークアップ言語で、あるプラットホームから別のプラットホームへ簡単に移すことができます。HTML文書はSGML文書の一種であり、幅広い分野にわたる情報を表現するのに適しています。 HTMLはSGMLアプリケーションですので、この仕様書はSGMLの実用的な知識をもたらすでしょう。 1.1.ねらい(Scope) ----------------- HTMLは1990年からワールドワイドウェブ(WWW)の全体的な情報の先駆けとして利用されています。以前はインターネット上の様々なところからHTMLについての非公式な文書を入手することができました。この仕様書は、1994年7月以前に一般的に使用されたHTMLの能力におおよそ一致するように、一連の特徴を統合、整理し、形式化したものです。インターネットコミュニティにおいては新たなHTMLの特徴が多数提案され実験されています。 したがってこの文書では(それ以前の非公式な仕様と区別するために)HTML2.0を定義しています。新たな特徴を含めたHTMLの次期バージョン(おそらくは上位互換)は、より上位のバージョンとしてリリースされるでしょう。 HTMLは、ISO Standards 8879:1986,"Information Processing Text and Office Systems; Standard Generalized Markup Language"(SGML)のアプリケーションです。HTMLの文書型定義(DTD)は、SGMLの観点から正しいHTMLの文法を定義しています。 また、この仕様書は`text/html'というInternet Media Type[IMEDIA]とMIME Content Type[MIME]としてのHTMLも定義しています。これ自体は、HTMLの文法の意味を定義するもので、(ブラウザなどの)ユーザーエージェントがどのように文法を解釈するかを示しています。 1.2.準拠(Conformance) --------------------- この仕様書はHTML文書の文法とユーザーエージェントの動作の外観を決定するものです。 1.2.1.文書(Documents) 以下の要件を満たす文書はHTML文書に準拠しています * SGML文書に準拠し、HTML DTDに準拠している(9.1.「HTML DTD」を参照) 注意‐歴史的なユーザーエージェントにおいては、いくつかの文法上の語法がサポートされていたりされていなかったりと矛盾した状況になっています。これらの語法は、この仕様書を通して、このような注意書きの中で確認していきます。 * この仕様書におけるアプリケーションのしきたりに準拠している。例えば、要素のHREF属性の値はURIの文法に準拠しなければならない。 * その文書の文字セットが[ISO-8859-1]を含み、[ISO-10646]に一致している。すなわち、各々のコード位置が、13で列挙する「HTMLの文字コードセット」に含まれ、その文書の文字コード位置が[ISO-10646]で定められたコード位置と一致する。 注意‐文書を表わす際にはいくつかの異なった文字コード体系が使用されています。例えば`ISO-2022-JP'の文字コード体系は、[ISO-10646]のサブセットなのでHTMLで使用可能です。重要な特徴は、数字はその文書の文字コードに関係なく[ISO-10646]に準拠しているということです。 1.2.2.Feature Test Entities feature test entitiesでHTML DTDは標準的なHTML文書タイプと様々なバリエーションを定義しています。Feature Test EntitiesはHTML DTDにおける宣言であり、DTDの一部を含むか除くかをコントロールします。 HTML.Recommended その言語のいくつかのfeaturesは広範囲な使用での互換性に必要です。しかし、それにより文書の構造の完全性を損なうかもしれません。このfeature test entitiesはこれらのfeaturesを除いた、より規範的なDTDを選択します。デフォルトでは`IGNORE'にセットされます。 例えば、文書の構造を保つために、ユーザーエージェントはHTML文書をrecommendedサブセットに変換するか、あるいは文書をrecommendedサブセットに合わせるように要求するでしょう。 HTML.Deprecated その言語のいくつかのfeaturesは古い使用との互換性に必要です。しかしこれは使われるものと組み込まれているものが矛盾する傾向があり、そこでdeprecatedが使われます。このfeature test entitiesは、これらのfeatureを許可したDTDにします。デフォルトでは`INCLUDE'にセットされます。 変換ソフトや編集ソフトで作成された文書にはdeprecatedの語句を含むべきではありません。 1.2.3.ユーザーエージェント(User Agents) HTMLユーザーエージェントは以下の要件に準拠します: * HTML文書の文字からデータ文字を取りだし、[SGML]に従って、マークアップする。 注意‐仕様にない文書を扱うための習慣が広範囲にわたり強い影響力で存在します。詳しくは4.2.1.「宣言されていないマークアップのエラー処理」を見てください。 * `ISO-8859-1'文字コード系をサポートし、ISO Latin Alphabet No.1 を6.1.「HTML文書の文字セット」で述べる仕様として処理する。 注意‐非欧米の書式をサポートするために、HTMLユーザーエージェントに`ISO-10646-UCS-2'あるいは同様の文字コード系をサポートすることを推奨します。[ISO-10646]と同程度の文字の種類は実用的です。 * 同一の印の連続として分析した文書は同一にふるまう。 例えば、コメントやタグの空白は無視されるので、ユーザーエージェントの動作には影響しません。 * HTML文書において要素からハイパーリンクにより、ユーザーが行き来する(あるいは少なくとも行き来する許可を与える)ことが可能である さらにレベル2のユーザーエージェントは以下の要件にも準拠します: * 情報サービスへの要求としてHTML文書内で、フォーム入力と提出の値を表現することができる。 2.用語(Terms) ============= 絶対URI(absolute URI) 例えば[URL]のように完全な形式でのURI アンカー(anchor) ハイパーリンクの両端の一つ。要するに要素としてマークアップされた語句 ベースURI(base URI) 他の絶対URIと区別するために、相対URIと共に使用する絶対URI キャラクター(character) 文字や数字のように情報の原子となるもの。グラフィックキャラクタはglyphsと関連し、一方でコントロールキャラクタは記号を処理します。 文字コード系(character encording scheme) キャラクタの集まりに基づいて連続したオクテットの領域と文字の列を定めたもの。すなわち一連のオクテットと文字コード系により文字を確定します。 文字群(character repertoire) コード化された文字列のように限られた数の文字の集まり。 コード位置(code position) 整数。コード化された文字セットとその領域でのコード位置により文字を確定します。 コード化された文字セット(coded character set) 整数の一部の領域と文字群の列をもったもの。すなわち、いくつかの整数(たいてい{0,1,2, ...,N})により、コード化された文字セットとその文字セットの整数で文字を区別しています。逆にいえば、文字とコード化された文字セットでその文字のコード位置(稀な例ではいくつかのコード位置)が決定されます。 適合したHTMLユーザーエージェント(conforming HTML user agent) the Internet Media Type `text/html'の処理においてこの仕様書に従っているユーザーエージェント。 データ文字(data character) 要素の中身を作っているマークアップ記号以外の文字 文書文字セット(document character set) 文書で使用される全ての文字を含んだ文字コードセット。あらゆるSGML文書は厳密に一つの文書文字セットを持っています。参照する数字はその文書文字セットにより決定されます。 DTD 文書型定義(document type definition)。要素(element)と実体(entity)の宣言を含み、特定のタイプのマークアップでSGMLが従うルール。[SGML] 要素(element) DTDで定義された階層構造の構成要素。文書においては、ふつう開始タグと終了タグというマークアップ記述により他と区別されます。[SGML] 終了タグ(end-tag) 要素の終了を明かにするマークアップ記述。[SGML] 実体(entity) 記述法や解釈と関連したデータ。例えば一連のオクテットはInternet Media Typeに関連しています。[SGML] (fragment identifier) `#'で始まるHREF属性の値の一部で、ハイパーリンクの行き先を提示します。 フォームデータセット(form data set) 名前(name)/値(value)の組み合わせ。名前はHTML文書より与えられ、値はユーザーにより与えられます。 HTML文書(HTML document) このDTDに従ったSGML文書 ハイパーリンク(hyperlink) 頭(head)と尾(tail)と呼ばれるふたつのアンカー間の関係。リンクは尾から頭に行きます。頭と尾は、それぞれ目的地(destination)と源(source)としても知られています。 マークアップ(markup) 文書の構造を明かにするために、その文書データに構文的に分けられた文字を挿入すること。マークアップの種類には、記述的マークアップ(descriptive markup)(タグ)、参照(references)、マークアップ宣言(markup declarations)、処理命令(processing instructions)の四種類があります。 (may) 文書あるいはユーザーインターフェースは、ここでの記述で許可しているかどうかに従います。 メディアタイプ(media type) [IMEDIA]のようなInternet Media Type。 メッセージ実体(message entity) ヘッド部(head)とボディ部(body)。ヘッド部は名前/値の集まりで、ボディ部は一連のオクテットです。ヘッド部はコンテントタイプ(content type)とボディ部の転送コードの内容を定義します。 最低限準拠したHTMLユーザーエージェント(minimally conforming HTML user agent) フォーム処理を除き、この仕様書に準拠したユーザーエージェント。それはレベル1のHTML文書をのみ処理します。 (must) ここでの記述に矛盾する文書やユーザーエージェントは準拠しません。 数字の参照(numeric character reference) 文書の文字セットにおいてコード位置により文字が参照されるマークアップ。 SGML文書(SGML document) 実体の集まりとして物理的に、そして要素の階層において論理的に定められた一連の文字。SGML文書はデータ文字とマークアップから成り、マークアップは情報の構造とその構造の実例を記述します。[SGML] (shall) もし文書やユーザーエージェントがここの記述に反するならば、それはこの仕様書に準拠していません。 (should) もし文書やユーザーエージェントがここの記述に反するならば、この仕様に準拠していても実行時に望ましくない結果がおこるかもしれません。 開始タグ(start-tag) 要素の開始を明かにし、一般的な区切りと属性を示す記述的マークアップ。[SGML] 構文参照文字セット(syntax-reference character set) マークアップに使用される全ての文字を含んだ文字セット。すなわち名前を示す文字(name characters)と区切り文字(delimiter character)です。 タグ(tag) 要素を区切るマークアップ。タグにはDTDの要素宣言を参照する名前を含み、属性を含むこともできます。[SGML] テキスト実体(text entity) 限られた範囲の文字。一般的にテキスト実体は、ネットワークにより送られるかファイルに格納された文字コード系に従った一連のオクテットの形態をとります。[SGML] (typical) 典型的な処理はたくさんの要素を記述することです。これは仕様書の必須部分ではありませんが、設計者へのガイドと、要素が使われていることを説明する助けとして与えられます。 URI Uniform Resource Identifierは(特にインターネット上の)リソースを特定するものとして示す定型の書式です。URIはハイパーリンクのアンカーを特定するためにHTMLで使用されます。またUniform Resource Locater(URL)や相対URLを含んでいます。 ユーザーエージェント(user agent) ユーザーのためにインターフェースを持ち要求を処理するようなシステムの組み合わせ。例えばWWWブラウザやメーラー(a mail user agent)などです。 WWW ワールドワイドウェブ(The World-Wide Web)はハイパーテキストベースの分散情報システムで、スイスのCERNの研究者により開発されました。 3.SGMLアプリケーションとしてのHTML(HTML as an Application of SGML) ========================================================================== HTMLはISO 8879:1986 -- Standard Generalized Markup Language (SGML)のアプリケーションです。SGMLは構造化された文書の型とその文書型の例を表現するマークアップ言語を定義したシステムです。HTMLのDTDの公式文――DTDとSGML宣言――は9.「HTMLパブリックテキスト」に載せてあります。 「HTML」という用語は、ここで定義される文書型とそれに従って表現するためのマークアップ言語の両方を意味します。 3.1.SGML文書(SGML Documents) -------------------------------- HTML文書はSGML文書、すなわち実体の集まりとして物理的に、また要素の階層として論理的に構成された一連の文字です。 SGMLの仕様書では、SGML文法の最初の成果としてSGML文書をSGML宣言、序文(prologue)、例(instance)の三つの部分に分けています。この仕様書に従えば、序文とはDTDのことです。このDTDは別の文法で記述されます。それは、文書型宣言(doctype declaration)で開始記号が示され、データ文字とタグで終了し、要素宣言により決定します。これらはDTD、つまりこの文法により定義された言語に従わなければなりません。 SGML宣言は文法における語彙を決定します。SGML宣言では、文書内のすべてのテキスト実体に存在する全ての文字を含んだ文字集合とその文字に対応したコード位置を表わす文字セットを定義します。 また、SGML宣言は構文参照の文字セットやSGMLの抽象的な構文を具体的なものにするための他のパラメータを定義します。この具体的な構文により、序文の文法において文書の一連の文字が一連の終端とどのように位置づけられるのかを決定します。 例えば以下の文書を見てみましょう。 構造分析の例

テキスト。 *wow*

HTMLユーザーエージェントは、9.5.「HTMLにおけるSGML宣言」で示されるSGML宣言を使用するべきです。その文書の文字セットにより、`*'はアスタリスク文字`*'とみなされます。 上の例は、以下のような一連の終端としてみなされます。 1. 開始タグ: TITLE 2. データ文字: "構造分析の例" 3. 終了タグ: TITLE 4. 開始タグ: P 5. データ文字 "テキスト。" 6. 開始タグ: EM 7. データ文字: "*wow*" 8. 終了タグ: EM 9. 終了タグ: P DTD文法の最初の記号はHTMLで、それにより`-//IETF//DTD HTML 2.0//EN'(9.1.「HTML DTD」)により定義される仕様書として与えられます。終端までは以下のように構成されます。 HTML | \-HEAD | | | \-TITLE | | | \- | | | \-"構造分析の例" | | | \- | \-BODY | \-P | \-

| \-"テキスト。 " | \-EM | | | \- | | | \-"*wow*" | | | \- | \-

要素のいくつかはタグにより他との境界が示され、要素の範囲が明確になっています。要素は要素と要素を含みます。は、開始タグと終了タグで区切られた要素を含みます。 3.2.HTML語彙の構文(HTML Lexical Syntax) ------------------------------------------- SGMLは抽象的な構文と、具体的な構文の参照について述べています。分量や能力(すなわち字数の制限)は別にして、すべてのHTML文書は具体的な構文の参照を用いています。とくにすべてのマークアップ記号はISO-646に含まれます。データ文字は、文書文字セット(6.「文字、単語、段落」を参照)により決定されます。 SGMLの構成の完全な討議、すなわち一連の文字とタグやデータとの対応は、SGMLスタンダードに委ねられています。この節は単なる要約です。 3.2.1.データ文字(Data Characters) マークアップに使用されないすべての文字はデータ文字になります。いくつかのマークアップもデータ文字列になっています。文書文字セットにより、数字はただ一つの文字列に対応します。HTMLのDTDで定義された実体はそれぞれただ一つの文字列に対応します。 例えば、 abc<def => "abc","<","def" abc<def => "abc","<","def" セミコロンの区切りや数字は、文字記号が名前の一部として別に認識されるときにのみ参照されます([SGML]の9.4.5 "Reference End"を参照)。 abc < def => "abc ","<"," def" abc < def => "abc ","<"," def" アンパサンド(&記号)は、後ろに文字や`#'記号、数字が続く場合にはマークアップ記号としてのみ認識されます。 abc & lt def => "abc & lt def" abc &# 60 def => "abc &# 60 def" プレーンテキストからHTMLに変換する際に有効なテクニックは、'<'や'&'、'>'などの記号を以下のように実体参照や数字参照に置き換えることです。 記号 実体参照 数字参照 記号の種類 --------- ---------- --------- ------------ & & & アンパサンド < < < 小なり > > > 大なり 注意‐SGMLの仕組みであるCDATAとRCDATA宣言文は、実体参照を使用することなく`<'や`>'、`&'といった記号の入力が許可されています。この仕組みは矛盾した仕様や実装の傾向があり、転送のためにHTMLを7ビットアスキー文字に変換する際に問題をおこすために、このバージョンのHTMLでは採用されていません。5.5.2.1,「例とリスティング:XMP,LISTING」を見てください。 3.2.2.タグ(Tags) タグは、見出し、段落、リスト、強調文字、そしてリンクといった要素の範囲を区切ります。ほとんどのHTMLタグは、開始タグ、内容に応じた要素名や属性、それに続く終了タグとして文書内で区別されています。開始タグは`<'と`>'で区切られ、終了タグは`</'と`>'で区切られます。例えば以下のようにします: <H1>これは見出しです</H1> いくつかの要素は終了タグはなく開始タグのみで使用されます。例えば改行するときには`<BR>'タグを使います。加えて、段落(`</P>')やリスト項目(`</LI>')、定義項目(`</DT>')、定義内容(`</DD>')のようないくつかの終了タグは省略してもかまいません。 要素の内容は一連のデータ文字列と入れ子になった要素です。アンカーのようないくつかの要素は入れ子にすることはできません。アンカーと強調は別の部分に入れるようにしてください。HTML DTDのすべての詳細は9.1, "HTML DTD"を見てください。 注意‐HTMLのSGML宣言ではSHORTTAG YESとなっています。これはNETタグのように、例えば`<EM/.../'、開始タグ省略、`<>'、終了タグ省略、`</>'というように、有効なタグの使用法を意味しています。この語法が広くサポートされるまでは、この語法を使用することには強く反対します。 3.2.3.要素名(Names) 要素名は、文字、数字、ピリオド、ハイフンから成ります。9.5,「HTMLのSGML宣言」にあるように、HTMLのSGML宣言における`NAMELEN'パラメータで、要素名の長さは72文字以内に制限されています。要素と属性名は大文字小文字を区別しませんが、実体名は区別します。例えば`<BLOCKQUATE>'も`<BlockQuate>'も`<blockquate>'も同じですが、`&'は`&'とは異なります。 開始タグにおいては、要素名はタグ開始区切り記号`<'に続けて書かなければなりません。 3.2.4.属性(Attributes) 開始タグの中では、要素名とタグ終了区切り記号との間に空白と属性を書くことができます。属性の仕様は一般的に、属性の名称、等記号、値で形成されていますが、いくつかの属性は名称のみでもかまいません。空白は等記号の前後につけることができます。 属性の値は以下のどちらかになります。 * シングルクォーテーション、またはダブルクォーテーションで区切られ、区切り記号を含まない文字列 注意‐いくつかの歴史的な仕様では、`>'記号はいかなる場合でもタグの終了を表わすと考えられています。それらの仕様との互換性を保つために、属性値に`>'を使用する場合には数字参照(a numeric character reference)で表わすべきです。例えば、`<IMG SRC="eq1.jpg" alt "a>b">'は、`<IMG SRC="eq1.jpg" alt "a>b">'か`<IMG SRC="eq1.jpg" alt "a>b">'と書くべきです。 * 名称トークン(文字、数字、ピリオド、ハイフンなど)。名称トークンは大文字小文字を区別しません。 注意‐歴史的な仕様の中には、名称において空白と`>'以外の全ての文字記号が使用可能なものもあります。 下の例では、<img>は要素名で、srcが属性名であり、`http://host/dir/file.gif'は属性値です <img src='http://host/dir/file.gif'> 文字列による属性値を処理する際に有効なテクニックは、引用符や空白を以下のように実体参照や数字参照に置き換えることです。 記号 実体参照 数字参照 記号の種類 --------- ---------- ----------- --------------------- HT タブ LF ラインフィード CR キャリッジリターン SP スペース " " " 引用符 & & & アンパサンド 例えば以下のようになります。 <IMG SRC="image.jpg" alt="First "real" example"> 属性値の長さは、SGML宣言(9.5,「HTMLのSGML宣言」)の`NAMELEN'パラメータで1024文字に制限されています。 ISMAPやCOMPACTのような属性は最小限の語法([SGML]の7.9.1.2 "Omitted Attribute Name"を見てください)で書いてもかまいません。 <UL COMPACT='compact'> というマークアップを最小限の語法で記述すると以下のようになります。 <UL COMPACT> 注意‐歴史的な仕様の中には最小限の語法しか認識できないものもあります。 3.2.5.コメント(Comments) HTML文書の中でコメントを挿入するにはコメント宣言を使用します。コメント宣言は、`<!'とゼロもしくはそれ以上のコメント、それに続く`>'から成ります。個々のコメントは、`--'で始まり次の`--'までのテキスト全てが含まれます。コメント宣言では個々のコメントの後に空白を入れることが可能ですが、最初のコメントの前に入れることはできません。コメント宣言全体は無視されます。 注意‐歴史的な仕様の中には、`>'記号をいかなる場合でもコメントの終了とみなす誤ったものがあります。 コメントの例 <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> <HEAD> <TITLE>HTMLのコメント例

3.3.(HTML Public Text Identifiers) ---------------------------------- この仕様に準拠したHTMLであることを明示するには、それぞれの文書を以下の文書型宣言で始めなければなりません。 この文書型宣言は9.1,「HTML DTD」で示すHTML DTDに関連しています。 注意‐もし`text/html'のメッセージ実体が文書型宣言から始まっていない場合には、HTMLユーザーエージェントは上の文書型宣言を推測すべきです。 この文書型宣言も9.1,「HTML DTD」で示すHTML DTDに関連しています。 この文書型宣言は9.3,「レベル1HTML DTD」によるレベル1HTML DTDに関連しています。レベル1文書はフォーム要素が存在してはいけません。 この二つの文書型定義は、9.2,「厳密なHTML DTD」と9.4,「厳密なレベル1HTML DTD」によるHTML DTDに関連しています。これは構造的により厳密なHTMLの定義になっています。 HTMLユーザーエージェントはその他の文書型をサポートしてもかまいません。特にまったく別のformal public identifiersや文書型をサポートしてもかまいません。付け加えた実体や要素など、内部宣言のサブセットや別のマークアップ宣言をサポートしてもかまいません。 3.4.HTML文書の例(Example HTML Document) ------------------------------------------- 文書構造の例

第一の見だし

HTMLファイル例における段落です。テキスト文書内にタイトルは現われませんが、(H1で定義した)見出しは現われることを覚えておいてください。

  1. 番号付きリストの最初の項目
  2. 番号付きリストの二番目の項目
    • リストは入れ子が可能な点に注目してください
    • 空白はHTMLソースを見やすくするのに便利です。
  3. 番号付きリストの三番目の項目

追加された段落です。ここでは付けていますが、段落の終了タグは技術的には必要ではありません。また、段落内で強調文字を含めることもできます。この部分は強調されています。終了タグ </P>が省略されていることに注目してください。

警告: この太字の説明を読みましょう。 4.インターネットメディアタイプとしてのHTML(HTML as an Internet Media Type) ============================================================================== HTMLユーザーエージェントにより、ユーザはHTMLで記述されたリソースをインタラクティブに扱うことができます。最低でもHTMLユーザーエージェントはHTMLレベル1文書の内容を調査したりナビゲートできなければなりません。そしてHTML文書で表わされた形式の特徴すべてを維持でき、同時にIMG要素により参照されるリソースを表示できるようにするべきです(これらはユーザの要求に従って無視するようにしてもかまいません)。レベル2HTMLユーザーエージェントは、フォーム入力と提出をサポートするべきです。 4.1.text/htmlメディアタイプ(text/html media type) ------------------------------------------------- この仕様は`text/html'というインターネットメディアタイプ[IMEDIA](以前はコンテントタイプ[MIME]として示されていました)を定義するものです。以下は[IANA]で登録されたものです。 メディアタイプ名称(Media Type name) text メディアサブタイプ名称(Media subtype name) html 必要なパラメータ(Required parameters) なし(none) オプションパラメータ(Optional parameters) level, charset エンコーディングへの配慮(Encoding considerations) 全てのエンコーディングを許可 セキュリティへの配慮(Security considerations) 10,「セキュリティへの配慮」を見てください オプションパラメータは以下のように規定されます: レベル(Level) レベルパラメータは文書内で使われる特徴のセットを規定します。レベルは整数で表わされ、文書内にあらわれるのと同じ、もしくは低いレベルの特徴を含みます。レベル1はこの仕様の

以外のすべての特徴を満たすものです。レベル2はフォーム処理を含み、レベル2がデフォルトになっています。 文字セット(Charset) (RFC 1521[MIME]の7.1.1で定義されている)charsetパラメータは、データ文字列としてHTML文書を表現するのに役立つように文字コード系を定義することができます。デフォルト値はこの仕様の範囲外ですが、例えばMIMEメールでのデフォルト値は`US-ASCII'で、HTTPでは`ISO-8859-1'です。 4.2.HTML文書の表現(HTML Document Representation) ---------------------------------------------------- `text/html'のコンテントタイプを伴うメッセージ実体はHTML文書として表わされ、それは単なるテキスト実体を含んだものです。文字コード系は(明示されていようといまいと)`charset'パラメータで規定します。テキスト実体は文字コード系で規定された文字とメッセージ実体のbodyのデータから成ります。 4.2.1.宣言されていないマークアップのエラー処理(Undeclared Markup Error Handling) HTMLのさまざまなバージョン間での実験や相互運用(interoperability)を容易にするために、HTMLユーザーエージェントはそれらをHTML2.0に引き下げることによるHTML2.0のスーパーセットをサポートします。つまり、開始タグや終了タグの中でのマークアップのように、(generic identifier)が宣言されていないものはタグを無視します。宣言されていない属性も同様に扱われます。不明な属性のすべての仕様(すなわち属性とその値)は無視されるべきです。一方、宣言されていない実体はデータ文字として扱われるべきです。 例えば以下のようになります:

foo

...

=>

,"foo",

,

,"..." xxx

yyy => "xxx ",

," yyy Let α & β be finite sets. => "Let α & β be finite sets." このようなエラーをユーザに報告する機能をサポートすることを推奨します。 この約束事は拘束力がないことを情報提供者は注意してください。仕様外のマークアップとして、規定外のふるまいをするかもしれません。 4.2.2.伝統的な改行の表現(Conventional Representation of Newlines) テキスト実体は一連のレコード(a sequence of records)であり、レコード開始記号により始まりレコード終了記号により終わる(それぞれのコード位置は10と13です)、とSGMLでは定めています([SGML]のセクション7.6.1,"Record Boundaries")。 [MIME]では、`text/*'のタイプの中身は一連の行であり、CRLF、つまりコード位置13と10で区切られると定められています。 実際にHTML文書で、文書のソースの慣習に依存した行末の扱いが伝えられ表わされています。この表現とは、CRのみ、LFのみ、CRとLFの組み合わせというものです。そのためにデータをデコードする際にテキスト実体のレコード開始および終了の記号を落とすことがあります。 失ったレコード開始および終了の記号をHTMLユーザーエージェントが推測するようにすることを推奨します。 HTMLユーザーエージェントは、整形済みテキストを除きすべての文章において、いかなる種類においても単語の空白(a word space)を行末として扱うようにするべきです。整形済みテキストでは、一般的な三つの改行表現を新たな行の開始として扱うようにするべきです。 5.文書構造(Document Structure) ============================== HTML文書は、ヘッダ部、ボディ部、見出し、段落、リストなどを含んだ要素のツリー構造になっています。フォーム要素については8,「フォーム」で論じます。 5.1.文書の要素:HTML (Document Element: HTML) --------------------------------------------- HTML文書の要素は、メモやメールメッセージのようにヘッダ部とボディ部から成ります。ヘッダにはタイトルとオプションの要素が含まれます。ボディは段落やリストや他の要素から成るテキストです。 5.2.ヘッダ:HEAD (Head:HEAD) ---------------------------- HTML文書のヘッダは、文書についての情報を順序関係なく集めたものです。例えば以下のようになります。 HTML入門 ... 5.2.1.タイトル:TITLE (Title:TITLE) HTML文書は文書毎に要素を含んでいなければなりません。 タイトルは全体的な文脈の中で文書の内容がわかるようにつけるべきです。短いタイトル、例えば"Introduction"のようなものは文脈外では意味不足かもしれません。"Introduction to HTML Elements"のようなタイトルのほうがより適切です。 注意‐タイトルの長さに制限はありませんが、長いタイトルはアプリケーションによっては途中で切られるかもしれません。この可能性を考慮してタイトルは64文字以内にすべきでしょう。 ユーザーエージェントは文書のタイトルを履歴リストの中や、文書を表示しているウインドウの名前として表示するかもしれません。これは見出し(5.4,「見出し:H1 ... H6」)とは異なります。見出しはテキスト本文の中にはっきりと表示されます。 5.2.2.ベースアドレス:BASE (Base Address: BASE) オプションである<BASE>要素は、外部文書を参照する際に(7,「ハイパーリンク」を見てください)、相対URLを解釈するためのベースアドレスを指定するものです。HREF属性の値は絶対URIでなければなりません。 5.2.3.キーワードインデックス:ISINDEX (Keyword Index: ISINDEX) <ISINDEX>要素により、ユーザーエージェントは与えられたキーワードによるインデックス検索を可能にするべきです。詳しくは7.5,「質問とインデックス」を見てください。 5.2.4.リンク:LINK (Link: LINK) <LINK>要素はハイパーリンク(7,「ハイパーリンク」を見てください)を表わします。LINK要素はHTML文書の<HEAD>要素の中にいくつでも書くことができます。この要素は<A>要素と同じ属性を持ちます(5.7.3,「アンカー:A」"を見てください)。 <LINK>要素は一般的に著作者の表示、関連するインデックスや用語集、古いバージョン、もしくはより新しいバージョン、文書階層、スタイルシートのような関連したリソースなどに使われます。 5.2.5.関連するメタ情報:META (Associated Meta-information: META) <META>要素は文書の特別なメタ情報を認識するために使われる拡張性のあるものです。メタ情報は主に以下の二つの機能があります。 * データが存在し、それを入手あるいはアクセスする方法を発見する手段をもたらし、 * 内容、品質、扱うデータセット、適切な表示を示す 各々の<META>要素は名称と値(name/value)の組み合わせを明示します。もし同じ名称で複数のMETA要素を使用する場合、結び付く内容――コンマで区切られたリスト――は名称に関連した値です。 注意‐<META>要素は具体的な要素の場合、例えば<TITLE>のようにより適切なものがある場合には使用すべきではありません。CONTENT属性の値としてURIを<META>要素と共に使うよりは、<LINK>要素を使用してください。 HTTPサーバは文書の<HEAD>を読み取り、HTTP-EQUIV属性の値で定めたいかなる要素にも一致するようにヘッダ部分を作成するでしょう。 注意‐サーバが文書のメタ情報を抜き出す手段は決まっても強制されてもいません。<META>要素は単に文書のメタ情報を認識し埋め込むための拡張機能をもたらすだけで、それをどのように扱うかは個々のサーバの実装とHTMLユーザーエージェントしだいです。 META要素の属性は以下のとおりです: HTTP-EQUIV 要素をHTTPヘッダ部に拘束します。HTTPサーバはこの情報により文書を処理するでしょう。特に、文書への要求に答えるときにヘッダ部を付け足すでしょう。この時、ヘッダ名はHTTP-EQUIVの属性値より与えられ、ヘッダ値はCONTENT属性の値から与えられます。HTTPヘッダ名は大文字小文字を区別しません。 NAME 名称/値の組み合わせの名称を定めます。これがない場合にはHTTP-EQUIVにより定められます。 CONTENT 名称/値の組み合わせの値を定めます。 例 <META HTTP-EQUIV="Expires" CONTENT="Tue, 04 Dec 1993 21:29:02 GMT"> <meta http-equiv="Keywords" CONTENT="Fred"> <META HTTP-EQUIV="Reply-to" content="fielding@ics.uci.edu (Roy Fielding)"> <Meta Http-equiv="Keywords" CONTENT="Barney"> 文書に上の要素が含まれている場合、サーバは以下のようなヘッダ部を加えるでしょう。 Expires: Tue, 04 Dec 1993 21:29:02 GMT Keywords: Fred, Barney Reply-to: fielding@ics.uci.edu (Roy Fielding) これは文書に対するHTTPの`GET'あるいは`HEAD'リクエストの一部となります。 HTTPサーバは、ヘッダ整形の際にHTTP-EQUIV属性のない<META>要素を使用してはなりません。 HTTPサーバは、サーバを制御するような情報を定めたいかなる<META>要素、例えば`Server'や`Date'や`Last-modified'などを無視してもかまいません。 5.2.6.ネクストID:NEXTID (Next Id: NEXTID) <NEXTID>要素は歴史的な理由から含まれているだけです。HTML文書に<NEXTID>要素を含めるべきではありません。 <NEXTID>要素は、HTML文書作成時に新しい<A>要素を使うための名前のヒントを与えてくれます。これは<A>要素におけるNAME属性値のすべてと異なっているべきです。例えば以下のように使用します: <NEXTID N=Z27) 5.3.ボディ:BODY (Body: BODY) ----------------------------- <BODY>要素には、見出しや段落やリストなどを含んだ文書のテキストが入ります。 例: <BODY> <h1>重要な資料</h1> <p>重要な資料についての説明… </BODY> 5.4.見出し:H1 ... H6 (Headings: H1 ... H6) ------------------------------------------- <H1>から<H6>までの六つの要素により見出し部分を示します。見出しの順序や付け方はHTML DTDで定められてはいませんが、その文書を別の形式に変換する際に問題にならないようにするために、(例えばH1からH3というように)レベルをスキップするべきではありません。 使用例: <H1>見出しです</H1> ここにはテキストが入ります <H2>第二レベルの見出しです</H2> さらにテキストが入ります 一般的にそれぞれ以下のように表示されます: H1 より大きなフォントで太字を使用。センタリングする。前後1、2行ほど空ける。 H2 大きなフォントで太字を使用。左寄せする。前後1、2行ほど空ける。 H3 大きなフォントでイタリック体。左端から少し字下げ(インデント)する。前後1、2行ほど空ける。 H4 通常のフォントで太字。H3よりも字下げする。前後1行空ける。 H5 通常のフォントでイタリック体。H4と同様の字下げ。前を1行空ける。 H6 太字。H5以上で、他のテキストと同じ字下げ。前を1行空ける。 5.5.ブロック構成要素 (Block Structuring Elements) ------------------------------------------------- ブロック構成要素は、段落、リスト、引用などを含みます。見出し要素はこれに含まれませんが、語句マークアップ(phrase markup)は含まれ、場合によっては入れ子になるでしょう。 5.5.1.段落:P (Paragraph: P) <P>要素は段落を示します。スペースなどによる明確なインデントは規定されていません。それはスタイルシートなど他のタグの機能によります。 一般的に段落は1行あるいは半行ほどの空行で挟まれます。段落の最初の行はさまざまな方法でインデントされます。 使用例: <H1>この見出しは段落の前にあります</H1> <P>最初の段落のテキストです。 <P>二番目の段落のテキストです。新しく改行して段落を開始する必要はありませんが、そうしたほうが文書の扱いが容易になります。</P> <P>三番目の段落のテキストです。</P> 5.5.2.整形済みテキスト:PRE (Preformatted Text: PRE) <PRE>要素はテキストにおいて文字のブロックを示すもので、等幅フォント(a monospaced font)で整形されたテキストに適しています。 <PRE>タグはオプションであるWIDTH属性とともに使うこともできます。WIDTH属性は行の最大文字数を定めるもので、それによりHTMLユーザーエージェントは適切なフォントとインデントを設定することができます。 整形済みテキスト内では以下の規則が適用されます: * テキスト内の改行は次の行の開始として表示される 注意‐「新たな行の開始("beginning of a new line")」を参照しても、整形済みテキストの表示において常に左側をインデントすることは禁じていません。左側インデントはwidth要求により定められます。 * アンカー要素と語句マークアップは有効である 注意‐<PRE>処理の規定によってはHTMLユーザーエージェントが語句マークアップを忠実に表示できる機能を制限したり無視したりするかもしれません。 * 段落整形の要素(見出しやアドレスなど)は使用してはならない 注意‐古い文書の中には<PRE>要素の中で<P>タグを使用しているものもあります。ユーザーエージェントはこれを改行として扱うとよいでしょう。<P>タグの後には1行のみ改行させ、空行の次では改行するべきではありません。 * 水平タブ(HTML文書文字セットではコード位置9)は、8文字単位にすると他の文字が行の後方に残されるために、スペース一つ分として解釈しなければならない。タブはきちんとサポートされていないものとして、文書に含めてはならない。 使用例: <PRE> Line 1. Line 2 is to the right of line 1. <a href="abc">abc</a> Line 3 aligns with line 2. <a href="def">def</a> </PRE> 5.5.2.1.例とリスティング:XMP,LISTING (Example and Listing: XMP, LISTING) <XMP>と<LISTING>要素は<PRE>要素と似ていますが、異なる語法です。この内容はCDATAとして宣言され、終了タグ以外のすべてのマークアップ記号は認識されません([SGML]の9.6 "Delimiter Recognition"を見てください)。 注意‐以前のHTML仕様ドラフトでは、<XMP>と<LISTING>要素で終了タグを同じ長さのデータ文字として扱っていました。 CDATA宣言の内容を処理するときに不適切な反応をおこしたり矛盾した仕様や実装が行われるために、HTML文書では<XMP>も<LISTING>も使用するべきではありません。より表現力があり適切な<PRE>タグを使用してください。 <LISTING>要素は1行に少なくとも132文字に収まるように表示されます。<XMP>要素は1行に少なくとも80字に収まるように表示すべきで、そのほかは<LISTING>要素と同様です。 注意‐以前のドラフトでは<PLAINTEXT>という要素を含んでいました。これは終了タグがないということを除いては<LISTING>要素によく似たもので、<PLAINTEXT>開始タグ以降のすべての文字はデータになります。 5.5.3.アドレス:ADDRESS (Address: ADDRESS) <ADDRESS>要素は住所や書名や著作者などの情報を含み、文書のボディ部の最初か最後に置かれます。 一般的に<ADDRESS>要素はイタリック体で表示され、インデントされることもあります。 使用例: <ADDRESS> Newsletter editor<BR> J.R. Brown<BR> JimquickPost News, Jimquick, CT 01234<BR> Tel (123) 456 7890 </ADDRESS> 5.5.4.引用:BLOCKQUATE (Block Quate: BLOCKQUATE) <BLOCKQUATE>要素には、別のソースから引用されたテキストが含まれます。 一般的には左右を少しインデントし、イタリック体で表示(あるいはどちらかのみ)されます。また引用部分の前後にスペースを空けます。 Single-fontでは、左のマージンに大なり記号(>)のようなグラフィック記号を縦に並べるという、インターネットメールでの引用のスタイルを反映するかもしれません。 使用例: I think the play ends <BLOCKQUOTE> <P>Soft you now, the fair Ophelia. Nymph, in thy orisons, be all my sins remembered. </BLOCKQUOTE> but I am not sure. 5.6.リスト要素(List Elements) ----------------------------- HTMLにはいくつかのリスト要素があります。それらは組み合わせて使われ、例えば<OL>は<UL>の<LI>要素の中で入れ子で使われるかもしれません。 COMPACT属性により、詰めて表示(compact rendering)するようにします。 5.6.1.番号なしリスト:UL,LI (Unordered List: UL, LI) <UL>は項目のリストを表わすもので、一般的に箇条書きで表示されます。 <UL>要素の中身は一連の<LI>要素です。例えば以下のように使用します: <UL> <LI>第一の項目 <LI>第二の項目 <p>第二の項目の第二段落 <LI>第三の項目 </UL> 5.6.2.番号付きリスト:OL (Ordered List: OL) <OL>要素は項目の番号付きリストを表わし、その順番や重要度順に並べられます。一般的には数字付きのリスト表示となります。 <OL>要素の中身は一連の<LI>要素です。例えば以下のように使用します: <OL> <LI>URIウインドウを開くためにウェブボタンをクリックしてください。 <LI>開いたURIウインドウのテキストフィールドにURIを入力してください。指定したウェブ文書が表示されます。 <ol> <li>substep 1 <li>substep 2 </ol> <LI>別のリンク先に移動するにはテキストの強調部分をクリックしてください。 </OL> 5.6.3.ディレクトリリスト:DIR (Directory List: DIR) <DIR>要素は<UL>要素によく似ています。これは短い項目のリスト、つまりそれぞれの項目が20字までのリストを表わします。ディレクトリリストの項目は一般的に24文字幅で縦に並べられます。 <DIR>要素の中身は一連の<LI>要素です。<DIR>要素の中では要素の入れ子は許可されていません。例えば以下のように使用します: <DIR> <LI>A-H<LI>I-M <LI>M-R<LI>S-Z </DIR> 5.6.4.メニューリスト:MENU (Menu List: MENU) <MENU>要素は1項目につき1行となるようなリストです。メニューリストは一般的に番号なしリストよりもコンパクトに表示されます。 <MENU>要素の中身は一連の<LI>要素です。<MENU>要素の中では要素の入れ子は許可されていません。例えば以下のように使用します: <MENU> <LI>リストの第一項目 <LI>リストの第二項目 <LI>リストの第三項目 </MENU> 5.6.5.定義型リスト:DL,DT,DD (Definition List: DL, DT, DD) 定義型リストは、用語とそれに対応する定義のリストです。一般に用語が左揃えで並び、定義はその用語の次にインデントした形で表示されます。 <DL>要素の中身は一連の<DT>要素、そして/あるいは<DD>要素で、普通は組で使われます。複数の<DT>要素が一つの<DD>要素と組になることもあるかもしれません。文書には複数の連続した<DD>要素を含めるべきではありません。 使用例: <DL> <DT>用語<DD>一番目の用語の定義 <DT>用語<DD>二番目の用語の定義 </DL> もしDTの用語がDTの表示範囲(一般的に表示領域の3分の1)に収まらなければ、DD部分を次の行に移してページを越えて延ばすか、左端で折り返されるかします。 リスト項目が小さくてリスト全体が大きくなる場合に、オプションのCOMPACT属性によりコンパクトに表示されます。 COMPACT属性がない場合にHTMLユーザーエージェントは、連続したDTとDDの組の間の空白を残しておくでしょう。COMPACT属性は左側(DT)の範囲を狭くするかもしれません。 <DL COMPACT> <DT>用語<DD>コンパクト形式での第一の定義 <DT>用語<DD>コンパクト形式での第二の定義 </DL> 5.7.語句マークアップ(Phrase Markup) ----------------------------------- 語句のマークアップは、慣用的な表現や表示上の見た目、あるいはハイパーリンクのアンカーなどに従っておこなわれます。 ユーザーエージェントはその語句をプレーンテキストと区別して目立つように表示しなければなりません。さらに、<EM>の内容は<STRONG>の内容とは区別して表示しなければなりませんし、<B>の内容は<I>の内容とは区別して表示されなければなりません。 語句要素は他の語句要素の中に入れ子にすることもありますが、HTMLユーザーエージェントは、入れ子になっているものとなっていないものを同じように表示するかもしれません。 プレーン<B>太字<I>イタリック</I></B>は、プレーン<B>太字</B><I>イタリック</I>と同じように表示されるかもしれません。 5.7.1.語法的要素(Idiomatic Elements) 語句マークアップはある語法を示すためにおこなわれます。 注意‐この仕様には含まれていませんが、<DFN>要素をサポートしているユーザーエージェントがあるかもしれません。これは用語の定義に使われ、一般的にイタリックか太イタリックで表示されます。 5.7.1.1.引用:CITE (Citation: CITE) <CITE>要素は、本の書名や引用などを示すのに使用します。一般的にイタリックで表示されます。 仕様例: He just couldn't get enough of <cite>The Grapes of Wrath</cite>. 5.7.1.2.コード:CODE (Code: CODE) <CODE>要素はコードの例を示すもので、一般的に等幅フォントで表示されます。<CODE>要素は単語やコード語句に用いられ、複数行にわたるリストには<PRE>要素(5.5.2,「整形済みテキスト:PRE」)がより適切です。 仕様例: <code>x += 1</code>という表現は <code>x = x + 1</code>より短い。 5.7.1.3.強調:EM (Emphasis: EM) <EM>要素は強調語句を示すのに使われ、一般的にイタリックで表示されます。 仕様例: 単数形の主語の後には<em>常に</em>単数形の動詞がくる。 5.7.1.4.キーボード:KBD (Keyboard: KBD) <KBD>要素はユーザの入力したテキストを示し、一般的に等幅フォントで表示されます。これは主に使用説明書で使われます。 使用例: データベース検索には<kbd>FIND IT</kbd>と入力します。 5.7.1.5.例:SAMP (Sample: SAMP) <SAMP>要素はそのままの文字を示し、一般的に等幅フォントで表示されます。 使用例: <samp>mt</samp>の文字を含む単語はdreamtだけです。 5.7.1.6.より強い強調:STRONG (Strong Emphasis: STRONG) <STRONG>要素はより強い強調を示し、一般的に太字で表示されます。 使用例: <strong>止めなさい</strong>。さもないともう一度「<strong>止めなさい</strong>」と言うよ! 5.7.1.7.変数:VAR (Variable: VAR) <VAR>要素は置き換え可能なものを示し、一般にイタリックで表示されます。 使用例: <VAR>file</VAR>のマークアップエラーをチェックするには、<SAMP>html-check <VAR>file</VAR> | more</SAMP>とタイプしてください。 5.7.2.表示型要素(Typographic Elements) 表示型要素はマークされたテキストの形式を定義するのに使用します。 語法的要素の一般的な表示はユーザーエージェントにより変化します。もし具体的な表示が必要なら――例えば「イタリックの部分は必須」という明確なテキスト属性を参照する場合――、表示型要素は意図した表示を確実に可能にします。 注意‐ユーザーエージェントによっては、この仕様の表示型要素のいくつかをサポートしていなかったり逆に拡張したりしているものがあるかもしれません。<STRIKE>要素は文字の上に水平に線をひくもので、<U>要素はアンダーラインを示します。 5.7.2.1.太字:B (Bold: B) <B>要素は太字を表わします。太字表現が不可能な場合は代わりのの表示形式になるでしょう。 5.7.2.2.イタリック:I (Italic: I) <I>要素はイタリック(斜体)を表わします。イタリック表現が不可能な場合は代わりの表示形式になるでしょう。 5.7.2.3.テレタイプ:TT (Teletype: TT) <TT>要素はテレタイプ(固定幅)テキストを表わします。等幅フォントが表示不能な場合は代わりの表示形式になるでしょう。 5.7.3.アンカー:A (Anchor: A) <A>要素はハイパーリンクのアンカー(7,「ハイパーリンク」参照)を表わします。その中にはNAMEとHREFの属性のどちらかが少なくとも存在しなければなりません。<A>要素の属性は以下のとおりです: HREF ハイパーリンクのリンク先のURIを与えます。 NAME アンカー名を与えると共にハイパーリンクのリンク先になることを可能にします。 TITLE リンク先のリソースにタイトルをつけます――これはアドバイスのみです。TITLE属性は以下のように使用されます。 * リンク先にアクセスする前にそれを表示します。例えば、余白を利用したり、アンカー部分にマウスを動かすと小さく表示したり、文書のロード中に表示したりします * タイトルを含まないリソース、グラフィックやプレーンテキストやGopherのメニューではウインドウ名として使用されます REL REL属性はハイパーリンクによって示される関係を与えます。その値は空白で区切られた関係の名称のリストです。リンク関係の意味についてはこの文書では定義しません。 REV REL属性と同じですが、リンク関係が反対方向になっています。AからBへのリンクがREL="X"と表わされるのはBからAへのリンクがREV="X"で表わされるのと同じ関係です。アンカーはRELとREVの両方の属性を持つでしょう。 URN ハイパーリンクのリンク先をよりはっきりと識別するように定義します。URN属性の語法や意味はまだ定義されていません。 METHODS リンク先へのアクセス手段を定義するもので、名称を空白で区切られたリストで表わします。有効な名称はHREF属性のURI案の役割をします。TITLE属性の場合と同様の理由で、これはリンクにおいてアドバイスとしての情報を含むのに有効でしょう。例えば検索可能なものには別のアイコンを使うなど、METHODSで許可した機能としてHTMLユーザーエージェントは異なった表示を選択することができます。 5.8.改行:BR (Line Break: BR) ----------------------------- <BR>要素は単語(6,「文字、単語、段落」参照)間の改行を示します。 仕様例: <P> Pease porridge hot<BR> Pease porridge cold<BR> Pease porridge in the pot<BR> Nine days old. 5.9.水平線:HR (Horizontal Rule) -------------------------------- <HR>要素はテキストのセクションの区切りとなるもので、一般的には幅いっぱいの水平線か同等のグラフィックで表示されます。 仕様例: <HR> <ADDRESS>February 8, 1995, CERN</ADDRESS> </BODY> 5.10.イメージ:IMG (Image: IMG) ------------------------------- <IMG>要素はハイパーリンクによって画像やアイコンを参照するものです(7.3,「画像リソースの同時表現」参照)。 HTMLユーザーエージェントはSRC属性で示される画像リソースを表示する代わりにALT属性の値を表示するかもしれません。 注意‐HTMLユーザーエージェントによっては、アンカーによるリンクのみ画像表示が可能で、<IMG>では不可能なものもあります。もし画像が必要不可欠なものなら、<IMG>要素よりは<A>要素で参照するべきです。必要不可欠でないのなら<IMG>要素が適切です。 <IMG>要素の属性は以下のとおりです: ALIGN テキストのベースラインに対しての画像位置を指定します。 * `TOP'は、画像の一番上と画像を含む行の最も高い部分とが並ぶようにします * `MIDDLE'は、画像の真ん中と画像を含む行のベースラインとが並ぶようにします * `BOTTOM'は、画像の一番下と画像を含む行のベースラインとが並ぶようにします ALT 、例えば制限されていたりユーザーの状態が原因で、参照される画像リソースの代わりに使用されるテキストを指定します。 ISMAP イメージマップであることを示します(7.6,「イメージマップ」参照) SRC 画像リソースのURIを指定します。 注意‐実際には画像リソースのメディアタイプは少数のラスター画像フォーマットに限られていて、一般的には`image/gif'、`image/jpeg'です。特に`text/html'のリソースは画像リソースとして使用しません。 使用例: <IMG SRC="triangle.xbm" ALT="警告:">この説明を読んでください。 <a href="http://machine/htbin/imagemap/sample"> <IMG SRC="sample.xbm" ISMAP> </a> 6.文字、単語、段落(Characters, Words, and Paragraphs) ===================================================== HTMLユーザーエージェントはHTML文書のボディ部を、段落や整形済みテキストの集まりとして表示するべきです。整形済み要素(<PRE>、<XMP>、<LISTING>、<TEXTAREA>)を除いて、ブロック構成要素はそれぞれ、中身のデータ文字によって得られる段落や、その中身を連結し、その結果をスペースやタブ、文字レコードの終わり(もしかしたらハイフンも)で区切られた単語に分離したその中身やその直系の要素の中身と見なされます。一連の単語は改行された段落としての文字組です。 6.1.HTML文書文字セット(The HTML Document Character Set) ----------------------------------------------------------- 文書文字セットは9.5,「HTMLのSGML宣言」で定義され、HTMLユーザーエージェントはこれをサポートしなければなりません。これにはラテンアルファベットNo.1、すなわちLatin-1のグラフィック文字を含んでいます。Latin-1は191のグラフィック文字から成り、大多数の西欧言語のアルファベットを含んでいます。 注意‐スペースやハイフンで分かち書きをしない文字を使用することは、それらが広くサポートされていないので推奨しません。 注意‐西洋以外の表記法をサポートするためのより幅広い文字体系は、HTMLの将来のバージョンで定義します。その文字セットは[ISO-10646]かそれにしたがったサブセットになるでしょう。特に数字は[ISO-10646]で割り当てられたコード位置を使用しなければなりません。 SGMLアプリケーションでは異なるネットワークやOSを越えた互換性を最大限確保するために、制御文字は使用を制限されています。HTML文書文字セットでは、水平タブ、キャリッジリターン(Carriage Return)、ラインフィード(Line Feed)(コード位置はそれぞれ9、13、10)の三つだけが許可されています。 広くサポートされているASCII文字のみを使ってLatin1文字の表現を可能にするために、HTML DTDはAdded Latin1実体セットを参照します。例えば以下のようになります: Kurt Gödel was a famous logician and mathematician. "Added Latin 1"実体の表は9.7.2,「ISO Latin1文字記号実体セット」を、[ISO 8859-1]のコード位置とHTML文書文字セットの制御文字の表は13,「HTMLでコード化された文字記号セット」を参照してください。 7.ハイパーリンク(Hyperlinks) ============================ 段落やリストといった一般的な目的の要素に加えて、HTML文書はハイパーリンクを表現することができます。HTMLユーザーエージェントによりこのハイパーリンクのナビゲートができます。 ハイパーリンクは二つのアンカー間の関係で、それぞれハイパーリンクの頭(head)と尾(tail)と呼ばれます[DEXTER]。アンカーはアンカーアドレスによって識別され、アンカーアドレスは、絶対URIとオプションとして'#'とフラグメント識別子と呼ばれる文字列で表わされます。 例: http://www.w3.org/hypertext/WWW/TheProject.html http://www.w3.org/hypertext/WWW/TheProject.html#z31 アンカーアドレスにおいて、URIはリソースを参照します。これはさまざまな情報検索プロトコルにおいてHTML文書のようなリソースを表現する実体を含めるために使用されます。もし存在するのなら、フラグメント識別子はリソースの一部を参照します。 以下のそれぞれのマークアップ構成要素は、ハイパーリンクのアンカーの尾、あるいはハイパーリンクのセットを示します: * HREFと共に存在する<A>要素 * <LINK>要素 * <IMG>要素 * SRC属性と共に存在する<INPUT>要素 * <ISINDEX>要素 * `METHOD=GET'での<FORM>要素 これらのマークアップ構成要素はURIによりアンカーの頭を参照します。URIは絶対形式でも相対形式でもフラグメント識別子でもかまいません。 相対URIの場合において、アンカーの頭のアドレスにおける絶対URIは、相対URIと[RELURL]におけるようなベース絶対URIを組み合わせた結果となっています。ベース文書はもし存在するのなら文書の<BASE>要素から得られ、存在しなければ[RELURL]にあるように決定されます。 7.1.リソースへのアクセス(Accessing Resources) --------------------------------------------- いったんアンカーの頭のアドレスが決定すれば、ユーザーエージェントはリソースを記述するでしょう。 例えばベースURIが`http://host/x/y.html'で、文書が <img src="../icons/abc.gif"> を含むときに、ユーザーエージェントは[URL]にあるように、リソースにアクセスするために`http://host/icons/abc.gif'というURIを用います。 7.2.ハイパーリンクの有効化(Activation of Hyperlinks) ---------------------------------------------------- HTMLユーザーエージェントにより、文書の内容を探索し、<A>要素で示されるハイパーリンクを有効にする要求をだすことができるようになります。HTMLユーザーエージェントは<LINK>要素のハイパーリンクも有効にするべきです。 リンクを有効にするために、ユーザーエージェントはアンカーの頭のアドレスにより識別されたリソースの記述を含みます。もしその記述が別のHTML文書の場合、新たに別の文書としてナビゲートを始めるでしょう。 7.3.画像リソースの同時表現(Simultaneous Presentation of Image Resources) ------------------------------------------------------------------------ HTMLユーザーエージェントが文書を処理する際に、<IMG>と<INPUT>要素により同時にハイパーリンクが有効になるかもしれません。すなわち画像ハイパーリンクがユーザーの要求なしに処理されるかもしれません。画像リソースは<IMG>か<INPUT>要素によるアンカーの尾の部分にはめ込んで表示するべきです。 <LINK>によるハイパーリンクも明確なユーザー要求なしに処理されます。例えばスタイルシートリソースが処理されるのは、文書の処理前あるいは処理中でしょう。 7.4.フラグメント識別子(Fragment Identifiers) -------------------------------------------- ハイパーテキストアドレスにおいて、`#'記号に続く全ての文字はフラグメント識別子となります。特に`#fragment'の形式は、同一文書内のアンカーを参照します。 フラグメント識別子の意味はアンカーのリソースの表わすメディアタイプに依存します。`text/html'表現においては、<A>要素のNAME属性の値がフラグメント識別子と同じものとして参照されます。これは大文字小文字を区別します。文書にはただ一つの要素が存在するべきです。ユーザーエージェントはアンカー要素を、例えば語句を強調させるなどして表示するべきです。 例えばベースURIが`http://host/x/y.html'でユーザーが以下のようなマークアップでリンクを有効にした場合: <p> 参照: バナナについてより詳しくは<a href="app1.html#bananas">付録1</a>を このときユーザーエージェントは、`http://host/x/app1.html'と識別されたリソースにアクセスします。リソースは`text/html'のメディアタイプであるとみなされ、ユーザーエージェントはNAME要素が`banana'である<A>要素を探し出し、ナビゲートを始めなければなりません。 7.5.質問とインデックス(Queries and Indexes) ------------------------------------------- <ISINDEX>要素はハイパーリンクのセットです。ユーザーエージェントにキーワードを与えることでハイパーリンクを選択することができます。ユーザーエージェントは、ベースURIに`?'とキーワードをつけたヘッドURIを解析します。キーワードは[URL]によって外され、`+'記号により加えられます。例えば文書が以下のマークアップを含む場合: <BASE HREF="http://host/index"> <ISINDEX> それに加えてユーザーがキーワードに`apple'と`berry'を与えた場合、ユーザーエージェントは`http://host/index?apple+berry'というリソースにアクセスしなければなりません。 `METHOD=GET'での<FORM>要素もハイパーリンクの一種を表わします。詳しくは8.2.2,「問い合わせフォーム:METHOD=GET"」を参照してください。 7.6.イメージマップ(Image Maps) ------------------------------ もし<IMG>要素にISMAP属性があれば、その<IMG>要素はHREF属性付き<A>要素に含まれなければなりません。この構成はハイパーリンクのセットを表わします。ユーザーは画像のピクセルを指定することでハイパーリンクを指定することができます。ユーザーエージェントは、<A>要素の中で与えられたURIに`?'記号とそのピクセルのX、Y座標をつけたヘッドURIを解析します。例えば文書が以下のマークアップを含む場合: <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> <head><title>イメージマップの例

いずれかのアイコンを選択してください:
それに加えてユーザーがもっとも左上のピクセルを指定した場合、`http://host/cgi-bin/imagemap?0,0'というURIへのハイパーリンクが選択されます。 8.フォーム(Forms) ================= フォームはフォームデータセットのテンプレートで、方法と実行するURIを関連させます。フォームデータセットは名称/値の組み合わせです。名称はフォーム入力要素のNAME属性で定義され、値はマークアップやユーザーが指定したフォームにより定められます。フォームデータセットの結果は、動作や方法の機能としての情報サービスへのアクセスに使用されます。 フォーム要素は文書構造要素と混在可能です。例えば

要素に要素を含めてもかまいませんし、要素は要素を含んだリストを含めてもかまいません。これによりフォームのレイアウトをデザインする際にかなり自由度が高くなります。

フォーム処理はレベル2の特徴です。

8.1.フォーム要素(Form Elements)
-------------------------------
8.1.1.フォーム:FORM (Form: FORM)

フォーム要素は文書構造要素のほかに入力要素も含みます。属性は以下のとおりです:

ACTION
	フォームの動作するURIを定めます。デフォルトは文書のベースURIです(7,「ハイパーリンク」参照)。

METHOD
	動作するURIへのアクセスの方法を選択します。可能なアクセス方法はフォームの動作するURIの機能となります。8.2.2,「問い合わせフォーム:METHOD=GET」と8.2.3,「Side-Effect付きフォーム:METHO=POST」を参照してください。

ENCTYPE
	転送するときに名称/値の組み合わせをエンコードするメディアタイプを定めます。8.2.1,「form-urlencoded メディアタイプ」を参照してください。

8.1.2.入力フィールド:INPUT (Input Field: INPUT)

要素はユーザーの入力する部分を表わします。入力フィールドの種類はTYPE属性で区別します。

要素は多数の属性を持っています。可能な属性はTYPE属性の値に依存します。

8.1.2.1.テキストフィールド:INPUT TYPE=TEXT (Text Field: INPUT TYPE=TEXT)

TYPE属性のデフォルト値は`TEXT'で、1行のテキスト入力フィールドを示します。(複数行のテキスト入力フィールドでは


    
    ニックネーム: 
    

質問に答えてくださりありがとうございました。

フォームデータセットの初期状態は以下のとおりです: name "" gender "male" family "" other "" nickname "" ラジオボタンでの入力は初期値を持っていますが、チェックボックスにはないことに注意してください。 ユーザーは、提出するフォームのフィールドや要求部分を書き換えます。このとき以下の値の場合を考えてみます: name "John Doe" gender "male" family "5" city "kent" city "miami" other "abc\ndefk" nickname "J&D" ユーザーエージェントは`http://www.w3.org/sampple'というURIを使ってHTTP POST処理をおこないます。メッセージの中身は以下のようになります(改行は無視してください): name=John+Doe&gender=male&family=5&city=kent&city=miami& other=abc%0D%0Adef&nickname=J%26D 9.HTMLパブリックテキスト(HTML Public Text) ============================================== 9.1.HTML DTD(HTML DTD) ----------------------------- これはハイパーテキストマークアップランゲージレベル2の文書型定義です。 ... -- > ]]> %ISOlat1; ]]> Heading is preferred to

Heading

--> ]]> " > #AttVal(Alt)" > ]]> ]]> ]]> Directory" > Menu" > Heading

Text ... is preferred to

Heading

Text ... --> ]]> Form:" %SDASUFF; "Form End." > Select #AttVal(Multiple)" > ]]> ]]> " > [Document is indexed/searchable.]"> ]]> 9.2.厳密なHTML DTD(Strict HTML DTD) ------------------------------------------ この文書型宣言は`HTML.Recomended'実体をIGNOREではなく`INCLUDE'と定義したHTML DTDについて述べています。つまりこれはより構造的に厳密なHTMLの定義です。 ... -- > %html; 9.3.レベル1HTML DTD(Level1 HTML DTD) -------------------------------------------- この文書型宣言は`HTML.Forms'実体を`INCLUDE'ではなく`IGNORE'と定義したHTML DTDについて述べています。
要素を含んだ文書はこのDTDには従いません。それにはレベル2DTDを使わなければなりません。 ... -- > %html; 9.4.厳密なレベル1HTML DTD(Strict Level 1 HTML DTD) ---------------------------------------------------------- この文書型宣言は`HTML.Recomended'実体をIGNOREではなく`INCLUDE'と定義したレベル1HTML DTDについて述べています。つまりこれはより構造的に厳密なHTMLの定義です。 ... -- > %html-1; 9.5.HTMLのSGML宣言(SGML Declaration for HTML) ----------------------------------------------------- これはハイパーテキストマークアップランゲージのSGML宣言です。 9.6.HTMLのSGML公開実体カタログ例(Sample SGML Open Entity Catalog for HTML) ---------------------------------------------------------------------------------- SGMLスタンダードは、実際の保存モデル(ファイルシステムなど)にSGML実体を配置したSGMLシステムの一部あるいは構成要素としての「実体管理("entity manager")」について述べたものです。スタンダード自身は特定の方法論や表記を定めません。 さまざまなSGMLツールやシステムの相互運用を助けるために、SGMLオープンコンソーシアムは、アプリケーションに依存しないような、外部識別子と実体名の両方もしくは一方を配置した実体カタログのフォーマットを定めるという技術的解決策を出しました。 カタログの中のそれぞれの実体は、SGML文書に現われる外部実体についての情報とともに(ファイル名のような)保存オブジェクト識別子に関係します。公開識別子に関係した記述に加えて、カタログの記載事項は保存オブジェクト識別子を伴う実体名に関連させることができます。例えば以下のようなカタログの記述が可能です: -- catalog: SGML Open style entity catalog for HTML -- -- $Id: catalog,v 1.3 1995/09/21 23:30:23 connolly Exp $ -- -- Ways to refer to Level 2: most general to most specific -- PUBLIC "-//IETF//DTD HTML//EN" html.dtd PUBLIC "-//IETF//DTD HTML 2.0//EN" html.dtd PUBLIC "-//IETF//DTD HTML Level 2//EN" html.dtd PUBLIC "-//IETF//DTD HTML 2.0 Level 2//EN" html.dtd -- Ways to refer to Level 1: most general to most specific -- PUBLIC "-//IETF//DTD HTML Level 1//EN" html-1.dtd PUBLIC "-//IETF//DTD HTML 2.0 Level 1//EN" html-1.dtd -- Ways to refer to Strict Level 2: most general to most specific -- PUBLIC "-//IETF//DTD HTML Strict//EN" html-s.dtd PUBLIC "-//IETF//DTD HTML 2.0 Strict//EN" html-s.dtd PUBLIC "-//IETF//DTD HTML Strict Level 2//EN" html-s.dtd PUBLIC "-//IETF//DTD HTML 2.0 Strict Level 2//EN" html-s.dtd -- Ways to refer to Strict Level 1: most general to most specific -- PUBLIC "-//IETF//DTD HTML Strict Level 1//EN" html-1s.dtd PUBLIC "-//IETF//DTD HTML 2.0 Strict Level 1//EN" html-1s.dtd -- ISO latin 1 entity set for HTML -- PUBLIC "ISO 8879-1986//ENTITIES Added Latin 1//EN//HTML" ISOlat1\ sgml 9.7.文字記号実体セット(Character Entity Sets) --------------------------------------------- HTML DTDは以下の実体を定義します。これらはマークアップの中で特別な意味を持つグラフィック記号を表わします。またこれらの一部は利用できないでしょう。 9.7.1.数字と特種記号実体セット(Numeric and Special Graphic Entity Set) 以下の表は、数字と特種記号実体セットに含まれる記号、その名称、使用法、説明を並べたものです。このリストは`ISO Standard 8879:1986//ENTITES Numeric and Special Graphic//EN'に基づいています。しかし、HTMLでは実体セットのすべてを含んではいません。このリストにある実体だけが含まれています。 記号 名称 使用法 説明 < lt < 小なり記号 > gt > 大なり記号 & amp & アンパサンド " quot " 二重引用符 9.7.2.ISO Latin1文字記号実体セット(ISO Latin 1 Character Entity Set) 以下の公文書はthe Latin 1 entity setで定義された記号とその名称、使用法、説明を並べたものです。このリストはISO Standard 8879:1986//ENTITES Added Latin 1//ENに基づいています。HTMLはこの実体セットのすべてを含んでいます。 10.セキュリティへの配慮(Security Considerations) ================================================ パラメータとしてURIに加えられる、アンカーや埋め込み画像やその他すべての要素は、ユーザー入力により応答するURIをもたらすでしょう。この場合は[URL]のセキュリティへの配慮に従っています。 フォーム提出要求で広く使われる方法――HTTPとSMTP――は、秘匿性の保証が少々必要になります。秘密の情報をフォームを使って要求する――特に入力フィールドを`PASSWORD'タイプにしている場合(8.1.2,「入力フィールド:INPUT」参照)――情報提供者は、秘匿性の脆弱さを知っておき、ユーザーにも知らせるべきです。 11.参考文献(Reference) ====================== [URI] Berners-Lee, T., "Universal Resource Identifiers in WWW: A Unifying Syntax for the Expression of Names and Addresses of Objects on the Network as used in the World- Wide Web", RFC 1630, CERN, June 1994. [URL] Berners-Lee, T., Masinter, L., and M. McCahill, "Uniform Resource Locators (URL)", RFC 1738, CERN, Xerox PARC, University of Minnesota, December 1994. [HTTP] Berners-Lee, T., Fielding, R., and H. Frystyk Nielsen, "Hypertext Transfer Protocol - HTTP/1.0", Work in Progress, MIT, UC Irvine, CERN, March 1995. [MIME] Borenstein, N., and N. Freed. "MIME (Multipurpose Internet Mail Extensions) Part One: Mechanisms for Specifying and Describing the Format of Internet Message Bodies", RFC 1521, Bellcore, Innosoft, September 1993. [RELURL] Fielding, R., "Relative Uniform Resource Locators", RFC 1808, June 1995 [GOLD90] Goldfarb, C., "The SGML Handbook", Y. Rubinsky, Ed., Oxford University Press, 1990. [DEXTER] Frank Halasz and Mayer Schwartz, "The Dexter Hypertext Reference Model", Communications of the ACM, pp. 30-39, vol. 37 no. 2, Feb 1994. [IMEDIA] Postel, J., "Media Type Registration Procedure", RFC 1590, USC/Information Sciences Institute, March 1994. [IANA] Reynolds, J., and J. Postel, "Assigned Numbers", STD 2, RFC 1700, USC/Information Sciecnes Institute, October 1994. [SQ91] SoftQuad. "The SGML Primer", 3rd ed., SoftQuad Inc., 1991. [ISO-646] ISO/IEC 646:1991 Information technology -- ISO 7-bit coded character set for information interchange [ISO-10646] ISO/IEC 10646-1:1993 Information technology -- Universal Multiple-Octet Coded Character Set (UCS) -- Part 1: Architecture and Basic Multilingual Plane [ISO-8859-1] ISO 8859. International Standard -- Information Processing -- 8-bit Single-Byte Coded Graphic Character Sets -- Part 1: Latin Alphabet No. 1, ISO 8859-1:1987. [SGML] ISO 8879. Information Processing -- Text and Office Systems - Standard Generalized Markup Language (SGML), 1986. 12.謝辞(Acknowledgements) ========================= HTML文書タイプは1990 World Wide Web projectの一環としてCERNにおいてTim Bernaers-Leeによって設計されました。1992年にはDan ConnollyがHTML文書型定義(DTD)と簡単なHTMLの仕様をまとめました。 1993年以来、さまざまなインターネット関係者がHTMLの進化――NCSAモザイクによるインライン画像の導入も含まれます――に貢献してきました。Dave RaggettはHTML+仕様から派生したフォーム素材において重要な役割をはたしました。 Dan ConnollyとKaren Olson Muldrowは1994年にHTMLの仕様を書き直しました。この文書はHTMLワーキンググループ全体で編集し、スパイグラス社のEric SchielerとMike Knezovich、Eric W. Sinkにより修正されました。最終的にRoy Fieldingがドラフト全体を現在の形式にまとめました。 多すぎて一人ずつ名前をあげることはできませんが、HTMLワーキンググループの多くの関係者に感謝します。そのおかげでこの文書は現在の実際の記述に慎重に収束し目標にたどり着くことができました。HTMLのSGMLへの関係をはっきりさせたことは彼らの努力への感謝の印です。 12.1.著者の住所(Author's Addresses) ----------------------------------- Tim Berners-Lee Director, W3 Consortium MIT Laboratory for Computer Science 545 Technology Square Cambridge, MA 02139, U.S.A. Phone: +1 (617) 253 9670 Fax: +1 (617) 258 8682 EMail: timbl@w3.org Daniel W. Connolly Research Technical Staff, W3 Consortium MIT Laboratory for Computer Science 545 Technology Square Cambridge, MA 02139, U.S.A. Phone: +1 (617) 258 8682 EMail: connolly@w3.org URI: http://www.w3.org/hypertext/WWW/People/Connolly/ 13.HTMLでコード化された文字記号セット(The HTML Coded Character Set) ======================================================================= このリストはHTML文書文字記号セットのコード位置と文字記号を詳細に記述したものです。文字記号セットは9.5,「HTMLのSGML宣言」で定義されたものです。この文字記号セットは[ISO-8859-1]が基礎になっています。 参照 説明 -------------- ----------- � -  Unused Horizontal tab Line feed - Unused Carriage Return  -  Unused Space ! Exclamation mark " Quotation mark # Number sign $ Dollar sign % Percent sign & Ampersand ' Apostrophe ( Left parenthesis ) Right parenthesis * Asterisk + Plus sign , Comma - Hyphen . Period (fullstop) / Solidus (slash) 0 - 9 Digits 0-9 : Colon ; Semi-colon < Less than = Equals sign > Greater than ? Question mark @ Commercial at A - Z Letters A-Z [ Left square bracket \ Reverse solidus (backslash) ] Right square bracket ^ Caret _ Horizontal bar (underscore) ` Acute accent a - z Letters a-z { Left curly brace | Vertical bar } Right curly brace ~ Tilde  - Ÿ Unused   Non-breaking Space ¡ Inverted exclamation ¢ Cent sign £ Pound sterling ¤ General currency sign ¥ Yen sign ¦ Broken vertical bar § Section sign ¨ Umlaut (dieresis) © Copyright ª Feminine ordinal « Left angle quote, guillemotleft ¬ Not sign ­ Soft hyphen ® Registered trademark ¯ Macron accent ° Degree sign ± Plus or minus ² Superscript two ³ Superscript three ´ Acute accent µ Micro sign ¶ Paragraph sign · Middle dot ¸ Cedilla ¹ Superscript one º Masculine ordinal » Right angle quote, guillemotright ¼ Fraction one-fourth ½ Fraction one-half ¾ Fraction three-fourths ¿ Inverted question mark À Capital A, grave accent Á Capital A, acute accent  Capital A, circumflex accent à Capital A, tilde Ä Capital A, dieresis or umlaut mark Å Capital A, ring Æ Capital AE dipthong (ligature) Ç Capital C, cedilla È Capital E, grave accent É Capital E, acute accent Ê Capital E, circumflex accent Ë Capital E, dieresis or umlaut mark Ì Capital I, grave accent Í Capital I, acute accent Î Capital I, circumflex accent Ï Capital I, dieresis or umlaut mark Ð Capital Eth, Icelandic Ñ Capital N, tilde Ò Capital O, grave accent Ó Capital O, acute accent Ô Capital O, circumflex accent Õ Capital O, tilde Ö Capital O, dieresis or umlaut mark × Multiply sign Ø Capital O, slash Ù Capital U, grave accent Ú Capital U, acute accent Û Capital U, circumflex accent Ü Capital U, dieresis or umlaut mark Ý Capital Y, acute accent Þ Capital THORN, Icelandic ß Small sharp s, German (sz ligature) à Small a, grave accent á Small a, acute accent â Small a, circumflex accent ã Small a, tilde ä Small a, dieresis or umlaut mark å Small a, ring æ Small ae dipthong (ligature) ç Small c, cedilla è Small e, grave accent é Small e, acute accent ê Small e, circumflex accent ë Small e, dieresis or umlaut mark ì Small i, grave accent í Small i, acute accent î Small i, circumflex accent ï Small i, dieresis or umlaut mark ð Small eth, Icelandic ñ Small n, tilde ò Small o, grave accent ó Small o, acute accent ô Small o, circumflex accent õ Small o, tilde ö Small o, dieresis or umlaut mark ÷ Division sign ø Small o, slash ù Small u, grave accent ú Small u, acute accent û Small u, circumflex accent ü Small u, dieresis or umlaut mark ý Small y, acute accent þ Small thorn, Icelandic ÿ Small y, dieresis or umlaut mark 14.提案された実体(Proposed Entities) ==================================== HTML DTDは"Added Latin 1"実体セットを参照します。"Added Latin 1"実体セットは、[ISO-8859-1]における非ASCII文字のサブセット、すなわちアクセント付き文字に名称付き実体を提供するだけです。すべてのISO 8859-1記号が象徴的に参照されるようになるために以下の実体をサポートさせるべきです。これらの実体の名称は[SGML]の付録から採用しました。 $$