[INDEX] [HOME]

index

TEI Lite( TEI U5 ) のメモ

【 訳 < メモ 】
(1998.8.)


  1 はじめに		  12 リスト
  2 簡単な例		  13 書誌的引用
  3 テキストの構造		  14 テーブル(表)
  4 本文のマークアップ	  15 図と絵
  5 ページ番号・行番号	  16 解釈・分析
  6 語句の強調		  17 技術文書
  7 注記			  18 文字コード、他
  8 相互参照とリンク	  19 前文・後付
  9 編集のための処置	  20 TEI ヘッダ
  10 省略・削除・付加	  21 要素リスト
  11 名前・日付・数値・略語	  22 リファレンス


TEI Lite(TEI U 5)

L. バーナード、C.M.S. マックウィーン
1995.6
http://www.uic.edu/orgs/tei/intros/teiu5.tei
http://www.uic.edu/orgs/tei/intros/teiu5.split.html
■ TEI の簡単な入門用サブセット。

【参照】

  • TEI (TEI document P3, Guidelines for Electronic Text Encoding and Interchange, published in Chicago and Oxford in May 1994)
    http://www-tei.uic.edu/orgs/tei/intros/teiu5.tei
    ftp://info.ox.ac.uk/pub/ota/TEI/doc/teiu5.tei
    http://www-tei.uic.edu/orgs/tei/intros/teiu5.html
    http://info.ox.ac.uk/~archive/teilite/teiu5.html
  • DTD (teilite.dtd
    http://www-tei.uic.edu/orgs/tei/p3/dtd/teilite.dtd
    ftp://ftp-tei.uic.edu/pub/tei/lite/teilite.dtd
    ftp://info.ox.ac.uk/pub/ota/TEI/dtd/teilite.dtd


[TOP]

1 はじめに

TEI ガイドライン( TEI P3、1994.5)は、以下のような特徴を備えている。
  • 多様な文章に共通する根本的特徴を共有する。
  • 必要に応じて専門的な特徴を容易に付加(除去)できる。
  • 一つの特徴に対して同時に多様なマークアップが可能である。
  • ユーザー定義によるマークアップが可能である。
  • テキストとマークアップについて適切な解説が行われる。
TEI Lite の目的は、以下のようなものである。
  • TEI の核となるタグセットをほぼ網羅する。
  • 多様な文書に適切に対応できる。(the Oxford Text Archive の例)
  • 既存の文書の処理だけでなく、文書作成にも使える。
  • 広範な SGML 対応ソフトウェアを利用できる。
  • TEI の拡張機構により、 TEI DTD を応用したもの(完全な互換性)。
  • なおかつ軽量・簡便であること。

The Oxford Text Archive は独自マークアップから SGML に変換するのに TEI Lite を使っている。ヴァージニア州立大学・ミシガン州立大学の電子テキストセンターも文書のマークアップを TEI Lite で行っている。 TEI (the Text Encoding Initiative)自身も本書を含む技術文書を TEI Lite に従って作成している。


[TOP]

2 簡単な例

原文の体裁に忠実であることだけを目指したマークアップの例。-(1)原文、(2)そのマーク付け。


  (1)
                           CHAPTER 38
                             
  READER, I married him. A quiet wedding we had: he and I, the par-
  son and clerk, were alone present. When we got back from church, I
  went into the kitchen of the manor-house, where Mary was cooking
  the dinner, and John cleaning the knives, and I said --
    'Mary, I have been married to Mr Rochester this morning.' The
  housekeeper and her husband were of that decent, phlegmatic
  order of people, to whom one may at any time safely communicate a
  remarkable piece of news without incurring the danger of having
  one's ears pierced by some shrill ejaculation and subsequently stunned
  by a torrent of wordy wonderment. Mary did look up, and she did
  stare at me; the ladle with which she was basting a pair of chickens
  roasting at the fire, did for some three minutes hang suspended in air,
  and for the same space of time John's knives also had rest from the
  polishing process; but Mary, bending again over the roast, said only --
     'Have you, miss? Well, for sure!'
     A short time after she pursued, 'I seed you go out with the master,
  but I didn't know you were gone to church to be wed'; and she
  basted away. John, when I turned to him, was grinning from ear to
  ear.
     'I telled Mary how it would be,' he said: 'I knew what Mr Ed-
  ward' (John was an old servant, and had known his master when he
  was the cadet of the house, therefore he often gave him his Christian
  name) -- 'I knew what Mr Edward would do; and I was certain he
  would not wait long either: and he's done right, for aught I know. I
  wish you joy, miss!' and he politely pulled his forelock.
     'Thank you, John. Mr Rochester told me to give you and Marythis.'
     I put into his hand a five-pound note.  Without waiting to hear
  more, I left the kitchen. In passing the door of that sanctum some time
  after, I caught the words --
     'She'll happen do better for him nor ony o' t' grand ladies.' And
  again, 'If she ben't one o' th' handsomest, she's noan faa\l, and varry
  good-natured; and i' his een she's fair beautiful, onybody may seethat.'
     I wrote to Moor House and to Cambridge immediately, to say what
  I had done: fully explaining also why I had thus acted. Diana and

                              474

                   JANE EYRE                      475

  Mary approved the step unreservedly. Diana announced that she
  would just give me time to get over the honeymoon, and then she
  would come and see me.
     'She had better not wait till then, Jane,' said Mr Rochester, when I
  read her letter to him; 'if she does, she will be too late, for our honey-
  moon will shine our life long: its beams will only fade over your
  grave or mine.'
     How St John received the news I don't know: he never answered
  the letter in which I communicated it: yet six months after he wrote
  to me, without, however, mentioning Mr Rochester's name or allud-
  ing to my marriage. His letter was then calm, and though very serious,
  kind. He has maintained a regular, though not very frequent correspond-
  ence ever since: he hopes I am happy, and trusts I am not of those who
  live without God in the world, and only mind earthly things.
  
  
(2) <pb n='474'> <div1 type=chapter n='38'> <p>Reader, I married him. A quiet wedding we had: he and I, the parson and clerk, were alone present. When we got back from church, I went into the kitchen of the manor-house, where Mary was cooking the dinner, and John cleaning the knives, and I said &dash; <p><q>Mary, I have been married to Mr Rochester this morning.</q> The housekeeper and her husband were of that decent, phlegmatic order of people, to whom one may at any time safely communicate a remarkable piece of news without incurring the danger of having one's ears pierced by some shrill ejaculation and subsequently stunned by a torrent of wordy wonderment. Mary did look up, and she did stare at me; the ladle with which she was basting a pair of chickens roasting at the fire, did for some three minutes hang suspended in air, and for the same space of time John's knives also had rest from the polishing process; but Mary, bending again over the roast, said only &dash; <p><q>Have you, miss? Well, for sure!</q> <p>A short time after she pursued, <q>I seed you go out with the master, but I didn't know you were gone to church to be wed</q>; and she basted away. John, when I turned to him, was grinning from ear to ear. <q>I telled Mary how it would be,</q> he said: <q>I knew what Mr Edward</q> (John was an old servant, and had known his master when he was the cadet of the house, therefore he often gave him his Christian name) &dash; <q>I knew what Mr Edward would do; and I was certain he would not wait long either: and he's done right, for aught I know. I wish you joy, miss!</q> and he politely pulled his forelock. <p><q>Thank you, John. Mr Rochester told me to give you and Mary this.</q> <p>I put into his hand a five-pound note. Without waiting to hear more, I left the kitchen. In passing the door of that sanctum some time after, I caught the words &dash; <p><q>She'll happen do better for him nor ony o' t' grand ladies.</q> And again, <q>If she ben't one o' th' handsomest, she's noan fa&agrave;l, and varry good-natured; and i' his een she's fair beautiful, onybody may see that.</q> <p>I wrote to Moor House and to Cambridge immediately, to say what I had done: fully explaining also why I had thus acted. Diana and <pb n='475'> Mary approved the step unreservedly. Diana announced that she would just give me time to get over the honeymoon, and then she would come and see me. <p><q>She had better not wait till then, Jane,</q> said Mr Rochester, when I read her letter to him; <q>if she does, she will be too late, for our honeymoon will shine our life long: its beams will only fade over your grave or mine.</q> <p>How St John received the news I don't know: he never answered the letter in which I communicated it: yet six months after he wrote to me, without, however, mentioning Mr Rochester's name or alluding to my marriage. His letter was then calm, and though very serious, kind. He has maintained a regular, though not very frequent correspondence ever since: he hopes I am happy, and trusts I am not of those who live without God in the world, and only mind earthly things.

この写しには、いくつか欠点がある。

  • テキスト本文とページ、ヘッダなどの区別がない。
  • アポストロフと引用符の区別がない。
  • ハイフネーションの無意味な保存。
  • アクセント文字やダッシュをその時々のやり方で処理してしまう。
  • 段落の区分が空白文字で行われ、各行末に改行文字があるため、フォーマットの変更が利かない。

TEI 方式を使うことによって、次のような区別がはっきりする。

  • 段落の区分。
  • アポストロフと引用符の区別。
  • アクセントやダッシュにはエンティティ参照を使うので常に一定である。
  • ページの区分は空要素だけで示し、レイアウトに影響しない。
      -<pb>(page break)
  • 原文の改行位置やハイフネーションは、特別な場合のみマークする。
      -復刻などの場合。
  • 段落はじめは改行するが、インデントは行わない。

TEI 方式では、次のようなマークアップも可能である。

  • 方言の注解を付与
  • 脚注の付加
  • リンクのためのポインタの付加
  • 正式名称の識別
  • 書誌的事項の導入
  • 文法的分析(分類コード)の付与
  • 地の文と会話の区分
  • テキストの分析・解釈のタグ付け
  • 画像・音声等とのリンク

他にも、大きな可能性がある。その一例。( TEI P3 を参照。)

  • 語彙集
  • 作品事典
  • 書誌的情報


[TOP]

3 テキストの構造

TEI 準拠のテキストには TEI header (<teiHeader>...</teiHeader>) を付ける。ヘッダは、①ファイル情報、②マークアップ情報、③文書情報、④更新履歴から成る。(「20」を参照。)

テキストは単独の作品の場合もあり、詞華集のように複数の作品から成る場合もある。

単独の作品の構造は、次の形にまとめられるだろう。


  <TEI.2>
      <teiHeader> [ TEI Header information ]  </teiHeader>
      <text>
          <front> [ front matter ... ]   </front>
          <body>  [ body of text ... ]   </body>
          <back>  [ back matter ...  ]   </back>
      </text>
  </TEI.2>

複合テキストの本文は、グループに分かれ、それぞれに前部・後付けを備える。


  <TEI.2>
    <teiHeader>   [ header information for the composite ] </teiHeader>
    <text>
      <front>     [ front matter for the composite  ]      </front>
      <group>
        <text>
          <front> [ front matter of first text ]   </front>
          <body>  [ body of first text  ]          </body>
          <back>  [ back matter of first text ]    </back>
        </text>
        <text>
          <front> [ front matter of second text]   </front>
          <body>  [ body of second text  ]         </body>
          <back>  [ back matter of second text ]   </back>
        </text>
                  [ more texts or groups of texts here ]
      </group>
      <back>      [ back matter for the composite  ]      </back>
    </text>
  </TEI.2>

個々のテキストにヘッダをつけ、定義を別にすることもできる。( TEI コーパス)ただし、コーパスの複合体を1つのオブジェクトとして扱うことは、現在の TEI ではできない。


  <teiCorpus>
    <teiHeader>  [header information for the corpus]</teiHeader>
    <TEI.2>
      <teiHeader>[header information for first text]</teiHeader>
      <text>     [first text in corpus]             </text>
    </TEI.2>
    <TEI.2>
      <teiHeader>[header information for second text]</teiHeader>
      <text>     [second text in corpus]             </text>
    </TEI.2>
  </teiCorpus>
以下の章では、単純な文章を主に取りあげて、必要な要素と属性に触れていく。

[TOP]

4 本文のマークアップ


 テキスト区分要素  見出しと終わり見出し  散文・韻文・戯曲

TEI 文書の要素

<front>
前置き(ヘッダ、タイトル・ページ、序文、献辞、他)
<group>
単独の作品のグループ(入れ子にもできる。)
<body>
作品本文
<back>
後書き(付録)

前部・後付けの要素については、「19」を参照。



[SECTION TOP]

テキスト区分要素

テキストは個々の段落(<p>)、又は章節項などの区分に分ける。(①すべて<div>、又は②段階に応じて<div1>から<div7>までの区分を作る。それ以上の区分がある場合は①によって初めからただの<div>をネストさせればよい。)

<p>/<divX>の属性: id や n は、どの要素にも使える共通属性である。

type
Book, Chapter, Poem 等。属性は下位の区分に継承される。
id
唯一性をもつ識別値。相互参照(Cross References) やリンク(「」を参照。)に利用できる。
n
短い名前や数字を書き入れる。

id によって文書の階層構造を反映する例。(アダム・スミスの国富論 Wealth of Nations の章節項を示す。)


  <div1 id=WN1 n='I' type='book'>
    <div2 id=WN101 n='I.1' type='chapter'>... </div2>
    <div2 id=WN102 n='I.2' type='chapter'>... </div2>
     ...
    <div2 id=WN110 n='I.10' type='chapter'>
      <div3 id=WN1101 n='I.10.1' type=part>... </div3>
      <div3 id=WN1102 n='I.10.2' type=part>... </div3>
    </div2>
     ...
  </div1>
  <div1 id=WN2 n='II' type='book'>
   ....
  </div1>
   ...

複数の書物で章が通し番号で振られている場合のタグ付け例。(章番号は n 属性で表し、 id 属性によって第何巻第何章であるかを示す。)


  <div1 id=TS01 n='1' type='Volume'>
    <div2 id=TS011 n='1' type='Chapter'>
     ...
    <div2 id=TS012 n='2'>
     ...
  </div1>
  <div1 id=TS02 n='2' type='Volume'>
    <div2 id=TS021 n='3'type='Chapter'>
     ...
    <div2 id=TS022 n='4'>
     ...
  </div1>

[SECTION TOP]

見出しと終わり見出し

タグの詳細は、「19」を参照。

<head>
見出し(節の小題、リストや用語集の題名等)
<trailer>
終わり見出し(それに類するフッタなど)

見出しが要素や属性で表せれば、これらのタグは必要ない。他の方法では再現できない場合などに活用する。(トマス・ハーディの Under the Greenwood Tree の冒頭の例。)


  <div1 id=UGT1 n='Winter' type='Part'>
  <div2 id=UGT11 n='1' type='Chapter'>
  <head>Mellstock-Lane</head>
  <p>To dwellers in a wood almost every species of tree ...

[SECTION TOP]

散文・韻文・戯曲

特に韻文や戯曲・脚本等に用いるタグ。

<l>
韻文の1行。
part 属性
Y 韻律面で不完全な行。 N 完全な行。 I(initial) 初めの部分の断片。 M(medial) 中間の部分。 F(final) 終わりの部分。
<lg>
韻文のまとまり(スタンザ、リフレイン、連、他)。
<sp>
人物の会話であることを示す。(脚本・散文・韻文中)
who 属性
ID をつけ、人物を識別・特定する。
<speaker>
脚本や断片の話し手(単数・複数)の名を記したラベル。
<stage>
ト書き用のタグ。舞台指示を行う。
type 属性
entrance, exit, setting, delivery 等。指示の種類を示す。

タグ付けの実例。もし体裁上の行を保持するなら、 <lb> 要素を使う。(「」を参照。)


  <lg n=I>
  <l>I Sing the progresse of a 
    deathlesse soule,</l>
  <l>Whom Fate, with God made,
    but doth not controule,</l>
  <l>Plac'd in most shapes; all times
    before the law</l>
  <l>Yoak'd us, and when, and since,
    in this I sing.</l>
  <l>And the great world to his aged evening;</l>
  <l>From infant morne, through manly noone I draw.</l>
  <l>What the gold Chaldee, of silver Persian saw,</l>
  <l>Greeke brass, or Roman iron, is in this one;</l>
  <l>A worke t'out weare Seths pillars, bricke and stone,</l>
  <l>And (holy writs excepted) made to yeeld to none,</l>
  </lg>

戯曲などで有韻文が話し手により分けて語られる場合、 part 属性でそれが断片であることを明示するのが簡単である。1つのスタンザを2人で分けて歌う場合などにも応用できる。


  <div1 type ='Act' n='I'><head>ACT I</head>
  <div2 type ='Scene' n='1'><head>SCENE I</head>
  <stage rend=italic>
  Enter Barnardo and Francisco, two Sentinels, at several doors</stage>
  <sp><speaker>Barn<l part=Y>Who's there?
  <sp><speaker>Fran<l>Nay, answer me. Stand and unfold yourself.
  <sp><speaker>Barn<l part=i>Long live the King!
  <sp><speaker>Fran<l part=m>Barnardo?
  <sp><speaker>Barn<l part=f>He.
  <sp><speaker>Fran<l>You come most carefully upon your hour.

rend 属性については、「」を参照。


  <sp><speaker>First voice</speaker>
  <lg type=stanza part=I>
  <l>But why drives on that ship so fast
  <l>Withouten wave or wind?
  </lg>
  <sp><speaker>Second Voice</speaker>
  <lg part=F>
  <l>The air is cut away before.
  <l>And closes from behind.
  </lg>

散文の会話でも、マークアップ方法は同様である。 who 属性で会話の主を特定することができる。


  <sp who=OPI><speaker>The reverend Doctor Opimiam</speaker>
  <p>I do not think I have named a single unpresentable fish.
  <sp who=GRM><speaker>Mr Gryll</speaker>
  <p>Bream, Doctor: there is not much to be said for bream.
  <sp who=OPI><speaker>The Reverend Doctor Opimiam</speaker>
  <p>On the contrary, sir, I think there is much to be said for him.
  In the first place....
  <p>Fish, Miss Gryll -- I could discourse to you on fish by
  the hour: but for the present I will forbear...
  </sp>

[TOP]

5 ページ番号・行番号

改ページと改行は、次の空要素で示す。

<pb>(page break)
改ページ
<lb>(line break)
改行(行の開始を示す。)

ともに n 属性を使えるほか、 ed 属性によって版数(刷数)を示すことができる。(版によるページ区切りの相違を示す。)なお、行末のハイフネーションの扱いは一考を要する。


  <p>I wrote to Moor House and to Cambridge immediately, to
  say what I had done: fully explaining also why I had thus
  acted.  Diana and <pb ed=ED1 n='475'> Mary approved the
  step unreservedly.  Diana announced that she would
  <pb ed=ED2 n='485'>just give me time to get over the
  honeymoon, and then she would come and see me.

これらの要素は、テキスト内の参照位置を示す <milestone> 要素の特別なケースである。こちらは、列やセクションの開始などを示し、前記 ed 属性のほか、 unit 属性(セクションの種類を示す)を使える。版やセクションの種類を TEI ヘッダに明記しておくこと。また、 <pb> 、 <lb> と <milestone> とは勝手に混用すべきでない。


[TOP]

6 語句の強調


 フォントの変更  引用など  外国語の表現

[SECTION TOP]

フォントの変更

強調語句はフォントやグリフ、色等の変更によって読者の注意を喚起する。

/→活字/

共通属性 rend (rendition) によって強調の仕方を示す。( rend='Bold'、 rend='Italic' 等) <hi> (hilight) は、それ自体では強調の種類を特定しない。


  <hi rend=gothic>And this Indenture further witnesseth</hi>
  that the said <hi rend=italic>Walter Shandy</hi>, merchant,
  in consideration of the said intended marriage ...
/→書誌/

強調の理由を明示できる場合、以下のような要素を使える。

<emph>
文法的、修辞的な効果のための強調。
<foreign>
外国語(本文と異なる言語)
<mentioned>
言及語句
<term>
専門用語
<title>
標題(作品・記事・書物・雑誌・叢書等)
lebel 属性
タイトルのレベルを示す。 m (monograph) 単行書・分冊、 s (series) 叢書、 j (journal) 新聞・雑誌、 u (unpublished material) 論文や抜き刷り、 a (article) 1個の記事・詩など
type 属性
類別。値の例: abbreviated, main, subordinate (副題や小見出し等), parallel (別題、外国語による別名等)。

引用や割り注のタグ( <q> 、 <gloss> )にも、必要なら rend 属性を付ける。

 (1)
 On the one hand the Nibelungenlied is associated with the new
 rise of romance of twelfth-century France, the romans
 d'antiquité
, the romances of Chrétien de Troyes, and the German
 adaptations of these works by Heinrich van Veldeke, Hartmann von Aue,
 and Wolfram von Eschenbach.

 (2)
 On the one hand the <title>Nibelungenlied</title> is associated
 with the new rise of romance of twelfth-century France, the
 <foreign>romans d'antiquit&eacute;</foreign>, the romances of
 Chr&eacute;tien de Troyes, ...

 (3)
 On the one hand the <hi rend=italic>Nibelungenlied</hi>
 is associated with the new rise of romance of twelfth-century
 France, the <hi rend=italic>romans d'antiquit&eacute;</hi>,
 the romances of Chr&eacute;tien de Troyes, ...

(1)の文章の強調個所を解釈すれば、(2)のようなタグ付けになる。また、外見だけを叙述すれば、(3)のようなタグ付けになるだろう。


[SECTION TOP]

引用など

引用符の性質を、できれば以下のように明示することを勧める。

<q>
会話・思考内容の表現。辞書では、実例・用例に使う。
type 属性
会話( spoken )・心話( thought :独白等)の区別。
who 属性
会話主を示す。
<mentioned>
言及個所
<soCalled>
いわゆる。責任回避の引用。
<gloss>
割り注・語注
target 属性
関連語句を示す。

引用の実例。


  Few dictionary makers are likely to forget Dr. Johnson's description
  of the lexicographer as <q>a harmless drudge.</q>

引用の形式(インライン、強調、ブロック引用等)を rend 属性で示すべきである。引用符の種類を表すにもこの属性を使える。

語り手の表白は、前後を引用で区切ることで示すことができる。


  <p><q>Who-e debel you?</q> &mdash; he at last said &mdash;<q>you
  no speak-e, damme, I kill-e.</q>  And so saying, the lighted
  tomahawk began flourishing about me in the dark.

もし2つの引用を1つの会話としてつなぐことが意味をもつ場合には、リンク属性の nextprev が使える。(「」を参照。)

引用部分の典拠や話者を示すには、 who 属性を使う。


  <q who=Wilson>Spaulding, he came down into the office just this
  day eight weeks with this very paper in his hand, and he
  says:&mdash;<q who=Spaulding>I wish to the Lord, Mr. Wilson, that
  I was a red-headed man.</q></q>

電子テキストの作成者は、引用符を残すか、タグで置き換えるかを決めなければならない。引用符を取り去る場合、 rend 属性によって原文の体裁を記録することができる。

また、強調の場合と同じく、強いて解釈するのでなく、単に <hi rend=quoted> で片づけるほうがよい場合もある。


[SECTION TOP]

外国語の表現

共通属性 lang をタグに付加する。適切な該当要素がない場合、 <foreign> 要素に lang 属性を加えてタグ付けする。


  Have you read <title lang=deu>Die Dreigroschenoper</title>?
 
  The court issued a writ of <term lang=lat>mandamus</term>.

  John has real <foreign lang=fra>savoir-faire</foreign>.
 
  <mentioned lang=fra>Savoir-faire</mentioned> is French for know-how.
/→索引/
[TOP]

7 注記

脚注・後注・欄外注その他、場所にかかわらず、メモや注釈には同じ <note> 要素を使う。

type 属性
注記の型を示す。
resp 属性
注釈者を示す。値の例:authoreditor 等、又は注釈者のイニシャルなど。
place 属性
注記の出現位置。inlineinterlinear(行間)、left(左マージン等)、rightfootend 等。
target 属性
注記をつける位置(句の初めなど)を示す。
targetEnd 属性
注記の及ぶ範囲の最後を示す。
anchored 属性
複製本が注記の参照個所を正確に示しているかどうかを明示。

注記番号または識別値が必要な場合、 n 属性を使う。また、注釈が原注であるか、校訂・編集の注であるかを resp で明示するか、どの種類の注であるかを TEI ヘッダで述べること。


  Collections are ensembles of distinct entities or objects of any sort.
  <note place=foot n=1>We explain below why we use the uncommon term
  <mentioned>collection</mentioned>instead of the expected
  <mentioned>set</mentioned>.
  Our usage corresponds to the <mentioned>aggregate</mentioned>
  of many mathematical writings and to the sense of
  <mentioned>class</mentioned> foundin older logical writings.</note>
  The elements ...

  <lg id=RAM609><note place=margin>The curse is finally expiated</note>
  <l>And now this spell was snapt: once more</l>
  <l>I viewed the ocean green,</l>
  <l>And looked far forth, yet little saw</l>
  <l>Of what had else been seen ‐</l>

[TOP]

8 相互参照とリンク


 ①同一の SGML 文書内での単純な相互参照
 ②拡張ポインタ  ③見えない形でのリンクを作る属性

[SECTION TOP]

①同一の SGML 文書内での単純な相互参照

<ref>
参照タグ。
<ptr> (pointer)
ポインタ。

<ptr> がポインタを作るだけの空要素であるのに対して、 <ref> は相互参照そのものを含むテキストをも含む。また、 <ptr> がシンボルやアイコン、ボタンといった言葉以外のものによるリンクを作るが、それは言葉によってリンクを作る文書生産システムでも役に立つ。

どちらにも共通して、以下の属性が使われる。

target 属性
ポインタの標的を示す。
type 属性
ポインタの類別を示す。
targType 属性
ポインタの指し示す要素のタイプを明示。
crDate 属性
ポインタの作成日時。
resp 属性
ポインタの作成者。

  See especially <ref target=SEC12>section 12 on page 34</ref>.
   
  See especially <ptr target=SEC12>.

target 属性の値は、その文書の SGML ID (を施した一節や句)である。次の例では、 <div1> 要素を参照している。

   ...
  see especially <ptr target=SEC12>.
   ...
  <div1 id=SEC12><head>Concerning Identifiers...
   ...

id 属性は一般的なので、例えばパラグラフなどにも施すことができる。

   ...
  this is discussed in <ref target=pspec>the paragraph on links</ref>
   ...
  <p id=pspec>Links may be made to any kind of element
   ...

targType 属性は、指し示される要素が特定のものであることを示す。この型が合わないと、参照は失敗する。 SGML パーサだけではこの適合性のチェックはできない。

   ...
  this is discussed in <ref target=dspec targType='div1 div2'>
  the section on links</ref>

type 属性によってリンクを分類することができる。 resp 属性と crDate 属性も併せて使った例:

   ...
  this is discussed in
  <ref type=xref resp=auto crdate=950521 target=dspec targtype='div1 div2'>
  the section on links</ref>
/→8-③/
/→<s>/

単にリンクポイントを作るだけならば、 <anchor> 要素を置くだけでよい。ある語句をターゲットにするなら、 <seg> 要素を置けばよい。 type 属性を加えることで目的別に分類することができる。


   .... <anchor type=bookmark id='ABCD'> ....
   .... <seg type=target id='EFGH'> ... </seg> ...

[SECTION TOP]

②拡張ポインタ

外部文書への参照をする場合には、 <xptr><xref> を使う。上記属性の他、 target 属性に代わって以下の属性を使う。

doc 属性
リンク先の文書名。(デフォルトはカレント文書。)
from 属性
TEI 拡張ポインタ構文に則ってリンク開始点を示す。(デフォルトは doc 属性で示された文書の全体。)
to 属性
TEI 拡張ポインタ構文に則ってリンク帰着点を示す。( from 属性が示されてはじめて明示される。)

TEI 拡張ポインタのターゲットを表現する方法の詳細は、 TEI P3 ガイドラインを参照。

<xptr>(又は <xref>)は、 doc 属性にエンティティ名を補うだけで、他の文書全体を指すことができる。このためには、エンティティ名を litemods.ent 拡張ファイルに、又は使用している SGML オーサリング・ソフトに固有の方法で宣言しておかなくてはならない。(「15」を参照。)


  see <xref doc=P3>The TEI Guidelines, passim</xref>

from 属性は、doc 属性で示された文書の中のある位置を示す。 TEI 拡張ポインタ構文に従って記述するが、かいつまんでいえば、指示位置は steps の並びで示され、各々の step は直前の step で示した位置からの相対的な位置を記述する。例えば、第2章の第2段落の3番目の文を指示するには、初めに第2章、次に第2段落、最後に第3文を指示するという具合である。書き方は SGML の考え方( parentdescendantpreceding 等。※下図参照。)によるか、あるいはもっと大まかに、テキストの型や字句の位置などでもよい。 SGML 記法でなくとも、同等のシステムで画像中の位置を指示することなどもできる。

from 属性と to 属性は、同じ記法を使う。拡張ポインタは、 from で示される場所の最初から、 to で示される場所の終わりまでの部分を指示するのである。

はじめに、ターゲットとなる文書中のある要素の ID を示す。


  <xptr doc=P3 from='id (SA)'>

これで P3 エンティティ中の SA 識別子で表される要素の全体を選ばれる。次のキーワードを使って、相互の関係によって他の要素を選ぶことができる。

 TEI のツリー構造として仮に考えてみたもの
child
子要素(この要素〔SA〕に含まれる要素)
ancestor
祖先要素(この要素を直接、間接に含む要素)
previous
兄要素(親要素が同じで、先行するもの)
next
弟要素(親要素が同じで、後続するもの)
preceding
親要素を含め、この要素に先行するもの
following
親要素を含め、この要素に後続するもの

それぞれに、例えば children (子要素の集合)、 ancestors (上位要素の集合)、 siblings (兄弟要素の集合)などが含まれる。明示のために次のものをカッコでくくったリストを続けてもよい。

  • 正負の数によって指示範囲を限定する。( +1 は現在位置から始めて最初に見つかった要素を示す。 -1 は最後に見つかった要素を示す。)又は、 all は見つかった要素すべてを示す。
  • 総称識別子によって要素の型を示す。又は、星印(アスタリスク)によって任意の要素を示す。
  • 属性名と値によって該当の要素を特定する。

上例の SA 識別子を持つ要素に含まれる第3段落を選択したもの。


  <xptr doc=P3 from='id (SA) child (3 p)'>

同様に、 P3 エンティティが TEI ガイドラインを参照しているとすれば、次は拡張ポインタ構文が規定されている同書の 14.2.2 節を選択している。


  For full details, see<ref doc=P3 from='id (SA) child (2 div2) child
   (2 div3)'>
  TEI Extended pointer syntax definition
  </ref>

次の例では、 from 属性と to 属性を使うことにより、文書の構造によらず、該当するすべての文書要素をターゲットとしている。(もちろん、 ABC の終わりが XYZ の始まりより先であったらエラーである。)


  <xptr doc=P1 from='id (xyz)' to='id (abc)'>

この構文を使うことで、非常に複雑な記述が簡単にできる。次は、 lang 属性の値が LAT であり、最も SA の始まりに近い先行要素 <head> を選択したものである。


  <xptr doc=P3 from='id (SA) preceding (1 head lang lat)'>

もし doc 属性に何の値もなければ、現在の文書が対象となる。次の(1)、(2)は同じ意味を表す。


  (1) <ptr target=X1>
  (2) <xptr from='id (X1)'>
/→解釈/
[SECTION TOP]

③見えない形でのリンクを作る属性

以下のリンク属性は TEI Lite DTD の共通属性で、特別な目的に使う。

ana (analysis) 属性
解釈とのリンク
corresp (corresponding) 属性
相当要素(単数・複数)とのリンク
next 属性
総体の中で次の要素にリンク
prev 属性
総体の中で前の要素にリンク

ana 属性は、抽象的分析・解釈を記した部分を指示する。(「16」を参照。)
例えば、 "John loves Nancy." という文の文法的解析をタグ付けする。それぞれ、SVONP1VV1 という id をもった説明文が同じ文書のどこかにあるわけである。なお、 type 属性を伴った seg 要素の使い方に注意。

/→解釈/
/→文法/

  <seg type=sentence ana=SVO>
    <seg type=lex ana=NP1>John</seg>
    <seg type=lex ana=VVI>loves</seg>
    <seg type=lex ana=NP1>Nancy</seg>
  </seg>

corresp 属性は、テキスト中の2つの要素が共通することを表す。多言語テキストで原語と翻訳語を結びつける例。


  <seg lang=FRA id=FR1 corresp=EN1>Jean aime Nancy</seg>
  <seg lang=ENG id=EN1 corresp=FR1>John loves Nancy</seg>

この機構は、例えばある語の前方照応関係を表すのにも応用できる。


  <p><title id=shirley>Shirley</title>, which made
  its Friday night debut only a month ago, was
  not listed on <name id=nbc>NBC</name>'s new schedule,
  although <seg id=network corresp=nbc>the network</seg>
  says <seg id=show corresp=shirley>the show</seg>
  still is being considered.

next 属性と prev 属性は、不連続の要素を互いにつなぐのに使う。


  <q id=Q1a next=Q1b>Who-e debel you?</q>
  &mdash; he at last said &mdash;
  <q id=Q1b prev=Q1a>you no speak-e,
  damme, I kill-e.</q>  And so saying,
  the lighted tomahawk began flourishing
  about me in the dark.

[TOP]

9 編集のための処置

次章にかけて、原文の体裁を保持し、かつ編集上の処置をも盛り込むための方法を述べる。

編集者(校訂者)が原文を「訂正」(correction) するための要素。

<corr>
原文の誤りと思われる個所の訂正。
sic 属性
誤りと思われる個所を記す。
resp 属性
訂正を行った編集・校訂者の記載。
cert (certainty)
訂正による原文の信頼度。
<sic>
ママ(誤記・誤植の保持)
corr 属性
訂正候補の記載。
resp 属性
訂正を行った編集・校訂者の記載。
cert 属性
訂正による原文の信頼度。

以下の要素は、「改正」(normalization) のための要素である。文脈の一貫性・今日的整合性などを目的とした変更である。

<orig> (original) 要素
原文の読み方
reg (regularized) 属性
訂正した読み方
resp 属性
校訂者の id
<reg> 要素
訂正した読み方
orig 属性
原文の読み方
resp 属性
校訂者の id

例えば、(1)の文は Gifford によって語句とスペルの誤りを指摘されている。(① tablebabbled の誤り、② a'he の、 feeldsfields の誤記)彼の推測をマーク付けで表したのが(2)である。


  (1) ... for his nose was as sharp as a pen and a' table of green feelds
  
  (2) ... for his nose was as sharp as a pen and <reg sic="a'">he</reg>
    <corr sic='table' ed=Gifford>babbl'd</corr> of green
    <reg sic='feelds'>fields</reg>

[TOP]

10 省略・削除・付加

省略・抹消個所を補い、原文の再現に必要な情報を補うための方法。

<add> 要素
原著者・書写者・注釈者・校訂者等による字句の書き入れを明示。
place 属性
書き入れ個所を示す。値の例: inline,supralinear(行の上),infralinear(行の下),left(左マージン),right,top,bottom 等。
<gap> 要素
写本中の省略個所。 TEI ヘッダに理由の記述があるか、又は判読できないかによる。
desc (description) 属性
省略個所の記述。
resp
省略を保存した編集者(書写者・マーク付け責任者)の id 等。
<del> 要素
削除された字句の記述。削除注記・衍文・改竄個所など。
type 属性
適宜、削除の類型を記述する。
status 属性
削除の適否などを記述できる。
hand 属性
削除者の id 等。
<unclear> 要素
判読不能の字句を記述。
reason 属性
書写できない理由。
resp 属性
判断者の id 等。

削除注記の実例を示す。(1)の衍字を削除することを、(2)で示す。


  (1) The following elements are provided for
     for simple editorial interventions.
     
  (2) The following elements are provided for
     <del hand=LB>for</del> simple editorial interventions.

原文で動詞を落としていた場合。


  (1) The following elements provided for
     for simple editorial interventions.
    
  (2) The following elements <add hand=LB>are</add> provided for
     <del hand=LB>for</del> simple editorial interventions.

同様に、原著者による原稿の校正などもマークアップできる。例えば、初稿の galls を抹消して dogs を挿入した場合は、次のようになる。


  How it <del hand=DHL type=overstrike>galls</del>
  <add hand=DHL place=supralinear>dogs</add> me,what a galling shadow

<unclear> 要素と <gap> 要素を同時に使って、判読不能部分の省略を示すことができる。(下の例では、補入候補を記述するために <add> タグを使っている。)


  One hundred & twenty good regulars joined to me
  <unclear><gap reason='indecipherable'></unclear>
  & instantly, would aid me signally <add hand=ed>in?</add>
  an enterprise against Wilmington.

<del> 要素は、削除の旨を記しながら削除部分をテキストの一部分として記述するが、 <gap> 要素は判読の可否にかかわりなくテキストの省略個所を記すものである。コーパスなどでは、外国語の長い引用文は省略するかもしれない。


  <p> ... An example of a list appearing in a fief ledger of
  <name type=place>Koldinghus</name> <date>1611/12</date>
  is given below. It shows cash income from a sale of
  honey.</p>
  <q><gap desc='quotation from ledger'
    reason='in Danish'></q>
  <p>A description of the overall structure of the account is
  once again ... </p>

他のコーパスでは(特にスキャナが今日のように普及する以前のもの)、図や数式は省略されている。


  <p>At the bottom of your screen below the mode line is the
  <term>minibuffer</term>.  This is the area where Emacs
  echoes the commands you enter and where you specify
  filenames for Emacs to find, values for search and replace,and so on.
  <gap desc='diagram of Emacs screen' reason='graphic'>
  </p>

[TOP]

11 名前・日付・数値・略語


 名前と称呼  日付と時間  数字  略語とその展開  住所

[SECTION TOP]

名前と称呼 (referring string)

称呼とは人や場所、物などを参照する句である。

<rs> (referring string) 要素
普通名詞や称呼
type 属性
参照する物の種類。値の例: person,place,ship,element 等。
<name> 属性
固有名詞(名詞句)
type 属性
参照する物の型。
/→addr/
  <q>My dear <rs type=person>Mr. Bennet</rs>, </q>
  said his lady to him one day, <q>have you heard
  that <rs type=place>Netherfield Park</rs> is let
  at last?</q>
   
  It being one of the principles of the
  <rs type=organization>Circumlocution Office</rs> never,
  on any account whatsoever, to give a straightforward answer,
  <rs type=person>Mr Barnacle</rs> said, <q>Possibly.</q>

次の例では、 <rs> 要素が固有名詞(名詞句)の形をしていない場合も含めて、すべての人や場所等への参照句にタグ付けされている。
(※ <rs> は <name> を包含している。以下を参照。)


  <q>My dear <rs type=person>Mr. Bennet</rs>,</q>
  said <rs type=person>his lady</rs> to him one day...

これと対照的に、 <name> 要素は固有名詞だけから成る。 <rs> 要素と同じような意味に使うこともでき、また普通名詞と固有名詞の混ざった referring string では <rs> 要素の中にネストさせて使うこともできる。

名前を単に name でタグ付けしたのでは、参照のためには十分ではない。文章の中には、いつもきちんとした形で名前が出てくるわけではない。上記の要素や類似の要素に、以下の属性を付けることができる。

key 要素
その名前に代わる id 等(データベースのキー項目のようなもの)
reg (regularized) 要素
正規化された表記

key 属性は、文書に散在する人名や地名へのすべての参照を集める手段として有益である。


  <q>My dear <rs type=person key=BENM1>Mr. Bennet</rs>,
  </q> said <rs type=person key=BENM2>his lady</rs>
  to him one day, <q>have you heard that
  <rs type=place key=NETP1>Netherfield Park</rs>
  is let at last?</q>

前述の reg (regularization) 属性が次のように称呼の標準化された形を記述するために使われるのと区別すること。


  <name type=person key=WADLM1 reg='de la Mare, Walter'>
     Walter de la Mare
  </name>  was born at
  <name key=Ch1 type=place>Charlton</name>, in
  <name key=KT1 type=county>Kent</name>, in 1873.

[SECTION TOP]

日付と時間

<date> 要素
日付
calendar 属性
日付を記載するシステム又はカレンダー
value 属性
所定の形式での日付( yyyy-mm-dd 等)
<time> 要素
時間
value 属性
所定の形式での時間

value 属性は、 ISO 8601 等の形式に従う。省略形や範囲で示すこともできる。曖昧な表現でも、範囲の区切りが分かれば、 exact 属性で表すことができる。


  <date value='1980-02-21'>21 Feb 1980</date>
  <date value='1990'>1990</date>
  <date value='1990-09'>September 1990</date>
   
  Given on the <date value='1977-06-12'>Twelfth Day of June
  in the Year of Our Lord One Thousand Nine Hundred and
  Seventy-seven of the Republic the Two Hundredth and first
  and of the University the Eighty-Sixth.</date>
   
  <l>specially when it's nine below zero
  <l>and <time value='15:00'>three o'clock in the afternoon</time>

[SECTION TOP]

数字

文字でも書かれるが、他の文字との区別は比較的明瞭である。区別のためには、 <num> 要素を使う。

<num> 要素
数字・番号
type 属性
数値の形式。値の例: cardinal(基数),ordinal(序数),fraction(分数), percentage等。
value 属性
数値(アプリケーションに依存しない形式で記す。)

  <num value='33'>xxxiii</num>
  <num type=cardinal value='21'>twenty-one</num>
  <num type=percentage value='10'>ten percent</num>
  <num type=percentage value='10'>10%</num>
  <num type=ordinal value='5'>5th</num>

[SECTION TOP]

略語とその展開

略語をそのまま使う場合も展開する場合もあるだろう。マーク付けするには、以下の要素を使う。

<abbr> (abbreviation) 要素
略語
expan (expansion) 属性
略語の正式名称を記す。
type 属性
略語の分類。値の例: contraction(縮約),suspension(省略),brevigraph(略記),superscription(略号),acronym (頭文字)等。あるいは、title(敬称・肩書),geographic,organization 等。語の性質をよく表す分類を工夫する。

<abbr> 要素は、頭文字や隠語などを区別するのに役に立つ。


  We can sum up the above discussion as follows:  the identity of a
  <abbr>CC</abbr> is defined by that calibration of values which
  motivates the elements of its <abbr>GSP</abbr>;
   
  Every manufacturer of <abbr>3GL</abbr> or <abbr>4GL</abbr>
  languages is currently nailing on <abbr>OOP</abbr> extensions.

機能によって type 属性を使った例。


  <name><abbr type=title expan='Doctor'>Dr.</abbr>
  <abbr type=initial expan='Marilyn'>M.</abbr> Deegan</name>
  is the Director of the
  <abbr expan='Computers in Teaching Initiative' type=acronym>
  CTI</abbr> Centre for Textual Studies.

[SECTION TOP]

住所

<address> 要素は、住所を示す。さらに、住所の各行を <addrLine> 要素で示す。


  <address>
  <addrLine>Computer Center (M/C 135)</addrLine>
  <addrLine>1940 W. Taylor, Room 124</addrLine>
  <addrLine>Chicago, IL 60612-7352</addrLine>
  <addrLine>U.S.A.</addrLine>
  </address>

住所の個別要素は、前述の <name> 要素を使う。


  <address>
  <addrLine>Computer Center (M/C 135)</addrLine>
  <addrLine>1940 W. Taylor, Room 124</addrLine>
  <addrLine><name type=city>Chicago</name>, IL 60612-7352</addrLine>
  <addrLine><name type>=country>USA</name></addrLine>
  </address>
/→索引/
[TOP]

12 リスト

リストには、番号つきリスト・番号無しリスト・用語リストなどがある。どれも項目の並びであり、項目のはじめにはラベル(用語リストでは用語そのもの)がある。

<list> 要素
テキスト項目の並び
type 属性
リストの形式。値の例: orderd(番号つきリスト),bulleted (文字や数字〔順序に関係なし?〕・丸印のついたリスト),gloss(専門用語集。 <label> 要素と <item> 要素とから成る。),simple (無印のリスト)等。
item 要素
リストの構成要素。
label 要素
ラベル。項目が続く。用語集では、見出しの術語がここにくる。

最初の <item> の前には、リストのヘッダとなる <head> を置いてもよい。リストの番号つけは不要であり、つける場合には n 属性を各項目につけるか、(まれに)<label> 要素を使う。
次の例は、どれも同じ意味を表している。


  (1)
  <list>
  <head>A short list</head>
  <item>First item in list.</item>
  <item>Second item in list.</item>
  <item>Third item in list.</item>
  </list>
  
  (2)
  <list>
  <head>A short list</head>
  <item n=1>First item in list.</item>
  <item n=2>Second item in list.</item>
  <item n=3>Third item in list.</item>
  </list>
  
  (3)
  <list>
  <head>A short list</head>
  <label>1</label><item>First item in list.</item>
  <label>2</label><item>Second item in list.</item>
  <label>3</label><item>Third item in list.</item>
  </list>

同じリストに異なったスタイルを混ぜるのはよくない。

用語集は term をラベルとしてタグ付けし、 gloss を項目(item)としてタグ付けする。この term , gloss と、普通のテキストのどこにでも置ける <term> 要素、 <gloss> 要素とは同じものである。


  <list type=gloss>
  <head>Vocabulary</head>
  <label lang=enm>nu</label>        <item>now</item>
  <label lang=enm>lhude</label>     <item>loudly</item>
  <label lang=enm>bloweth</label>   <item>blooms</item>
  <label lang=enm>med</label>       <item>meadow</item>
  <label lang=enm>wude</label>      <item>wood</item>
  <label lang=enm>awe</label>       <item>ewe</item>
  <label lang=enm>lhouth</label>    <item>lows</item>
  <label lang=enm>sterteth</label>  <item>bounds, frisks</item>
  <label lang=enm>verteth</label>   <item lang=lat>pedit</item>
  <label lang=enm>murie</label>     <item>merrily</item>
  <label lang=enm>swik</label>      <item>cease</item>
  <label lang=enm>naver</label>     <item>never</item>
  </list>

リストがもっと複雑な場合、むしろ table と考えて、専用の TEI タグ・セットを使うほうがよい。

リストはいくらでも入れ子にできる。


  <list type=gloss>
  <label>EVIL</label>
    <item>
    <list type=simple>
     <item>I am cast upon a horrible desolate island, void
            of all hope of recovery.</item>
     <item>I am singled out and separated as it were from
           all the world to be miserable.</item>
     <item>I am divided from mankind &mdash; a solitaire; one
             banished from human society.</item>
    </list> <!-- end of first nested list -->
    </item>
  <label>GOOD</label>
    <item>
    <list type=simple>
     <item>But I am alive; and not drowned, as all my
             ship's company were.</item>
     <item>But I am singled out, too, from all the ship's
             crew, to be spared from death...</item>
     <item>But I am not starved, and perishing on a barren place,
            affording no sustenances....</item>
    </list><!-- end of second nested list -->
    </item>
  </list><!-- end of glossary list -->

リストは、必ずしも改行しなくともよい。


  On those remote pages it is written that animals are
  divided into <list rend="run-on"><item n='a'>those that belong to the
  Emperor,<item n='b'> embalmed ones, <item n='c'> those
  that are trained, <item n='d'> suckling pigs, <item n='e'>
  mermaids, <item n='f'> fabulous ones, <item n='g'> stray
  dogs, <item n='h'> those that are included in this
  classification, <item n='i'> those that tremble as if they
  were mad, <item n='j'> innumerable ones, <item n='k'> those
  drawn with a very fine camel's-hair brush, <item n='l'>
  others, <item n='m'> those that have just broken a flower
  vase, <item n='n'> those that resemble flies from a distance.</list>

書誌的な項目のリストについては、 <listBibl> 要素を使う。(次節を参照。)

/→文献/
[TOP]

13 書誌的引用

研究目的の書誌的な引用は、テキストの印刷に際してきちんと分かるように区分けされるだろう。 <bibl> 要素は、書誌的引用部分を本文と区別する。

その他、次のタグを適宜利用するとよい。

<author> 要素
書誌的引用の中の原著作者(機関)名
<biblScope> 要素
書誌的引用の範囲(ページ数や当該巻数等)
<date> 要素
日付
<editor> 要素
2次的著作(編集)者(機関)名
role 属性
資格・役割(デフォルトは editor 、他に translator,compiler,illustrator 等。)
<imprint> 要素
印刷・出版者
<publisher> 要素
(代表の)出版機関名・発行元
<pubPlace> 要素
出版地
<series> 要素
叢書・シリーズ名
<title> 要素
標題(作品名・記事名・書名・誌名・叢書名等)
type 属性
分類( main,subordinate(副題など) 等)
level 属性
標題の書誌的な階層(「」を参照。)

編集注記のタグ付けの一例。(1)のカッコ内が注記の原文である。


  (1) He was a member of Parliament for Warwickshire in 1445,
     and died March 14, 1470 (according to Kittredge, Harvard
     Studies 5. 88ff). 
   
  (2) He was a member of Parliament for Warwickshire in 1445,
     and died March 14, 1470 (according to 
     <bibl><author>Kittredge</author>, <title>Harvard
     Studies</title> <biblScope>5. 88ff</biblScope></bibl>).

書誌的引用のリストには <listBibl> 要素を使う。これは <bibl> 要素の並びである。実例は、「22 リファレンス」中のリストを参照。)


[TOP]

14 テーブル(表)

テキスト処理システムにとってテーブル(表)は大きな課題だが、簡単な表は文章中によく現れるため、簡単なものであっても専用のタグが必要である。

<table> 要素
行と列とから成る表形式のテキスト
rows 属性
行数を示す。
cols (columns) 属性
列数を示す。
<row> 要素
表の1行
role 属性
行中の各セルの情報。値の例: label (ラベル・識別データ),data (事実データ)等。
<cell> 要素
表のセル
role 属性
セルの情報。値の例: label (ラベル・識別データ),data (事実データ)等。
cols 属性
セルの占める列数
rows 属性
セルの占める行数

次は、ダニエル・デフォーが黒死病年報中で使った死者の一覧表の例である。


  <p>It was indeed coming on amain, for the burials that
  same week were in the next adjoining parishes thus:&mdash;
  <table rows=5 cols=4>
  <row role='data'>
  <cell role='label'>St. Leonard's, Shoreditch</cell>
    <cell>64</cell> <cell>84</cell> <cell>119</cell></row>
  <cell role='label'>St. Botolph's, Bishopsgate</row>
    <cell>65</cell> <cell>105</cell> <cell>116</cell></row>
  <cell role='label'>St. Giles's, Cripplegate</row>
     <cell>213</cell> <cell>421</cell> <cell>554</cell></row>
  </table>
  <p>This shutting up of houses was at first counted a very cruel
  and unchristian method, and the poor people so confined made
  bitter lamentations. ... </p>

[TOP]

15 図と絵

どんなに飾り気の無い文章でも、図解や挿し絵くらいは割合あるものだ。文書によっては文章と画像とが不可分なものもあり、他のメディアを駆使する電子的資料でもこれらがあるに越したことはない。

マークアップは、以下のタグによってテキスト中でのグラフィックのあり場所を記すだけでよく、あるいは内容を短く説明してもよい。数値化されたグラフィックを電子化テキストに埋め込む場合も同様である。

<figure> 要素
グラフィックの挿入される地点を示す。
entity 属性
数値化されたグラフィックを含む実体の名前
( TEI ヘッダで定義済み)
<figDesc> 要素
グラフィックの見た目や内容を文章で記述したもの
(図を表示しない場合に用いる。)

グラフィックに付属する言語情報は、ヘッダやキャプションのように、 <figure> 要素の中に <head><p> (必要な数ぶん)の形で含めてよい。
画像の説明は、ぜひ <figDesc> 要素などで補うのがよい。それによって、アプリケーションがグラフィックを表示できない場合や、視覚不自由者が文書を把握できるようにする場合などに使う。(そういう文章は、元文書の本文とは見なさないのが普通である。)

グラフィックの位置だけをマークした例。(要素内容が何も無い場合でも、終了タグは省略できない。)


  <pb n=412>
  <figure></figure>
  <pb n=413>

グラフィックのタイトルは、 <head> 要素で示すことが多い。その際、短い説明も入れた方が便利だろう。


  <figure>
    <head>Mr Fezziwig's Ball</head>
    <figdesc>A Cruikshank engraving showing Mr Fezziwig leading
       a group of revellers.</figdesc>
  </figure>

数値化されたグラフィックデータを利用できる場合、文書中の適切な位置に埋め込めればなおよい。絵などは他のエンティティ(ファイル等)に分かれ、記法(フォーマット、ファイル形式)も異なっているのが普通である。 TEI Lite DTD では、 CGM , TIFF , JPEG 形式を、それぞれ cgm , tiff , jpeg という( SGML の)記法名で用いることができるが、他の記法であっても NOTATION 宣言をうまく DTD に加えるなら用いることは可能である。( SGML の NOTATION 宣言の詳細は、 TEI P3 の「 tables , formulae , and graphics 」の章、又は他の SGML 関連書を参照。)

画像がどんなフォーマットであっても、文章に埋め込む方法は変わらない。初めに、特定の型の SGML エンティティ(実体)-ファイル名のような外部識別子-と使われている記法とを宣言するのである。


  <!ENTITY fezziPic SYSTEM "fezzi.tff" NDATA tiff>

こうした宣言は、 SGML 文書そのものより先に読まれる。 TEI Lite DTD では、これらの宣言を litedecls.ent ファイル、又は公開識別子 -//TEI U5-1995//DTD TEI Lite 1.0 Extensions//EN を明示したファイルに置くことになる。

この宣言が働いているとき、数値データとしての画像を文書中の適切な場所に埋め込むためには、 <figure> 要素の entity 属性に値を入れるだけでよい。


  <figure entity=fezziPic>
    <head>Mr Fezziwig's Ball</head>
    <figdesc>A Cruikshank engraving showing Mr Fezziwig leading
       a group of revellers.</figdesc>
  </figure>

[TOP]

16 解釈・分析


 正書法による文  汎用の解釈要素

マークアップは解釈と分析の形式であるとはよくいわれるが、「主観的」情報と「客観的」情報とをいつでもきちんと区別するのは困難というよりほとんど不可能であるのに、「主観的」な判断が「客観的」な判断よりも論議を呼びがちであることには変わりがない。そこで、他のマークアップよりも異議を受けやすい点に読者の注意を促すことができる場合にのみ、その種の解釈をあえて記すという場合が多いのである。ここでは、こうしたマークアップのための要素をいくつか述べる。


[SECTION TOP]

正書法による文

解釈というものは、他の構造単位にはかかわりなく、本文全体にわたるものだ。したがって、精密な解釈を行うには、本文を個々に分離独立した単位(文)に分けるのが有効で、それが「規範的な参照」の類のラベルとなるわけである。個々の単位は、互いに交叉したり入れ子にしたりしてはならない。次の要素で単位を表すと便利である。

<s> (sentence unit) 要素
本文全体に及ぶ規範的な参照を行うために、文書を分けた「文」の単位。
type 属性
単位の分類(例: 断定、疑問等)

名前が示すとおり、 <s> 要素は、句読法などの正書法による文を表すのに使える。はじめに引いた「ジェーン・エア」の例。


  <pb n='474'>
  <div1 type=chapter n='38'>
  <p><s n=001>Reader, I married him.</s>
  <s n=002>A quiet wedding we had:</s>
  <s n=003>he and I, the parson and clerk, were alone present.</s>
  <s n=004>When we got back from church, I went
  into the kitchen of the manor-house, where Mary was cooking the dinner,
  and John cleaning the knives, and I said ‐</s>
  <p><q><s n=005>Mary, I have been married to Mr Rochester
  this morning.</s></q> ...

<s> 要素は入れ子にはならないのだから、 <s> 要素の開始は直前の <s> 要素の終了を意味することになり、終了タグが不可欠なわけではない。また、この例のように区分する場合は、本文全体を端から端までタグ付けするのが望ましい。そうすれば、分析する文中の単語すべてが一つの <s> 要素に含まれ、唯一の参照関係を示すことができる。識別子が文書中で唯一のものならば、この例の n 属性よりも id 属性のほうがよいかもしれない。


[SECTION TOP]

汎用の解釈要素

<s> 要素よりも汎用の分節要素としては、 <seg> 要素がこれまでも相互参照やハイパーテキストのリンク(「」を参照。)のターゲットを特定するのに使われている。これは、いくぶん句レベルのまとまりを指し、唯一の識別子であるばかりでなく、ユーザー定義の type 属性を割り当てることもできた。したがって、これを TEI ガイドラインには何の定めもないテキストの特徴のタグ付けに用いることができる。

例えば、ガイドラインには、物語の語り手が読者(聴者)に向かって直接に語りかける部分をマーク付けするための <apostrophe> (頓呼法)の要素などは無い。このための1つの解決策としては、これを <q> 要素の一例として(ただし、 who 属性の値を適切に定めることによって区別することで)考えることであろうか。けれども、もっと簡単で用途の広い解決法は、 <seg> 要素を次のように利用することであろう。


  <div1 type=chapter n='38'>
  <p><seg type='apostrophe'>Reader, I married him.</seg>
  A quiet wedding we had: ...

<seg> 要素の type 属性は、およそどんな値もとりうるから、句レベルの現象なら何でも記録することができる。 <seg> 要素の値とその意味するところを TEI ヘッダに書いておくのがよい。

<seg> 要素は、見かけのよく似た <s> 要素とは異なり、同種又は異種の <seg> 要素の入れ子とする(ネストする)ことができる。このため、非常に複雑な構造を表現することが可能だ(「8 リンク属性」のいくつかの例を参照。)
しかし、 SGML では要素の包含関係を正しく書くことが求められ、交叉を許していないために、文書の階層構造を全く顧みない勝手な範囲に対して解釈を結びつけたいという要求を満足させることができない。また、解釈それ自体も type 属性のとる1つの値で表す必要がある。

/→索引/

これに対して、 <interp> 要素には、どちらの制約も当てはまらない。この要素は、わりあいストレートな方法で、非常に複雑な解釈をマークアップできる頼もしい特徴を持っている。

<interp> (interpretation) 要素
本文中の(一定の長さをもった)語句にリンクされる注釈・解釈を入れる。
value 属性
注釈の対象となる事象を示す。
resp 属性
解釈の責任者
type 属性
注釈の対象となる事象の分類。値の例: image,character,theme,allusion (引喩)等。又は、具体的事例の挙げてある特定の論題の名称等。
inst (instance) 属性
この要素が表す分析・解釈の具体的事例を指す。(適用)
<interpGrp> 要素
<interp> タグを集めたもの。

これらの要素のおかげで、解釈の分類とそれに関する具体的事例とをマーク付けできる。 <seg> 要素ではあるものが頓呼であることしか分からないのに対して、 <interp> 要素を使えば、それがより上位の修辞的特徴に照らしてその具体的事例としての頓呼法であるということが伝えられるようになる。

その上、 <interp> は空要素であり、「8 リンク属性」で取りあげたana 属性によるか、この要素自身の <inst> 属性によって示した分節にリンクしなければならない。これはつまり、 SGML 文書の階層構造を顧慮せずにどのような分析も表すことができ、また特定のタイプの分析をグループ化することも容易になるわけだ。グループ化のためには、専用の <interpGrp> 要素がある。

具体的に、もしも主題・題材・修辞的特徴・物語の個々の場面の位置などといった文章の複雑な位相をマーク付けしたいとする。例えば、『ジェーン・エア』の離れた一節について、あるいは頓呼 (apostrophe) ・誇張 (hyperbole) ・隠喩 (metaphor) 等の修辞的特徴として、あるいは教会・召使・料理・郵便・ハネムーン等々の題材への参照として、そして教会の場面・台所の場面・居間(?)かどこかの場面等として、いろいろの意味づけを与えることになるかもしれない。こうした解釈は、 <text> 要素のどこにでも入れられる。しかし、それらは同じ場所に入れるのがよい。(例えば、前文や後付け等。)その例:


  <back>
  <div1 type='Interpretations'>
  <interp id='fig-apos'  resp='LB, MSM'
    type='figure of speech' value='apostrophe'>
  <interp id='fig-hyp'   resp='LB, MSM'
    type='figure of speech' value='hyperbole'>
  <!-- ... -->
  <interp id='set-church'  resp='LB, MSM'
    type='setting' value='church'>
  <!-- ... -->
  <interp id='ref-church'  resp='LB, MSM'
    type='reference' value='church'>
  <interp id='ref-serv'    resp='LB, MSM'
    type='reference' value='servants'>
  <!-- ... -->
  </p></div>

このコーディングの明らかな冗漫さを軽減するには、共通した属性値をもつ <interp> 要素を全部、 <interpGrp> 要素によってまとめればよい。


  <back>
  <div1 type='Interpretations'>
  <interpGrp type='figure of speech' resp='LB, MSM'>
    <interp id='fig-apos' value='apostrophe'>
    <interp id='fig-hyp'  value='hyperbole'>
    <interp id='fig-meta' value='metaphor'>
  <!-- ... -->
  </interpGrp>
  <interpGrp type='scene-setting' resp='LB, MSM'>
    <interp id='set-church'  value='church'>
    <interp id='set-kitch'   value='kitchen'>
    <interp id='set-unspec'  value='unspecified'>
  <!-- ... -->
  </interpGrp>
  <interpGrp type='reference' resp='LB, MSM'>
    <interp id='ref-church' value='church'>
    <interp id='ref-serv'   value='servants'>
    <interp id='ref-cook'   value='cooking'>
  <!-- ... -->
  </interpGrp>
  </p></div>

これらの解釈要素が定まったら、それを本文の該当部分にリンクさせるには、2つの方法がある(どちらか一方だけでも、両方でもよい)。
ana 属性は、どちらの要素にも共通して使うことができる。(次の例では、一段落に2つの場面設定があるので、識別子も2つあることに注意。)


  <div1 type=chapter n='38'>
  <p id='P38.1' ana='set-church set-kitch'>
  <s id=P38.1.1 ana='fig-apos'>Reader, I married him.</s>...

<interp> 要素に inst 属性を与えることによって、本文のどんな部分をも指示することができる。


  <interp id='fig-apos' type='figure of speech' resp='LB, MSM'
    value='apostrophe' inst='P38.1.1'>
  <!-- ... -->
  <interp id='set-church'  type='scene-setting' value='church'
    inst='P38.1' resp='LB, MSM'>
  <interp id='set-kitchen' type='scene-setting' value='kitchen'
    inst='P38.1' resp='LB, MSM'>
  <!-- ... -->

<interp> は、特定の分野に限らない。以上のような文学的な分野は1つの可能性にすぎない。同様に、文法的な品詞を示すのにも十分使える。「8 リンク属性」で挙げた例文は、次のように分析することもできる。


  <interp id=NP1 type=pos value='noun phrase, singular'>
  <interp id=VV1 type=pos value='inflected verb, present-tense singular'>
  ...

[TOP]

17 技術文書


 技術文書用の追加要素  区分の生成  索引の生成

本書の中心は、「電子化以前」の既存文書をマーク付けする TEI の方式を述べることにあるが、新規の文書についても同じ方式が当てはまる。 SGML では、文書構造を明確に表すことや、同じ文書をさまざまな目的に応じて再利用できるようにすること(オンラインのハイパー・テキストやブラウズ可能な文書も活版の体裁にまとまった文書も、共通の SGML 文書から生成できること)などを勧告している。

このことを容易にするために、 TEI DTD の拡張として技術文書全般と特に SGML 関連の文書の特徴をマーク付けする専用の要素を TEI Lite はいくらか含んでいる。


[SECTION TOP]

技術文書用の追加要素

次の要素は、技術文書の特徴をマーク付けするのに使う。

<eg> 要素
現在とりあげている問題の簡単な具体例。例: SGML マーク付けの仕方や例など。
<code> 要素
プログラミング言語など形式的言語の短いコード。
<ident> (identifier) 要素
ある種の識別子。例:変数名、 SGML 要素名・属性名など。
<gi> (generic identifier) 要素
特別な型の識別子。例: SGML 総称識別子・要素名など。
<kw> 要素
形式的言語のキーワード。
<formula> 要素
非 SGML 記法などで任意に提示される数学的・化学的公式。
notation 属性
式に用いている記法名。デフォルト値は tex (式が TeX の組版方式を用いている意。)

Fortran 言語の入門書の一節をマーク付けするのにこれらの要素を使った例。


  <p>It is traditional to introduce a language with a program like the
  following:
  <eg>
    CHAR*12 GRTG
    GRTG = 'HELLO WORLD'
    PRINT *, GRTG
    END
  </eg></p>
  <p>This simple example first declares a variable <ident>GRTG</ident>, in
  the line <code>CHAR*12 GRTG</code>, which identifies <ident>GRTG</ident>
  as consisting of 12 bytes of type <kw>CHAR</kw>.  To this variable,
  the value <mentioned>HELLO WORLD</mentioned>
  is then assigned. This is followed by a <kw>PRINT</kw> statement and an
  <kw>END</kw> statement.

このようにタグ付けすることにより、テキストをフォーマットするアプリケーションは、適切に働く。(改行を保持する、フォントを区別する、等。)同様に、 <ident><kw> などのタグを使えば、便利な索引を作るのもずいぶん楽になる。

<formula> 要素は、本文とは区別された数式や化学式を取り込むために使うべきだ。公式は通常の本文には表れない特別な字体を使うのが普通なので、特殊な記法で表現する必要がある。使用する記法は notation 属性で示す。
Tex は規定値になっているが、他の記法を使う場合はあらかじめ DTD の中で notation 宣言をしておくこと。)


  <formula notation=tex>
    \(E = mc^{2}\)
  </formula>

SGML 対応プロセッサの場合、 <formula> 要素の中ではほとんどの文字が使える。データはパーサによって整形されることなく、その記法に連関するアプリケーションに渡される。唯一の例外は、 SGML 終了タグの開始文字( < )にすぐ続けて斜線( / )とアルファベットが来るとそれをパーサが認識してしまうことである。次のような架空の例では、 SGML 構文エラーが出てしまう。


  <formula notation=tex>
    \(E = mc^{2}</a\)
  </formula>

さいわい、数学的記法には実際に </ の並びが現れることはほとんどない。現れた場合の対処法は本書の範囲外である( P3 ガイドラインを参照)。

これは、それ自身が SGML で書かれた技術文書で SGML マーク付けをする際に問題になる。そういう文書では、例文中のマーク付けと文書そのもののマーク付けとをはっきりと区別せざるをえず、終了タグの現れる確率も高いからだ。最も一般的な解決法は、 SGML の例文をパーサの解析対象外データとして区別することである。次の例のように、 CDATA マーク済みセクション (CDATA marked section) という特別の SGML 構造の中に入れてしまうのである。


  <p>A list should be encoded as follows:
  <eg><![ CDATA [
    <list>
    <item>First item in the list</item>
    <item>Second item</item>
    </list>
  ]]>
  </eg>
  The <gi>list</gi> element consists of a series of <gi>item</gi>
  elements.

この例では、 <list> 要素は、マーク済みセクション(特別なマークアップ宣言 <![ CDATA [ で始まり ]]> で終わる。)の中に埋め込まれているため、文書そのものの構成部分とは見なされない。
テキスト中の SGML 要素名(又は総称識別子 generic identifiers )を参照するタグ <gi> の使い方にも注意。


[SECTION TOP]

区分の生成

現代的文書生産システムのほとんどは、内容一覧や索引を自動生成することができる。 TEI Lite の枠組みには、そのようにして生成されたセクションを置く場所をマーク付けする要素がある。

<divGen> 要素
テキスト処理のアプリケーションによって自動的に生成されたテキスト区分の現れる位置。
type 属性
生成されたテキスト区分の型(例: 索引、一覧表等)。属性値の例: index(索引が生成され、ここに挿入される。),toc(目次・内容一覧),figlist(図のリスト),tablist(一覧表) 等。

<divGen> 要素は、区分要素の入りうるところならどこにでも置くこと ができる。次の例では、生成された区分の種類を分けるための type 属性の使い方をも示している。最初の例が目次で2番目が索引である。


  <front>
  <titlePage> ... </titlePage>
  <divGen type=toc>
  <div type='Preface'><head>Preface</head> ... </div>
  </front>
  <body> ... </body>
  <back>
  <div1><head>Appendix</head> ... </div1>
  <divGen type=index n='Index'>
  </back>

もしも既存の索引・目次を生成するのではなくマーク付けする場合には、「12 リスト」 で触れた <list> 要素を使うべきである。

/→後付/
[SECTION TOP]

索引の生成

正しくタグ付けられた文書から目次を生成することは何ら問題なく自動処理できるのが普通だが、良質の索引を作るにはより注意深いタグ付けが必要だ。特定のやり方でタグ付けられたすべての個所を単に索引項目とするだけでは不十分である。しかし、例えば <term> 要素や <name> 要素でマークした個所を残らず拾い上げるならば、かなり索引らしいものになってくる。

TEI DTD には、索引とする語句と索引作成の方法とを同時にマーク付けできる <index> という特別なタグがある。

<index> 要素
索引を作る場所を示す。
level1 属性
索引の第1項目
level2 属性
索引の第2項目(あれば。以下同じ。)
level3 属性
索引の第3項目
level4 属性
索引の第4項目
index 属性
項目が属する索引を示す。

例えば、この節の第2段落は次のようになる。

   ...
  TEI lite also provides a special purpose <gi>index</gi> tag
  <index level1='indexing'>
  <index level1='index (tag)' level2='use in index generation'>
  which may be used ...

<index> 要素は、解釈・分析のタグにもなる。例えば、オビディウスの比較文体論的な研究をするためには、人物ごとの詩人の言及すべてを記録することが求められるかもしれない。『メタモルフォーゼ』の中の以下の行では、ジュピター( deus 及び confiteor の主題として)や雄牛の形をしたジュピター( imago tauri fallacis 及び teneo の主題として)その他への言及を記録することになる。 この分析は近刊の Willard McCarty, Burton Wright: An Analytical Onomasuticon to the Metamorphoses of Ovid, Princeton University Press) より許可を得て抜粋したものだ。 索引では、ある種の単純化が施されている。


  <l n=3.001>iamque deus posita fallacis imagine tauri
  <l n=3.002>se confessus erat Dictaeaque rura tenebat

注釈の必要は、「7 注記」で論じた <note> 要素、あるいは「16 解釈・分析」で扱った <interp> 要素を使うことで対処できるかもしれない。ここでは、さらに <index> 要素を使うことによっても満たせることを明らかにしておこう。

このオブジェクトが複数の索引を生成するとしよう。1つは神の名( dn : names of deities )、2つ目は語源学的参照( on : onomastic references )、3つ目は代名詞的参照( pr : pronominal references )その他といったように。索引は、たとえばこんな風になるだろう。


  <l n=3.001>iamque deus posita fallacis imagine tauri
    <index index="dn" level1="Iuppiter" level2="deus">
    <index index="on" level1="Iuppiter (taurus)"
                      level2="imago tauri fallacis"></l>
  <l n=3.002>se confessus erat Dictaeaque rura tenebat
    <index index="pr"    level1="Iuppiter" level2="se">
    <index index="v"     level1="Iuppiter" level2="confiteor (v227)">
    <index index="mons"  level1="Dicte" level2="rura Dictaea">
    <index index="regio" level1="Creta" level2="rura Dictaea">
    <index index="v"     level1="Iuppiter (taurus)"
                         level2="teneo (v9)"></l>

これで見れば、個々の <index> 要素の中で level1 属性の値を見出し語にとることによって適切な索引が生成される。そして、 level2 属性のキーワードには主格の形で引用された単語が並ぶ。実際の参照は、 <index> 要素の出現する個所で索引にとられる。ここでいえば、 <index> を含む <l> 要素の識別子がそれである。


[TOP]

18 文字コード、発音(アクセント)記号、その他

ヨーロッパ諸言語を使用する者にとって、文字コードの使用に関する TEI 勧告は単純なものである。ローカルに使う限り、自分の機械なりソフトなりのサポートする文字コードを使えばよい。もし特殊文字を打つキーが不足したら、自己流にキーボードをカスタマイズすればよい(例えば、アクセント文字を表すために、適当なアクセントキーを文字キーの直後に打つ。あるいは、 aEä を表すというように、通常の文章には現れそうもない文字の組み合わせを使って打つ等)。こうして使った文字はあとで一括置換によって正しい文字に改めることができる。
もし非ラテン文字を使っていたり、自己の分野で標準音訳法がある場合などはそれを使えばよい。音訳は反訳が可能である。これは普通に筆記で使われる夥しい語法文法の類の埒外となる特色だ。そして、この方法はもし何の合字 (ligatures) ・結合辞 (ties) ・発音〔アクセント〕記号 (diacritics) もいらないのであれば、非常に有用なものになるだろう。

異なるシステム間でファイルを交換するには、電子的な交換に際してもほとんど変わることのない次の文字のほかは SGML の実体参照 (entitiy references) を使って置き換えればよい。


  a b c d e f g h i j k l m n o p q r s t u v w x y z
  A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
  0 1 2 3 4 5 6 7 8 9
  " % & ' ( ) * + , - . / : ; < = > ? _   (space)

このリストからは、次の文字を除いてある。これらの文字は、国境や標準を越えた広範なネットワークにおいては実によく文字化けを起こしてユーザを苛立たせるものなのだ。ちょっと手元の Mac から PC 機にデータを転送するくらいなら、まず大丈夫だ。


  ! # $ [ \ ] ^ ` { } | ~

企業間のネットワークで正常なデータ転送を確保するため、アクセント文字や拡張ラテン文字、非ラテン文字、従来のキーボードにないシンボル文字などはすべて実体参照を用いて表現しなければならない。

標準的な SGML 実体宣言を行えば、 TEI 準拠の文書ファイルに独自の SGML 実体名を使うことができる。しかし、標準的な名前は冗長でも明確さの点で優れているので、表そうとする文字は英語を話す者なら十分理解でき、何ら特別なリストを使わなくとも参照されている実体文字がわかるはずだ。この点は、他の文法でアクセント文字を表す場合には当てはまらない。

上に掲げた文字が「文字化けする」ために使う実体名、西欧の主要言語のアクセント文字用の実体名等を次のリストに挙げる。 SGML 関連の仕事では公開実体文字セットとその内容一覧を使う。後述の名前は、 ISO に定めた公開実体文字セットに基づいたもので、広く使われており推奨できるものだ。

必要な文字がこの中にない場合、これと同じく、 ISO 公開実体文字セットで採られているのと同じ命名法を使って文字実体を生成してよい。

digraphs
二重音字。その文字に文字列 lig (ligature) を付けて実体名を作る。大文字に続ければそれは大文字となる。(実体名では大文字・小文字を区別する。)例: aelig (æ) ,AElig (Æ) ,szlig (ß)。
diacritics and accents
アクセント記号・発音記号。西欧の言語では、次の文字列をアクセントをもつ文字に付けて実体名を表す。大文字または小文字。
umlaut
ウムラウト、トレマ。例:auml (ä) , Auml (Ä) , euml (ë) , iuml ( ï -ママ) , ouml (ö) , Ouml (Ö) , uuml (ü) , Uuml (Ü)。
acute
鋭(揚音)アクセント (´ ) 、強調アクセント。例: aacute (á) , eacute (é) , Eacute (É) , iacute ( í ) , oacute (ó) , uacute (ú) 。
grave
抑音アクセント(`)。例: agrave (à) , egrave (è) , igrave ( ì ) , ugrave (ù) 。
circumflex
曲折(変調)アクセント(^)。例: acirc (â) , ecirc (ê) , Ecirc (Ê) , icirc ( î ) , ocirc (ô) , ucirc (û) 。
tilde
チルダ(~)。例: atilde (ã) , Atilde (Ã) , ntilde (ñ) , Ntilde (Ñ) , otilde (õ) , Otilde (Õ) 。
consonants
子音。以下の例は、西欧言語に見られる特殊な子音に対する実体名である。セディーユ ccedil (ç) , Ccedil (Ç) , eth (ð) , ETH ( Ð ) , thorn (þ) , THORN (Þ) , エスツェット szlig (ß) 。
punctuation marks
句読点。例: ldquo (“) , rdquo (”) , lsquo (‘) , rsquo (’) , mdash (— 全角1文字分のダッシュ〔 one-em dash 〕) , hellip (…  省略符号〔 horizontal ellipsis 〕) 。(次項の「文字化け」する文字のリストも参照。)
「文字化け」する文字
以上の表現の中にも、現在のインターネットで「文字化け」するかもしれない文字があり、次の実体によって表現してもよい。 excl ( ! ) , num (#) , dollar ($) , lsqb ( [ ) , rsqb ( ] ) , bsol (\) , circ ( ˆ ) , lsquo ( ‘ ) , grave , lcub ( { ) , rcub ( } ), verbar ( / ) , tilde (~) 。
/→見出し/
[TOP]

19 前文・後付


 前文  (    前文  )   後付

[SECTION TOP]

前文

昔の本にはよく、扉・前置きとしての書簡などがあって、本文以外に言語・社会面の知識を提供していた。 TEI P3 ガイドラインには、前文に決まって現れるテキスト要素を区別する方法が出てくるが、ここにそれを手短にまとめる。

[SECTION TOP]
【扉】

書物の扉は、 <titlePage> 要素で示す。この中の文章を、以下からふさわしい要素でマーク付けする。

<titlePage> 要素
前文・後付の扉。
<docTitle> 要素
扉にある文書の題名。全体の内容を示すもの。さらに <titlePart> 要素に細分する。
<titlePart> 要素
扉にある文書の各章節。また、文書名・著作権(帰属)表示以外で特に場所が決まっていない文章にも適用できる。
type 属性
各章節の役割。属性の例: main (主題),sub (副題),desc (主題の言い換え〔descriptive paraphrase〕) ,alt (代わりの題〔alternative title〕)等。
<byline> 要素
扉または最後にある(代表)執筆者名。
<docAuthor> 要素
扉にある文書の著者名。 <byline> 要素に含まれるが、含まれないこともある。
<docDate> 要素
扉等にある文書の日付。
<docEdition> 要素
扉にある出版履歴。
<docImprint> 要素
扉下部等にある印刷の記述(出版地・印刷日付・発行元)。
<epigraph> 要素
題辞・銘句。章節の初め・扉等にある引用。(出典の記述あり・なし。)

活字の区別が必要な場合、前述のように rend 属性を用いる。ただし、装飾題の字間スペースや字のサイズなどあまり細かい点までは、まだガイドラインに定めていない。言語の種別は、 lang 属性または <foreign> 要素を適宜使う。名前は、ここでも <name> 要素を用いてタグ付けする。

扉をタグ付けした2つの例:


  <titlePage rend=Roman>
    <docTitle><titlePart type=main>
      PARADISE REGAIN'D. A POEM In IV <hi>BOOKS</hi>.
      </titlePart>
      <titlePart>
      To which is added <title>SAMSON AGONISTES</title>.
      </titlePart>
    </docTitle>
    <byLine>The Author <docAuthor>JOHN MILTON</docAuthor></byline>
    <docImprint><name>LONDON</name>,
      Printed by <name>J.M.</name>
      for <name>John Starkey</name>
      at the <name>Mitre</name>
      in <name>Fleetstreet</name>,
      near <name>Temple-Bar.</name>
    </docImprint>
    <docDate>MDCLXXI</docDate>
  </titlePage>

<titlePage> <docTitle><titlePart type=main> Lives of the Queens of England, from the Norman Conquest;</titlePart> <titlePart type='sub'>with anecdotes of their courts. </titlePart></docTitle> <titlePart>Now first published from Official Records and other authentic documents private as well as public.</titlePart> <docEdition>New edition, with corrections and additions</docEdition> <byline>By <docAuthor>Agnes Strickland</docAuthor></byline> <epigraph> <q>The treasures of antiquity laid up in old historic rolls, I opened.</q> <bibl>BEAUMONT</bibl> </epigraph> <docImprint>Philadelphia: Blanchard and Lea</docImprint> <docDate>1860.</docDate> </titlePage>

[SECTION TOP]
【前文】

前文の主なテキスト・ブロックは、 <div> 要素や <div1> でマーク付けする。次に挙げるのは、 type 属性の値だが、これによって前文に共通したさまざまなタイプを区別することができる。

foreword
序文。書簡の形式などで著者・編者・出版者が読者に宛てて書いた文章。
preface
(同上)
dedication
献辞。読者以外の特定人物に向けた(手紙形式等の)文章。著者がその作品を推薦するというものが多い。
abstract
抜粋。作品の内容を要約した文章。
ack (acknowledgements)
挨拶・謝辞。
contents
目次。たいがい <list> 要素でタグ付けする。
frontispiece
口絵。説明等も含める。

他のテキスト部分と同じく、前文ではこれらは構造的な要素は無いか、あってもその役割は小さい。普通、 head 要素で括られるある種の見出し・題名で始まる。書簡の場合は、次の付加要素を含む。

<salute> 要素
挨拶・頭語(結語)。緒言・献辞等の前、あるいは書簡・序等の結びに置かれる。
<signed> 要素
署名。緒言・献辞等の結びの挨拶。
<byline> 要素
扉、序跋にある筆者(作者)名の記載。
<dateline> 要素
書簡・新聞連載などの初め(終わり)に(見出し・次回予告のような意味あいで)置く作成日時・場所その他の記述。
<argument> 要素
梗概・要旨。その一節で述べている論題の箇条書き・要約。
<cit> 要素
他の文書からの引用。出典の書誌解題を含む。
<opener> 要素
頭書。書簡などの初めに置く、上記 da