TEI Lite 抄録 (1998.8)
[INDEX] [HOME]

index

TEI Lite( TEI U5 ) のメモ

【 訳 < メモ 】
(1998.8.)


  1 はじめに		  12 リスト
  2 簡単な例		  13 書誌的引用
  3 テキストの構造		  14 テーブル(表)
  4 本文のマークアップ	  15 図と絵
  5 ページ番号・行番号	  16 解釈・分析
  6 語句の強調		  17 技術文書
  7 注記			  18 文字コード、他
  8 相互参照とリンク	  19 前文・後付
  9 編集のための処置	  20 TEI ヘッダ
  10 省略・削除・付加	  21 要素リスト
  11 名前・日付・数値・略語	  22 リファレンス


TEI Lite(TEI U 5)

L. バーナード、C.M.S. マックウィーン
1995.6
http://www.uic.edu/orgs/tei/intros/teiu5.tei
http://www.uic.edu/orgs/tei/intros/teiu5.split.html
■ TEI の簡単な入門用サブセット。

【参照】

  • TEI (TEI document P3, Guidelines for Electronic Text Encoding and Interchange, published in Chicago and Oxford in May 1994)
    http://www-tei.uic.edu/orgs/tei/intros/teiu5.tei
    ftp://info.ox.ac.uk/pub/ota/TEI/doc/teiu5.tei
    http://www-tei.uic.edu/orgs/tei/intros/teiu5.html
    http://info.ox.ac.uk/~archive/teilite/teiu5.html
  • DTD (teilite.dtd
    http://www-tei.uic.edu/orgs/tei/p3/dtd/teilite.dtd
    ftp://ftp-tei.uic.edu/pub/tei/lite/teilite.dtd
    ftp://info.ox.ac.uk/pub/ota/TEI/dtd/teilite.dtd


[TOP]

1 はじめに

TEI ガイドライン( TEI P3、1994.5)は、以下のような特徴を備えている。
  • 多様な文章に共通する根本的特徴を共有する。
  • 必要に応じて専門的な特徴を容易に付加(除去)できる。
  • 一つの特徴に対して同時に多様なマークアップが可能である。
  • ユーザー定義によるマークアップが可能である。
  • テキストとマークアップについて適切な解説が行われる。
TEI Lite の目的は、以下のようなものである。
  • TEI の核となるタグセットをほぼ網羅する。
  • 多様な文書に適切に対応できる。(the Oxford Text Archive の例)
  • 既存の文書の処理だけでなく、文書作成にも使える。
  • 広範な SGML 対応ソフトウェアを利用できる。
  • TEI の拡張機構により、 TEI DTD を応用したもの(完全な互換性)。
  • なおかつ軽量・簡便であること。

The Oxford Text Archive は独自マークアップから SGML に変換するのに TEI Lite を使っている。ヴァージニア州立大学・ミシガン州立大学の電子テキストセンターも文書のマークアップを TEI Lite で行っている。 TEI (the Text Encoding Initiative)自身も本書を含む技術文書を TEI Lite に従って作成している。


[TOP]

2 簡単な例

原文の体裁に忠実であることだけを目指したマークアップの例。-(1)原文、(2)そのマーク付け。


  (1)
                           CHAPTER 38
                             
  READER, I married him. A quiet wedding we had: he and I, the par-
  son and clerk, were alone present. When we got back from church, I
  went into the kitchen of the manor-house, where Mary was cooking
  the dinner, and John cleaning the knives, and I said --
    'Mary, I have been married to Mr Rochester this morning.' The
  housekeeper and her husband were of that decent, phlegmatic
  order of people, to whom one may at any time safely communicate a
  remarkable piece of news without incurring the danger of having
  one's ears pierced by some shrill ejaculation and subsequently stunned
  by a torrent of wordy wonderment. Mary did look up, and she did
  stare at me; the ladle with which she was basting a pair of chickens
  roasting at the fire, did for some three minutes hang suspended in air,
  and for the same space of time John's knives also had rest from the
  polishing process; but Mary, bending again over the roast, said only --
     'Have you, miss? Well, for sure!'
     A short time after she pursued, 'I seed you go out with the master,
  but I didn't know you were gone to church to be wed'; and she
  basted away. John, when I turned to him, was grinning from ear to
  ear.
     'I telled Mary how it would be,' he said: 'I knew what Mr Ed-
  ward' (John was an old servant, and had known his master when he
  was the cadet of the house, therefore he often gave him his Christian
  name) -- 'I knew what Mr Edward would do; and I was certain he
  would not wait long either: and he's done right, for aught I know. I
  wish you joy, miss!' and he politely pulled his forelock.
     'Thank you, John. Mr Rochester told me to give you and Marythis.'
     I put into his hand a five-pound note.  Without waiting to hear
  more, I left the kitchen. In passing the door of that sanctum some time
  after, I caught the words --
     'She'll happen do better for him nor ony o' t' grand ladies.' And
  again, 'If she ben't one o' th' handsomest, she's noan faa\l, and varry
  good-natured; and i' his een she's fair beautiful, onybody may seethat.'
     I wrote to Moor House and to Cambridge immediately, to say what
  I had done: fully explaining also why I had thus acted. Diana and

                              474

                   JANE EYRE                      475

  Mary approved the step unreservedly. Diana announced that she
  would just give me time to get over the honeymoon, and then she
  would come and see me.
     'She had better not wait till then, Jane,' said Mr Rochester, when I
  read her letter to him; 'if she does, she will be too late, for our honey-
  moon will shine our life long: its beams will only fade over your
  grave or mine.'
     How St John received the news I don't know: he never answered
  the letter in which I communicated it: yet six months after he wrote
  to me, without, however, mentioning Mr Rochester's name or allud-
  ing to my marriage. His letter was then calm, and though very serious,
  kind. He has maintained a regular, though not very frequent correspond-
  ence ever since: he hopes I am happy, and trusts I am not of those who
  live without God in the world, and only mind earthly things.
  
  
(2) <pb n='474'> <div1 type=chapter n='38'> <p>Reader, I married him. A quiet wedding we had: he and I, the parson and clerk, were alone present. When we got back from church, I went into the kitchen of the manor-house, where Mary was cooking the dinner, and John cleaning the knives, and I said &dash; <p><q>Mary, I have been married to Mr Rochester this morning.</q> The housekeeper and her husband were of that decent, phlegmatic order of people, to whom one may at any time safely communicate a remarkable piece of news without incurring the danger of having one's ears pierced by some shrill ejaculation and subsequently stunned by a torrent of wordy wonderment. Mary did look up, and she did stare at me; the ladle with which she was basting a pair of chickens roasting at the fire, did for some three minutes hang suspended in air, and for the same space of time John's knives also had rest from the polishing process; but Mary, bending again over the roast, said only &dash; <p><q>Have you, miss? Well, for sure!</q> <p>A short time after she pursued, <q>I seed you go out with the master, but I didn't know you were gone to church to be wed</q>; and she basted away. John, when I turned to him, was grinning from ear to ear. <q>I telled Mary how it would be,</q> he said: <q>I knew what Mr Edward</q> (John was an old servant, and had known his master when he was the cadet of the house, therefore he often gave him his Christian name) &dash; <q>I knew what Mr Edward would do; and I was certain he would not wait long either: and he's done right, for aught I know. I wish you joy, miss!</q> and he politely pulled his forelock. <p><q>Thank you, John. Mr Rochester told me to give you and Mary this.</q> <p>I put into his hand a five-pound note. Without waiting to hear more, I left the kitchen. In passing the door of that sanctum some time after, I caught the words &dash; <p><q>She'll happen do better for him nor ony o' t' grand ladies.</q> And again, <q>If she ben't one o' th' handsomest, she's noan fa&agrave;l, and varry good-natured; and i' his een she's fair beautiful, onybody may see that.</q> <p>I wrote to Moor House and to Cambridge immediately, to say what I had done: fully explaining also why I had thus acted. Diana and <pb n='475'> Mary approved the step unreservedly. Diana announced that she would just give me time to get over the honeymoon, and then she would come and see me. <p><q>She had better not wait till then, Jane,</q> said Mr Rochester, when I read her letter to him; <q>if she does, she will be too late, for our honeymoon will shine our life long: its beams will only fade over your grave or mine.</q> <p>How St John received the news I don't know: he never answered the letter in which I communicated it: yet six months after he wrote to me, without, however, mentioning Mr Rochester's name or alluding to my marriage. His letter was then calm, and though very serious, kind. He has maintained a regular, though not very frequent correspondence ever since: he hopes I am happy, and trusts I am not of those who live without God in the world, and only mind earthly things.

この写しには、いくつか欠点がある。

  • テキスト本文とページ、ヘッダなどの区別がない。
  • アポストロフと引用符の区別がない。
  • ハイフネーションの無意味な保存。
  • アクセント文字やダッシュをその時々のやり方で処理してしまう。
  • 段落の区分が空白文字で行われ、各行末に改行文字があるため、フォーマットの変更が利かない。

TEI 方式を使うことによって、次のような区別がはっきりする。

  • 段落の区分。
  • アポストロフと引用符の区別。
  • アクセントやダッシュにはエンティティ参照を使うので常に一定である。
  • ページの区分は空要素だけで示し、レイアウトに影響しない。
      -<pb>(page break)
  • 原文の改行位置やハイフネーションは、特別な場合のみマークする。
      -復刻などの場合。
  • 段落はじめは改行するが、インデントは行わない。

TEI 方式では、次のようなマークアップも可能である。

  • 方言の注解を付与
  • 脚注の付加
  • リンクのためのポインタの付加
  • 正式名称の識別
  • 書誌的事項の導入
  • 文法的分析(分類コード)の付与
  • 地の文と会話の区分
  • テキストの分析・解釈のタグ付け
  • 画像・音声等とのリンク

他にも、大きな可能性がある。その一例。( TEI P3 を参照。)

  • 語彙集
  • 作品事典
  • 書誌的情報


[TOP]

3 テキストの構造

TEI 準拠のテキストには TEI header (<teiHeader>...</teiHeader>) を付ける。ヘッダは、①ファイル情報、②マークアップ情報、③文書情報、④更新履歴から成る。(「20」を参照。)

テキストは単独の作品の場合もあり、詞華集のように複数の作品から成る場合もある。

単独の作品の構造は、次の形にまとめられるだろう。


  <TEI.2>
      <teiHeader> [ TEI Header information ]  </teiHeader>
      <text>
          <front> [ front matter ... ]   </front>
          <body>  [ body of text ... ]   </body>
          <back>  [ back matter ...  ]   </back>
      </text>
  </TEI.2>

複合テキストの本文は、グループに分かれ、それぞれに前部・後付けを備える。


  <TEI.2>
    <teiHeader>   [ header information for the composite ] </teiHeader>
    <text>
      <front>     [ front matter for the composite  ]      </front>
      <group>
        <text>
          <front> [ front matter of first text ]   </front>
          <body>  [ body of first text  ]          </body>
          <back>  [ back matter of first text ]    </back>
        </text>
        <text>
          <front> [ front matter of second text]   </front>
          <body>  [ body of second text  ]         </body>
          <back>  [ back matter of second text ]   </back>
        </text>
                  [ more texts or groups of texts here ]
      </group>
      <back>      [ back matter for the composite  ]      </back>
    </text>
  </TEI.2>

個々のテキストにヘッダをつけ、定義を別にすることもできる。( TEI コーパス)ただし、コーパスの複合体を1つのオブジェクトとして扱うことは、現在の TEI ではできない。


  <teiCorpus>
    <teiHeader>  [header information for the corpus]</teiHeader>
    <TEI.2>
      <teiHeader>[header information for first text]</teiHeader>
      <text>     [first text in corpus]             </text>
    </TEI.2>
    <TEI.2>
      <teiHeader>[header information for second text]</teiHeader>
      <text>     [second text in corpus]             </text>
    </TEI.2>
  </teiCorpus>
以下の章では、単純な文章を主に取りあげて、必要な要素と属性に触れていく。

[TOP]

4 本文のマークアップ


 テキスト区分要素  見出しと終わり見出し  散文・韻文・戯曲

TEI 文書の要素

<front>
前置き(ヘッダ、タイトル・ページ、序文、献辞、他)
<group>
単独の作品のグループ(入れ子にもできる。)
<body>
作品本文
<back>
後書き(付録)

前部・後付けの要素については、「19」を参照。



[SECTION TOP]

テキスト区分要素

テキストは個々の段落(<p>)、又は章節項などの区分に分ける。(①すべて<div>、又は②段階に応じて<div1>から<div7>までの区分を作る。それ以上の区分がある場合は①によって初めからただの<div>をネストさせればよい。)

<p>/<divX>の属性: id や n は、どの要素にも使える共通属性である。

type
Book, Chapter, Poem 等。属性は下位の区分に継承される。
id
唯一性をもつ識別値。相互参照(Cross References) やリンク(「」を参照。)に利用できる。
n
短い名前や数字を書き入れる。

id によって文書の階層構造を反映する例。(アダム・スミスの国富論 Wealth of Nations の章節項を示す。)


  <div1 id=WN1 n='I' type='book'>
    <div2 id=WN101 n='I.1' type='chapter'>... </div2>
    <div2 id=WN102 n='I.2' type='chapter'>... </div2>
     ...
    <div2 id=WN110 n='I.10' type='chapter'>
      <div3 id=WN1101 n='I.10.1' type=part>... </div3>
      <div3 id=WN1102 n='I.10.2' type=part>... </div3>
    </div2>
     ...
  </div1>
  <div1 id=WN2 n='II' type='book'>
   ....
  </div1>
   ...

複数の書物で章が通し番号で振られている場合のタグ付け例。(章番号は n 属性で表し、 id 属性によって第何巻第何章であるかを示す。)


  <div1 id=TS01 n='1' type='Volume'>
    <div2 id=TS011 n='1' type='Chapter'>
     ...
    <div2 id=TS012 n='2'>
     ...
  </div1>
  <div1 id=TS02 n='2' type='Volume'>
    <div2 id=TS021 n='3'type='Chapter'>
     ...
    <div2 id=TS022 n='4'>
     ...
  </div1>

[SECTION TOP]

見出しと終わり見出し

タグの詳細は、「19」を参照。

<head>
見出し(節の小題、リストや用語集の題名等)
<trailer>
終わり見出し(それに類するフッタなど)

見出しが要素や属性で表せれば、これらのタグは必要ない。他の方法では再現できない場合などに活用する。(トマス・ハーディの Under the Greenwood Tree の冒頭の例。)


  <div1 id=UGT1 n='Winter' type='Part'>
  <div2 id=UGT11 n='1' type='Chapter'>
  <head>Mellstock-Lane</head>
  <p>To dwellers in a wood almost every species of tree ...

[SECTION TOP]

散文・韻文・戯曲

特に韻文や戯曲・脚本等に用いるタグ。

<l>
韻文の1行。
part 属性
Y 韻律面で不完全な行。 N 完全な行。 I(initial) 初めの部分の断片。 M(medial) 中間の部分。 F(final) 終わりの部分。
<lg>
韻文のまとまり(スタンザ、リフレイン、連、他)。
<sp>
人物の会話であることを示す。(脚本・散文・韻文中)
who 属性
ID をつけ、人物を識別・特定する。
<speaker>
脚本や断片の話し手(単数・複数)の名を記したラベル。
<stage>
ト書き用のタグ。舞台指示を行う。
type 属性
entrance, exit, setting, delivery 等。指示の種類を示す。

タグ付けの実例。もし体裁上の行を保持するなら、 <lb> 要素を使う。(「」を参照。)


  <lg n=I>
  <l>I Sing the progresse of a 
    deathlesse soule,</l>
  <l>Whom Fate, with God made,
    but doth not controule,</l>
  <l>Plac'd in most shapes; all times
    before the law</l>
  <l>Yoak'd us, and when, and since,
    in this I sing.</l>
  <l>And the great world to his aged evening;</l>
  <l>From infant morne, through manly noone I draw.</l>
  <l>What the gold Chaldee, of silver Persian saw,</l>
  <l>Greeke brass, or Roman iron, is in this one;</l>
  <l>A worke t'out weare Seths pillars, bricke and stone,</l>
  <l>And (holy writs excepted) made to yeeld to none,</l>
  </lg>

戯曲などで有韻文が話し手により分けて語られる場合、 part 属性でそれが断片であることを明示するのが簡単である。1つのスタンザを2人で分けて歌う場合などにも応用できる。


  <div1 type ='Act' n='I'><head>ACT I</head>
  <div2 type ='Scene' n='1'><head>SCENE I</head>
  <stage rend=italic>
  Enter Barnardo and Francisco, two Sentinels, at several doors</stage>
  <sp><speaker>Barn<l part=Y>Who's there?
  <sp><speaker>Fran<l>Nay, answer me. Stand and unfold yourself.
  <sp><speaker>Barn<l part=i>Long live the King!
  <sp><speaker>Fran<l part=m>Barnardo?
  <sp><speaker>Barn<l part=f>He.
  <sp><speaker>Fran<l>You come most carefully upon your hour.

rend 属性については、「」を参照。


  <sp><speaker>First voice</speaker>
  <lg type=stanza part=I>
  <l>But why drives on that ship so fast
  <l>Withouten wave or wind?
  </lg>
  <sp><speaker>Second Voice</speaker>
  <lg part=F>
  <l>The air is cut away before.
  <l>And closes from behind.
  </lg>

散文の会話でも、マークアップ方法は同様である。 who 属性で会話の主を特定することができる。


  <sp who=OPI><speaker>The reverend Doctor Opimiam</speaker>
  <p>I do not think I have named a single unpresentable fish.
  <sp who=GRM><speaker>Mr Gryll</speaker>
  <p>Bream, Doctor: there is not much to be said for bream.
  <sp who=OPI><speaker>The Reverend Doctor Opimiam</speaker>
  <p>On the contrary, sir, I think there is much to be said for him.
  In the first place....
  <p>Fish, Miss Gryll -- I could discourse to you on fish by
  the hour: but for the present I will forbear...
  </sp>

[TOP]

5 ページ番号・行番号

改ページと改行は、次の空要素で示す。

<pb>(page break)
改ページ
<lb>(line break)
改行(行の開始を示す。)

ともに n 属性を使えるほか、 ed 属性によって版数(刷数)を示すことができる。(版によるページ区切りの相違を示す。)なお、行末のハイフネーションの扱いは一考を要する。


  <p>I wrote to Moor House and to Cambridge immediately, to
  say what I had done: fully explaining also why I had thus
  acted.  Diana and <pb ed=ED1 n='475'> Mary approved the
  step unreservedly.  Diana announced that she would
  <pb ed=ED2 n='485'>just give me time to get over the
  honeymoon, and then she would come and see me.

これらの要素は、テキスト内の参照位置を示す <milestone> 要素の特別なケースである。こちらは、列やセクションの開始などを示し、前記 ed 属性のほか、 unit 属性(セクションの種類を示す)を使える。版やセクションの種類を TEI ヘッダに明記しておくこと。また、 <pb> 、 <lb> と <milestone> とは勝手に混用すべきでない。


[TOP]

6 語句の強調


 フォントの変更  引用など  外国語の表現

[SECTION TOP]

フォントの変更

強調語句はフォントやグリフ、色等の変更によって読者の注意を喚起する。

/→活字/

共通属性 rend (rendition) によって強調の仕方を示す。( rend='Bold'、 rend='Italic' 等) <hi> (hilight) は、それ自体では強調の種類を特定しない。


  <hi rend=gothic>And this Indenture further witnesseth</hi>
  that the said <hi rend=italic>Walter Shandy</hi>, merchant,
  in consideration of the said intended marriage ...
/→書誌/

強調の理由を明示できる場合、以下のような要素を使える。

<emph>
文法的、修辞的な効果のための強調。
<foreign>
外国語(本文と異なる言語)
<mentioned>
言及語句
<term>
専門用語
<title>
標題(作品・記事・書物・雑誌・叢書等)
lebel 属性
タイトルのレベルを示す。 m (monograph) 単行書・分冊、 s (series) 叢書、 j (journal) 新聞・雑誌、 u (unpublished material) 論文や抜き刷り、 a (article) 1個の記事・詩など
type 属性
類別。値の例: abbreviated, main, subordinate (副題や小見出し等), parallel (別題、外国語による別名等)。

引用や割り注のタグ( <q> 、 <gloss> )にも、必要なら rend 属性を付ける。

 (1)
 On the one hand the Nibelungenlied is associated with the new
 rise of romance of twelfth-century France, the romans
 d'antiquité
, the romances of Chrétien de Troyes, and the German
 adaptations of these works by Heinrich van Veldeke, Hartmann von Aue,
 and Wolfram von Eschenbach.

 (2)
 On the one hand the <title>Nibelungenlied</title> is associated
 with the new rise of romance of twelfth-century France, the
 <foreign>romans d'antiquit&eacute;</foreign>, the romances of
 Chr&eacute;tien de Troyes, ...

 (3)
 On the one hand the <hi rend=italic>Nibelungenlied</hi>
 is associated with the new rise of romance of twelfth-century
 France, the <hi rend=italic>romans d'antiquit&eacute;</hi>,
 the romances of Chr&eacute;tien de Troyes, ...

(1)の文章の強調個所を解釈すれば、(2)のようなタグ付けになる。また、外見だけを叙述すれば、(3)のようなタグ付けになるだろう。


[SECTION TOP]

引用など

引用符の性質を、できれば以下のように明示することを勧める。

<q>
会話・思考内容の表現。辞書では、実例・用例に使う。
type 属性
会話( spoken )・心話( thought :独白等)の区別。
who 属性
会話主を示す。
<mentioned>
言及個所
<soCalled>
いわゆる。責任回避の引用。
<gloss>
割り注・語注
target 属性
関連語句を示す。

引用の実例。


  Few dictionary makers are likely to forget Dr. Johnson's description
  of the lexicographer as <q>a harmless drudge.</q>

引用の形式(インライン、強調、ブロック引用等)を rend 属性で示すべきである。引用符の種類を表すにもこの属性を使える。

語り手の表白は、前後を引用で区切ることで示すことができる。


  <p><q>Who-e debel you?</q> &mdash; he at last said &mdash;<q>you
  no speak-e, damme, I kill-e.</q>  And so saying, the lighted
  tomahawk began flourishing about me in the dark.

もし2つの引用を1つの会話としてつなぐことが意味をもつ場合には、リンク属性の nextprev が使える。(「」を参照。)

引用部分の典拠や話者を示すには、 who 属性を使う。


  <q who=Wilson>Spaulding, he came down into the office just this
  day eight weeks with this very paper in his hand, and he
  says:&mdash;<q who=Spaulding>I wish to the Lord, Mr. Wilson, that
  I was a red-headed man.</q></q>

電子テキストの作成者は、引用符を残すか、タグで置き換えるかを決めなければならない。引用符を取り去る場合、 rend 属性によって原文の体裁を記録することができる。

また、強調の場合と同じく、強いて解釈するのでなく、単に <hi rend=quoted> で片づけるほうがよい場合もある。


[SECTION TOP]

外国語の表現

共通属性 lang をタグに付加する。適切な該当要素がない場合、 <foreign> 要素に lang 属性を加えてタグ付けする。


  Have you read <title lang=deu>Die Dreigroschenoper</title>?
 
  The court issued a writ of <term lang=lat>mandamus</term>.

  John has real <foreign lang=fra>savoir-faire</foreign>.
 
  <mentioned lang=fra>Savoir-faire</mentioned> is French for know-how.
/→索引/
[TOP]

7 注記

脚注・後注・欄外注その他、場所にかかわらず、メモや注釈には同じ <note> 要素を使う。

type 属性
注記の型を示す。
resp 属性
注釈者を示す。値の例:authoreditor 等、又は注釈者のイニシャルなど。
place 属性
注記の出現位置。inlineinterlinear(行間)、left(左マージン等)、rightfootend 等。
target 属性
注記をつける位置(句の初めなど)を示す。
targetEnd 属性
注記の及ぶ範囲の最後を示す。
anchored 属性
複製本が注記の参照個所を正確に示しているかどうかを明示。

注記番号または識別値が必要な場合、 n 属性を使う。また、注釈が原注であるか、校訂・編集の注であるかを resp で明示するか、どの種類の注であるかを TEI ヘッダで述べること。


  Collections are ensembles of distinct entities or objects of any sort.
  <note place=foot n=1>We explain below why we use the uncommon term
  <mentioned>collection</mentioned>instead of the expected
  <mentioned>set</mentioned>.
  Our usage corresponds to the <mentioned>aggregate</mentioned>
  of many mathematical writings and to the sense of
  <mentioned>class</mentioned> foundin older logical writings.</note>
  The elements ...

  <lg id=RAM609><note place=margin>The curse is finally expiated</note>
  <l>And now this spell was snapt: once more</l>
  <l>I viewed the ocean green,</l>
  <l>And looked far forth, yet little saw</l>
  <l>Of what had else been seen ‐</l>

[TOP]

8 相互参照とリンク


 ①同一の SGML 文書内での単純な相互参照
 ②拡張ポインタ  ③見えない形でのリンクを作る属性

[SECTION TOP]

①同一の SGML 文書内での単純な相互参照

<ref>
参照タグ。
<ptr> (pointer)
ポインタ。

<ptr> がポインタを作るだけの空要素であるのに対して、 <ref> は相互参照そのものを含むテキストをも含む。また、 <ptr> がシンボルやアイコン、ボタンといった言葉以外のものによるリンクを作るが、それは言葉によってリンクを作る文書生産システムでも役に立つ。

どちらにも共通して、以下の属性が使われる。

target 属性
ポインタの標的を示す。
type 属性
ポインタの類別を示す。
targType 属性
ポインタの指し示す要素のタイプを明示。
crDate 属性
ポインタの作成日時。
resp 属性
ポインタの作成者。

  See especially <ref target=SEC12>section 12 on page 34</ref>.
   
  See especially <ptr target=SEC12>.

target 属性の値は、その文書の SGML ID (を施した一節や句)である。次の例では、 <div1> 要素を参照している。

   ...
  see especially <ptr target=SEC12>.
   ...
  <div1 id=SEC12><head>Concerning Identifiers...
   ...

id 属性は一般的なので、例えばパラグラフなどにも施すことができる。

   ...
  this is discussed in <ref target=pspec>the paragraph on links</ref>
   ...
  <p id=pspec>Links may be made to any kind of element
   ...

targType 属性は、指し示される要素が特定のものであることを示す。この型が合わないと、参照は失敗する。 SGML パーサだけではこの適合性のチェックはできない。

   ...
  this is discussed in <ref target=dspec targType='div1 div2'>
  the section on links</ref>

type 属性によってリンクを分類することができる。 resp 属性と crDate 属性も併せて使った例:

   ...
  this is discussed in
  <ref type=xref resp=auto crdate=950521 target=dspec targtype='div1 div2'>
  the section on links</ref>
/→8-③/
/→<s>/

単にリンクポイントを作るだけならば、 <anchor> 要素を置くだけでよい。ある語句をターゲットにするなら、 <seg> 要素を置けばよい。 type 属性を加えることで目的別に分類することができる。


   .... <anchor type=bookmark id='ABCD'> ....
   .... <seg type=target id='EFGH'> ... </seg> ...

[SECTION TOP]

②拡張ポインタ

外部文書への参照をする場合には、 <xptr><xref> を使う。上記属性の他、 target 属性に代わって以下の属性を使う。

doc 属性
リンク先の文書名。(デフォルトはカレント文書。)
from 属性
TEI 拡張ポインタ構文に則ってリンク開始点を示す。(デフォルトは doc 属性で示された文書の全体。)
to 属性
TEI 拡張ポインタ構文に則ってリンク帰着点を示す。( from 属性が示されてはじめて明示される。)

TEI 拡張ポインタのターゲットを表現する方法の詳細は、 TEI P3 ガイドラインを参照。

<xptr>(又は <xref>)は、 doc 属性にエンティティ名を補うだけで、他の文書全体を指すことができる。このためには、エンティティ名を litemods.ent 拡張ファイルに、又は使用している SGML オーサリング・ソフトに固有の方法で宣言しておかなくてはならない。(「15」を参照。)


  see <xref doc=P3>The TEI Guidelines, passim</xref>

from 属性は、doc 属性で示された文書の中のある位置を示す。 TEI 拡張ポインタ構文に従って記述するが、かいつまんでいえば、指示位置は steps の並びで示され、各々の step は直前の step で示した位置からの相対的な位置を記述する。例えば、第2章の第2段落の3番目の文を指示するには、初めに第2章、次に第2段落、最後に第3文を指示するという具合である。書き方は SGML の考え方( parentdescendantpreceding 等。※下図参照。)によるか、あるいはもっと大まかに、テキストの型や字句の位置などでもよい。 SGML 記法でなくとも、同等のシステムで画像中の位置を指示することなどもできる。

from 属性と to 属性は、同じ記法を使う。拡張ポインタは、 from で示される場所の最初から、 to で示される場所の終わりまでの部分を指示するのである。

はじめに、ターゲットとなる文書中のある要素の ID を示す。


  <xptr doc=P3 from='id (SA)'>

これで P3 エンティティ中の SA 識別子で表される要素の全体を選ばれる。次のキーワードを使って、相互の関係によって他の要素を選ぶことができる。

 TEI のツリー構造として仮に考えてみたもの
child
子要素(この要素〔SA〕に含まれる要素)
ancestor
祖先要素(この要素を直接、間接に含む要素)
previous
兄要素(親要素が同じで、先行するもの)
next
弟要素(親要素が同じで、後続するもの)
preceding
親要素を含め、この要素に先行するもの
following
親要素を含め、この要素に後続するもの

それぞれに、例えば children (子要素の集合)、 ancestors (上位要素の集合)、 siblings (兄弟要素の集合)などが含まれる。明示のために次のものをカッコでくくったリストを続けてもよい。

  • 正負の数によって指示範囲を限定する。( +1 は現在位置から始めて最初に見つかった要素を示す。 -1 は最後に見つかった要素を示す。)又は、 all は見つかった要素すべてを示す。
  • 総称識別子によって要素の型を示す。又は、星印(アスタリスク)によって任意の要素を示す。
  • 属性名と値によって該当の要素を特定する。

上例の SA 識別子を持つ要素に含まれる第3段落を選択したもの。


  <xptr doc=P3 from='id (SA) child (3 p)'>

同様に、 P3 エンティティが TEI ガイドラインを参照しているとすれば、次は拡張ポインタ構文が規定されている同書の 14.2.2 節を選択している。


  For full details, see<ref doc=P3 from='id (SA) child (2 div2) child
   (2 div3)'>
  TEI Extended pointer syntax definition
  </ref>

次の例では、 from 属性と to 属性を使うことにより、文書の構造によらず、該当するすべての文書要素をターゲットとしている。(もちろん、 ABC の終わりが XYZ の始まりより先であったらエラーである。)


  <xptr doc=P1 from='id (xyz)' to='id (abc)'>

この構文を使うことで、非常に複雑な記述が簡単にできる。次は、 lang 属性の値が LAT であり、最も SA の始まりに近い先行要素 <head> を選択したものである。


  <xptr doc=P3 from='id (SA) preceding (1 head lang lat)'>

もし doc 属性に何の値もなければ、現在の文書が対象となる。次の(1)、(2)は同じ意味を表す。


  (1) <ptr target=X1>
  (2) <xptr from='id (X1)'>
/→解釈/
[SECTION TOP]

③見えない形でのリンクを作る属性

以下のリンク属性は TEI Lite DTD の共通属性で、特別な目的に使う。

ana (analysis) 属性
解釈とのリンク
corresp (corresponding) 属性
相当要素(単数・複数)とのリンク
next 属性
総体の中で次の要素にリンク
prev 属性
総体の中で前の要素にリンク

ana 属性は、抽象的分析・解釈を記した部分を指示する。(「16」を参照。)
例えば、 "John loves Nancy." という文の文法的解析をタグ付けする。それぞれ、SVONP1VV1 という id をもった説明文が同じ文書のどこかにあるわけである。なお、 type 属性を伴った seg 要素の使い方に注意。

/→解釈/
/→文法/

  <seg type=sentence ana=SVO>
    <seg type=lex ana=NP1>John</seg>
    <seg type=lex ana=VVI>loves</seg>
    <seg type=lex ana=NP1>Nancy</seg>
  </seg>

corresp 属性は、テキスト中の2つの要素が共通することを表す。多言語テキストで原語と翻訳語を結びつける例。


  <seg lang=FRA id=FR1 corresp=EN1>Jean aime Nancy</seg>
  <seg lang=ENG id=EN1 corresp=FR1>John loves Nancy</seg>

この機構は、例えばある語の前方照応関係を表すのにも応用できる。


  <p><title id=shirley>Shirley</title>, which made
  its Friday night debut only a month ago, was
  not listed on <name id=nbc>NBC</name>'s new schedule,
  although <seg id=network corresp=nbc>the network</seg>
  says <seg id=show corresp=shirley>the show</seg>
  still is being considered.

next 属性と prev 属性は、不連続の要素を互いにつなぐのに使う。


  <q id=Q1a next=Q1b>Who-e debel you?</q>
  &mdash; he at last said &mdash;
  <q id=Q1b prev=Q1a>you no speak-e,
  damme, I kill-e.</q>  And so saying,
  the lighted tomahawk began flourishing
  about me in the dark.

[TOP]

9 編集のための処置

次章にかけて、原文の体裁を保持し、かつ編集上の処置をも盛り込むための方法を述べる。

編集者(校訂者)が原文を「訂正」(correction) するための要素。

<corr>
原文の誤りと思われる個所の訂正。
sic 属性
誤りと思われる個所を記す。
resp 属性
訂正を行った編集・校訂者の記載。
cert (certainty)
訂正による原文の信頼度。
<sic>
ママ(誤記・誤植の保持)
corr 属性
訂正候補の記載。
resp 属性
訂正を行った編集・校訂者の記載。
cert 属性
訂正による原文の信頼度。

以下の要素は、「改正」(normalization) のための要素である。文脈の一貫性・今日的整合性などを目的とした変更である。

<orig> (original) 要素
原文の読み方
reg (regularized) 属性
訂正した読み方
resp 属性
校訂者の id
<reg> 要素
訂正した読み方
orig 属性
原文の読み方
resp 属性
校訂者の id

例えば、(1)の文は Gifford によって語句とスペルの誤りを指摘されている。(① tablebabbled の誤り、② a'he の、 feeldsfields の誤記)彼の推測をマーク付けで表したのが(2)である。


  (1) ... for his nose was as sharp as a pen and a' table of green feelds
  
  (2) ... for his nose was as sharp as a pen and <reg sic="a'">he</reg>
    <corr sic='table' ed=Gifford>babbl'd</corr> of green
    <reg sic='feelds'>fields</reg>

[TOP]

10 省略・削除・付加

省略・抹消個所を補い、原文の再現に必要な情報を補うための方法。

<add> 要素
原著者・書写者・注釈者・校訂者等による字句の書き入れを明示。
place 属性
書き入れ個所を示す。値の例: inline,supralinear(行の上),infralinear(行の下),left(左マージン),right,top,bottom 等。
<gap> 要素
写本中の省略個所。 TEI ヘッダに理由の記述があるか、又は判読できないかによる。
desc (description) 属性
省略個所の記述。
resp
省略を保存した編集者(書写者・マーク付け責任者)の id 等。
<del> 要素
削除された字句の記述。削除注記・衍文・改竄個所など。
type 属性
適宜、削除の類型を記述する。
status 属性
削除の適否などを記述できる。
hand 属性
削除者の id 等。
<unclear> 要素
判読不能の字句を記述。
reason 属性
書写できない理由。
resp 属性
判断者の id 等。

削除注記の実例を示す。(1)の衍字を削除することを、(2)で示す。


  (1) The following elements are provided for
     for simple editorial interventions.
     
  (2) The following elements are provided for
     <del hand=LB>for</del> simple editorial interventions.

原文で動詞を落としていた場合。


  (1) The following elements provided for
     for simple editorial interventions.
    
  (2) The following elements <add hand=LB>are</add> provided for
     <del hand=LB>for</del> simple editorial interventions.

同様に、原著者による原稿の校正などもマークアップできる。例えば、初稿の galls を抹消して dogs を挿入した場合は、次のようになる。


  How it <del hand=DHL type=overstrike>galls</del>
  <add hand=DHL place=supralinear>dogs</add> me,what a galling shadow

<unclear> 要素と <gap> 要素を同時に使って、判読不能部分の省略を示すことができる。(下の例では、補入候補を記述するために <add> タグを使っている。)


  One hundred & twenty good regulars joined to me
  <unclear><gap reason='indecipherable'></unclear>
  & instantly, would aid me signally <add hand=ed>in?</add>
  an enterprise against Wilmington.

<del> 要素は、削除の旨を記しながら削除部分をテキストの一部分として記述するが、 <gap> 要素は判読の可否にかかわりなくテキストの省略個所を記すものである。コーパスなどでは、外国語の長い引用文は省略するかもしれない。


  <p> ... An example of a list appearing in a fief ledger of
  <name type=place>Koldinghus</name> <date>1611/12</date>
  is given below. It shows cash income from a sale of
  honey.</p>
  <q><gap desc='quotation from ledger'
    reason='in Danish'></q>
  <p>A description of the overall structure of the account is
  once again ... </p>

他のコーパスでは(特にスキャナが今日のように普及する以前のもの)、図や数式は省略されている。


  <p>At the bottom of your screen below the mode line is the
  <term>minibuffer</term>.  This is the area where Emacs
  echoes the commands you enter and where you specify
  filenames for Emacs to find, values for search and replace,and so on.
  <gap desc='diagram of Emacs screen' reason='graphic'>
  </p>

[TOP]

11 名前・日付・数値・略語


 名前と称呼  日付と時間  数字  略語とその展開  住所

[SECTION TOP]

名前と称呼 (referring string)

称呼とは人や場所、物などを参照する句である。

<rs> (referring string) 要素
普通名詞や称呼
type 属性
参照する物の種類。値の例: person,place,ship,element 等。
<name> 属性
固有名詞(名詞句)
type 属性
参照する物の型。
/→addr/
  <q>My dear <rs type=person>Mr. Bennet</rs>, </q>
  said his lady to him one day, <q>have you heard
  that <rs type=place>Netherfield Park</rs> is let
  at last?</q>
   
  It being one of the principles of the
  <rs type=organization>Circumlocution Office</rs> never,
  on any account whatsoever, to give a straightforward answer,
  <rs type=person>Mr Barnacle</rs> said, <q>Possibly.</q>

次の例では、 <rs> 要素が固有名詞(名詞句)の形をしていない場合も含めて、すべての人や場所等への参照句にタグ付けされている。
(※ <rs> は <name> を包含している。以下を参照。)


  <q>My dear <rs type=person>Mr. Bennet</rs>,</q>
  said <rs type=person>his lady</rs> to him one day...

これと対照的に、 <name> 要素は固有名詞だけから成る。 <rs> 要素と同じような意味に使うこともでき、また普通名詞と固有名詞の混ざった referring string では <rs> 要素の中にネストさせて使うこともできる。

名前を単に name でタグ付けしたのでは、参照のためには十分ではない。文章の中には、いつもきちんとした形で名前が出てくるわけではない。上記の要素や類似の要素に、以下の属性を付けることができる。

key 要素
その名前に代わる id 等(データベースのキー項目のようなもの)
reg (regularized) 要素
正規化された表記

key 属性は、文書に散在する人名や地名へのすべての参照を集める手段として有益である。


  <q>My dear <rs type=person key=BENM1>Mr. Bennet</rs>,
  </q> said <rs type=person key=BENM2>his lady</rs>
  to him one day, <q>have you heard that
  <rs type=place key=NETP1>Netherfield Park</rs>
  is let at last?</q>

前述の reg (regularization) 属性が次のように称呼の標準化された形を記述するために使われるのと区別すること。


  <name type=person key=WADLM1 reg='de la Mare, Walter'>
     Walter de la Mare
  </name>  was born at
  <name key=Ch1 type=place>Charlton</name>, in
  <name key=KT1 type=county>Kent</name>, in 1873.

[SECTION TOP]

日付と時間

<date> 要素
日付
calendar 属性
日付を記載するシステム又はカレンダー
value 属性
所定の形式での日付( yyyy-mm-dd 等)
<time> 要素
時間
value 属性
所定の形式での時間

value 属性は、 ISO 8601 等の形式に従う。省略形や範囲で示すこともできる。曖昧な表現でも、範囲の区切りが分かれば、 exact 属性で表すことができる。


  <date value='1980-02-21'>21 Feb 1980</date>
  <date value='1990'>1990</date>
  <date value='1990-09'>September 1990</date>
   
  Given on the <date value='1977-06-12'>Twelfth Day of June
  in the Year of Our Lord One Thousand Nine Hundred and
  Seventy-seven of the Republic the Two Hundredth and first
  and of the University the Eighty-Sixth.</date>
   
  <l>specially when it's nine below zero
  <l>and <time value='15:00'>three o'clock in the afternoon</time>

[SECTION TOP]

数字

文字でも書かれるが、他の文字との区別は比較的明瞭である。区別のためには、 <num> 要素を使う。

<num> 要素
数字・番号
type 属性
数値の形式。値の例: cardinal(基数),ordinal(序数),fraction(分数), percentage等。
value 属性
数値(アプリケーションに依存しない形式で記す。)

  <num value='33'>xxxiii</num>
  <num type=cardinal value='21'>twenty-one</num>
  <num type=percentage value='10'>ten percent</num>
  <num type=percentage value='10'>10%</num>
  <num type=ordinal value='5'>5th</num>

[SECTION TOP]

略語とその展開

略語をそのまま使う場合も展開する場合もあるだろう。マーク付けするには、以下の要素を使う。

<abbr> (abbreviation) 要素
略語
expan (expansion) 属性
略語の正式名称を記す。
type 属性
略語の分類。値の例: contraction(縮約),suspension(省略),brevigraph(略記),superscription(略号),acronym (頭文字)等。あるいは、title(敬称・肩書),geographic,organization 等。語の性質をよく表す分類を工夫する。

<abbr> 要素は、頭文字や隠語などを区別するのに役に立つ。


  We can sum up the above discussion as follows:  the identity of a
  <abbr>CC</abbr> is defined by that calibration of values which
  motivates the elements of its <abbr>GSP</abbr>;
   
  Every manufacturer of <abbr>3GL</abbr> or <abbr>4GL</abbr>
  languages is currently nailing on <abbr>OOP</abbr> extensions.

機能によって type 属性を使った例。


  <name><abbr type=title expan='Doctor'>Dr.</abbr>
  <abbr type=initial expan='Marilyn'>M.</abbr> Deegan</name>
  is the Director of the
  <abbr expan='Computers in Teaching Initiative' type=acronym>
  CTI</abbr> Centre for Textual Studies.

[SECTION TOP]

住所

<address> 要素は、住所を示す。さらに、住所の各行を <addrLine> 要素で示す。


  <address>
  <addrLine>Computer Center (M/C 135)</addrLine>
  <addrLine>1940 W. Taylor, Room 124</addrLine>
  <addrLine>Chicago, IL 60612-7352</addrLine>
  <addrLine>U.S.A.</addrLine>
  </address>

住所の個別要素は、前述の <name> 要素を使う。


  <address>
  <addrLine>Computer Center (M/C 135)</addrLine>
  <addrLine>1940 W. Taylor, Room 124</addrLine>
  <addrLine><name type=city>Chicago</name>, IL 60612-7352</addrLine>
  <addrLine><name type>=country>USA</name></addrLine>
  </address>
/→索引/
[TOP]

12 リスト

リストには、番号つきリスト・番号無しリスト・用語リストなどがある。どれも項目の並びであり、項目のはじめにはラベル(用語リストでは用語そのもの)がある。

<list> 要素
テキスト項目の並び
type 属性
リストの形式。値の例: orderd(番号つきリスト),bulleted (文字や数字〔順序に関係なし?〕・丸印のついたリスト),gloss(専門用語集。 <label> 要素と <item> 要素とから成る。),simple (無印のリスト)等。
item 要素
リストの構成要素。
label 要素
ラベル。項目が続く。用語集では、見出しの術語がここにくる。

最初の <item> の前には、リストのヘッダとなる <head> を置いてもよい。リストの番号つけは不要であり、つける場合には n 属性を各項目につけるか、(まれに)<label> 要素を使う。
次の例は、どれも同じ意味を表している。


  (1)
  <list>
  <head>A short list</head>
  <item>First item in list.</item>
  <item>Second item in list.</item>
  <item>Third item in list.</item>
  </list>
  
  (2)
  <list>
  <head>A short list</head>
  <item n=1>First item in list.</item>
  <item n=2>Second item in list.</item>
  <item n=3>Third item in list.</item>
  </list>
  
  (3)
  <list>
  <head>A short list</head>
  <label>1</label><item>First item in list.</item>
  <label>2</label><item>Second item in list.</item>
  <label>3</label><item>Third item in list.</item>
  </list>

同じリストに異なったスタイルを混ぜるのはよくない。

用語集は term をラベルとしてタグ付けし、 gloss を項目(item)としてタグ付けする。この term , gloss と、普通のテキストのどこにでも置ける <term> 要素、 <gloss> 要素とは同じものである。


  <list type=gloss>
  <head>Vocabulary</head>
  <label lang=enm>nu</label>        <item>now</item>
  <label lang=enm>lhude</label>     <item>loudly</item>
  <label lang=enm>bloweth</label>   <item>blooms</item>
  <label lang=enm>med</label>       <item>meadow</item>
  <label lang=enm>wude</label>      <item>wood</item>
  <label lang=enm>awe</label>       <item>ewe</item>
  <label lang=enm>lhouth</label>    <item>lows</item>
  <label lang=enm>sterteth</label>  <item>bounds, frisks</item>
  <label lang=enm>verteth</label>   <item lang=lat>pedit</item>
  <label lang=enm>murie</label>     <item>merrily</item>
  <label lang=enm>swik</label>      <item>cease</item>
  <label lang=enm>naver</label>     <item>never</item>
  </list>

リストがもっと複雑な場合、むしろ table と考えて、専用の TEI タグ・セットを使うほうがよい。

リストはいくらでも入れ子にできる。


  <list type=gloss>
  <label>EVIL</label>
    <item>
    <list type=simple>
     <item>I am cast upon a horrible desolate island, void
            of all hope of recovery.</item>
     <item>I am singled out and separated as it were from
           all the world to be miserable.</item>
     <item>I am divided from mankind &mdash; a solitaire; one
             banished from human society.</item>
    </list> <!-- end of first nested list -->
    </item>
  <label>GOOD</label>
    <item>
    <list type=simple>
     <item>But I am alive; and not drowned, as all my
             ship's company were.</item>
     <item>But I am singled out, too, from all the ship's
             crew, to be spared from death...</item>
     <item>But I am not starved, and perishing on a barren place,
            affording no sustenances....</item>
    </list><!-- end of second nested list -->
    </item>
  </list><!-- end of glossary list -->

リストは、必ずしも改行しなくともよい。


  On those remote pages it is written that animals are
  divided into <list rend="run-on"><item n='a'>those that belong to the
  Emperor,<item n='b'> embalmed ones, <item n='c'> those
  that are trained, <item n='d'> suckling pigs, <item n='e'>
  mermaids, <item n='f'> fabulous ones, <item n='g'> stray
  dogs, <item n='h'> those that are included in this
  classification, <item n='i'> those that tremble as if they
  were mad, <item n='j'> innumerable ones, <item n='k'> those
  drawn with a very fine camel's-hair brush, <item n='l'>
  others, <item n='m'> those that have just broken a flower
  vase, <item n='n'> those that resemble flies from a distance.</list>

書誌的な項目のリストについては、 <listBibl> 要素を使う。(次節を参照。)

/→文献/
[TOP]

13 書誌的引用

研究目的の書誌的な引用は、テキストの印刷に際してきちんと分かるように区分けされるだろう。 <bibl> 要素は、書誌的引用部分を本文と区別する。

その他、次のタグを適宜利用するとよい。

<author> 要素
書誌的引用の中の原著作者(機関)名
<biblScope> 要素
書誌的引用の範囲(ページ数や当該巻数等)
<date> 要素
日付
<editor> 要素
2次的著作(編集)者(機関)名
role 属性
資格・役割(デフォルトは editor 、他に translator,compiler,illustrator 等。)
<imprint> 要素
印刷・出版者
<publisher> 要素
(代表の)出版機関名・発行元
<pubPlace> 要素
出版地
<series> 要素
叢書・シリーズ名
<title> 要素
標題(作品名・記事名・書名・誌名・叢書名等)
type 属性
分類( main,subordinate(副題など) 等)
level 属性
標題の書誌的な階層(「」を参照。)

編集注記のタグ付けの一例。(1)のカッコ内が注記の原文である。


  (1) He was a member of Parliament for Warwickshire in 1445,
     and died March 14, 1470 (according to Kittredge, Harvard
     Studies 5. 88ff). 
   
  (2) He was a member of Parliament for Warwickshire in 1445,
     and died March 14, 1470 (according to 
     <bibl><author>Kittredge</author>, <title>Harvard
     Studies</title> <biblScope>5. 88ff</biblScope></bibl>).

書誌的引用のリストには <listBibl> 要素を使う。これは <bibl> 要素の並びである。実例は、「22 リファレンス」中のリストを参照。)


[TOP]

14 テーブル(表)

テキスト処理システムにとってテーブル(表)は大きな課題だが、簡単な表は文章中によく現れるため、簡単なものであっても専用のタグが必要である。

<table> 要素
行と列とから成る表形式のテキスト
rows 属性
行数を示す。
cols (columns) 属性
列数を示す。
<row> 要素
表の1行
role 属性
行中の各セルの情報。値の例: label (ラベル・識別データ),data (事実データ)等。
<cell> 要素
表のセル
role 属性
セルの情報。値の例: label (ラベル・識別データ),data (事実データ)等。
cols 属性
セルの占める列数
rows 属性
セルの占める行数

次は、ダニエル・デフォーが黒死病年報中で使った死者の一覧表の例である。


  <p>It was indeed coming on amain, for the burials that
  same week were in the next adjoining parishes thus:&mdash;
  <table rows=5 cols=4>
  <row role='data'>
  <cell role='label'>St. Leonard's, Shoreditch</cell>
    <cell>64</cell> <cell>84</cell> <cell>119</cell></row>
  <cell role='label'>St. Botolph's, Bishopsgate</row>
    <cell>65</cell> <cell>105</cell> <cell>116</cell></row>
  <cell role='label'>St. Giles's, Cripplegate</row>
     <cell>213</cell> <cell>421</cell> <cell>554</cell></row>
  </table>
  <p>This shutting up of houses was at first counted a very cruel
  and unchristian method, and the poor people so confined made
  bitter lamentations. ... </p>

[TOP]

15 図と絵

どんなに飾り気の無い文章でも、図解や挿し絵くらいは割合あるものだ。文書によっては文章と画像とが不可分なものもあり、他のメディアを駆使する電子的資料でもこれらがあるに越したことはない。

マークアップは、以下のタグによってテキスト中でのグラフィックのあり場所を記すだけでよく、あるいは内容を短く説明してもよい。数値化されたグラフィックを電子化テキストに埋め込む場合も同様である。

<figure> 要素
グラフィックの挿入される地点を示す。
entity 属性
数値化されたグラフィックを含む実体の名前
( TEI ヘッダで定義済み)
<figDesc> 要素
グラフィックの見た目や内容を文章で記述したもの
(図を表示しない場合に用いる。)

グラフィックに付属する言語情報は、ヘッダやキャプションのように、 <figure> 要素の中に <head><p> (必要な数ぶん)の形で含めてよい。
画像の説明は、ぜひ <figDesc> 要素などで補うのがよい。それによって、アプリケーションがグラフィックを表示できない場合や、視覚不自由者が文書を把握できるようにする場合などに使う。(そういう文章は、元文書の本文とは見なさないのが普通である。)

グラフィックの位置だけをマークした例。(要素内容が何も無い場合でも、終了タグは省略できない。)


  <pb n=412>
  <figure></figure>
  <pb n=413>

グラフィックのタイトルは、 <head> 要素で示すことが多い。その際、短い説明も入れた方が便利だろう。


  <figure>
    <head>Mr Fezziwig's Ball</head>
    <figdesc>A Cruikshank engraving showing Mr Fezziwig leading
       a group of revellers.</figdesc>
  </figure>

数値化されたグラフィックデータを利用できる場合、文書中の適切な位置に埋め込めればなおよい。絵などは他のエンティティ(ファイル等)に分かれ、記法(フォーマット、ファイル形式)も異なっているのが普通である。 TEI Lite DTD では、 CGM , TIFF , JPEG 形式を、それぞれ cgm , tiff , jpeg という( SGML の)記法名で用いることができるが、他の記法であっても NOTATION 宣言をうまく DTD に加えるなら用いることは可能である。( SGML の NOTATION 宣言の詳細は、 TEI P3 の「 tables , formulae , and graphics 」の章、又は他の SGML 関連書を参照。)

画像がどんなフォーマットであっても、文章に埋め込む方法は変わらない。初めに、特定の型の SGML エンティティ(実体)-ファイル名のような外部識別子-と使われている記法とを宣言するのである。


  <!ENTITY fezziPic SYSTEM "fezzi.tff" NDATA tiff>

こうした宣言は、 SGML 文書そのものより先に読まれる。 TEI Lite DTD では、これらの宣言を litedecls.ent ファイル、又は公開識別子 -//TEI U5-1995//DTD TEI Lite 1.0 Extensions//EN を明示したファイルに置くことになる。

この宣言が働いているとき、数値データとしての画像を文書中の適切な場所に埋め込むためには、 <figure> 要素の entity 属性に値を入れるだけでよい。


  <figure entity=fezziPic>
    <head>Mr Fezziwig's Ball</head>
    <figdesc>A Cruikshank engraving showing Mr Fezziwig leading
       a group of revellers.</figdesc>
  </figure>

[TOP]

16 解釈・分析


 正書法による文  汎用の解釈要素

マークアップは解釈と分析の形式であるとはよくいわれるが、「主観的」情報と「客観的」情報とをいつでもきちんと区別するのは困難というよりほとんど不可能であるのに、「主観的」な判断が「客観的」な判断よりも論議を呼びがちであることには変わりがない。そこで、他のマークアップよりも異議を受けやすい点に読者の注意を促すことができる場合にのみ、その種の解釈をあえて記すという場合が多いのである。ここでは、こうしたマークアップのための要素をいくつか述べる。


[SECTION TOP]

正書法による文

解釈というものは、他の構造単位にはかかわりなく、本文全体にわたるものだ。したがって、精密な解釈を行うには、本文を個々に分離独立した単位(文)に分けるのが有効で、それが「規範的な参照」の類のラベルとなるわけである。個々の単位は、互いに交叉したり入れ子にしたりしてはならない。次の要素で単位を表すと便利である。

<s> (sentence unit) 要素
本文全体に及ぶ規範的な参照を行うために、文書を分けた「文」の単位。
type 属性
単位の分類(例: 断定、疑問等)

名前が示すとおり、 <s> 要素は、句読法などの正書法による文を表すのに使える。はじめに引いた「ジェーン・エア」の例。


  <pb n='474'>
  <div1 type=chapter n='38'>
  <p><s n=001>Reader, I married him.</s>
  <s n=002>A quiet wedding we had:</s>
  <s n=003>he and I, the parson and clerk, were alone present.</s>
  <s n=004>When we got back from church, I went
  into the kitchen of the manor-house, where Mary was cooking the dinner,
  and John cleaning the knives, and I said ‐</s>
  <p><q><s n=005>Mary, I have been married to Mr Rochester
  this morning.</s></q> ...

<s> 要素は入れ子にはならないのだから、 <s> 要素の開始は直前の <s> 要素の終了を意味することになり、終了タグが不可欠なわけではない。また、この例のように区分する場合は、本文全体を端から端までタグ付けするのが望ましい。そうすれば、分析する文中の単語すべてが一つの <s> 要素に含まれ、唯一の参照関係を示すことができる。識別子が文書中で唯一のものならば、この例の n 属性よりも id 属性のほうがよいかもしれない。


[SECTION TOP]

汎用の解釈要素

<s> 要素よりも汎用の分節要素としては、 <seg> 要素がこれまでも相互参照やハイパーテキストのリンク(「」を参照。)のターゲットを特定するのに使われている。これは、いくぶん句レベルのまとまりを指し、唯一の識別子であるばかりでなく、ユーザー定義の type 属性を割り当てることもできた。したがって、これを TEI ガイドラインには何の定めもないテキストの特徴のタグ付けに用いることができる。

例えば、ガイドラインには、物語の語り手が読者(聴者)に向かって直接に語りかける部分をマーク付けするための <apostrophe> (頓呼法)の要素などは無い。このための1つの解決策としては、これを <q> 要素の一例として(ただし、 who 属性の値を適切に定めることによって区別することで)考えることであろうか。けれども、もっと簡単で用途の広い解決法は、 <seg> 要素を次のように利用することであろう。


  <div1 type=chapter n='38'>
  <p><seg type='apostrophe'>Reader, I married him.</seg>
  A quiet wedding we had: ...

<seg> 要素の type 属性は、およそどんな値もとりうるから、句レベルの現象なら何でも記録することができる。 <seg> 要素の値とその意味するところを TEI ヘッダに書いておくのがよい。

<seg> 要素は、見かけのよく似た <s> 要素とは異なり、同種又は異種の <seg> 要素の入れ子とする(ネストする)ことができる。このため、非常に複雑な構造を表現することが可能だ(「8 リンク属性」のいくつかの例を参照。)
しかし、 SGML では要素の包含関係を正しく書くことが求められ、交叉を許していないために、文書の階層構造を全く顧みない勝手な範囲に対して解釈を結びつけたいという要求を満足させることができない。また、解釈それ自体も type 属性のとる1つの値で表す必要がある。

/→索引/

これに対して、 <interp> 要素には、どちらの制約も当てはまらない。この要素は、わりあいストレートな方法で、非常に複雑な解釈をマークアップできる頼もしい特徴を持っている。

<interp> (interpretation) 要素
本文中の(一定の長さをもった)語句にリンクされる注釈・解釈を入れる。
value 属性
注釈の対象となる事象を示す。
resp 属性
解釈の責任者
type 属性
注釈の対象となる事象の分類。値の例: image,character,theme,allusion (引喩)等。又は、具体的事例の挙げてある特定の論題の名称等。
inst (instance) 属性
この要素が表す分析・解釈の具体的事例を指す。(適用)
<interpGrp> 要素
<interp> タグを集めたもの。

これらの要素のおかげで、解釈の分類とそれに関する具体的事例とをマーク付けできる。 <seg> 要素ではあるものが頓呼であることしか分からないのに対して、 <interp> 要素を使えば、それがより上位の修辞的特徴に照らしてその具体的事例としての頓呼法であるということが伝えられるようになる。

その上、 <interp> は空要素であり、「8 リンク属性」で取りあげたana 属性によるか、この要素自身の <inst> 属性によって示した分節にリンクしなければならない。これはつまり、 SGML 文書の階層構造を顧慮せずにどのような分析も表すことができ、また特定のタイプの分析をグループ化することも容易になるわけだ。グループ化のためには、専用の <interpGrp> 要素がある。

具体的に、もしも主題・題材・修辞的特徴・物語の個々の場面の位置などといった文章の複雑な位相をマーク付けしたいとする。例えば、『ジェーン・エア』の離れた一節について、あるいは頓呼 (apostrophe) ・誇張 (hyperbole) ・隠喩 (metaphor) 等の修辞的特徴として、あるいは教会・召使・料理・郵便・ハネムーン等々の題材への参照として、そして教会の場面・台所の場面・居間(?)かどこかの場面等として、いろいろの意味づけを与えることになるかもしれない。こうした解釈は、 <text> 要素のどこにでも入れられる。しかし、それらは同じ場所に入れるのがよい。(例えば、前文や後付け等。)その例:


  <back>
  <div1 type='Interpretations'>
  <interp id='fig-apos'  resp='LB, MSM'
    type='figure of speech' value='apostrophe'>
  <interp id='fig-hyp'   resp='LB, MSM'
    type='figure of speech' value='hyperbole'>
  <!-- ... -->
  <interp id='set-church'  resp='LB, MSM'
    type='setting' value='church'>
  <!-- ... -->
  <interp id='ref-church'  resp='LB, MSM'
    type='reference' value='church'>
  <interp id='ref-serv'    resp='LB, MSM'
    type='reference' value='servants'>
  <!-- ... -->
  </p></div>

このコーディングの明らかな冗漫さを軽減するには、共通した属性値をもつ <interp> 要素を全部、 <interpGrp> 要素によってまとめればよい。


  <back>
  <div1 type='Interpretations'>
  <interpGrp type='figure of speech' resp='LB, MSM'>
    <interp id='fig-apos' value='apostrophe'>
    <interp id='fig-hyp'  value='hyperbole'>
    <interp id='fig-meta' value='metaphor'>
  <!-- ... -->
  </interpGrp>
  <interpGrp type='scene-setting' resp='LB, MSM'>
    <interp id='set-church'  value='church'>
    <interp id='set-kitch'   value='kitchen'>
    <interp id='set-unspec'  value='unspecified'>
  <!-- ... -->
  </interpGrp>
  <interpGrp type='reference' resp='LB, MSM'>
    <interp id='ref-church' value='church'>
    <interp id='ref-serv'   value='servants'>
    <interp id='ref-cook'   value='cooking'>
  <!-- ... -->
  </interpGrp>
  </p></div>

これらの解釈要素が定まったら、それを本文の該当部分にリンクさせるには、2つの方法がある(どちらか一方だけでも、両方でもよい)。
ana 属性は、どちらの要素にも共通して使うことができる。(次の例では、一段落に2つの場面設定があるので、識別子も2つあることに注意。)


  <div1 type=chapter n='38'>
  <p id='P38.1' ana='set-church set-kitch'>
  <s id=P38.1.1 ana='fig-apos'>Reader, I married him.</s>...

<interp> 要素に inst 属性を与えることによって、本文のどんな部分をも指示することができる。


  <interp id='fig-apos' type='figure of speech' resp='LB, MSM'
    value='apostrophe' inst='P38.1.1'>
  <!-- ... -->
  <interp id='set-church'  type='scene-setting' value='church'
    inst='P38.1' resp='LB, MSM'>
  <interp id='set-kitchen' type='scene-setting' value='kitchen'
    inst='P38.1' resp='LB, MSM'>
  <!-- ... -->

<interp> は、特定の分野に限らない。以上のような文学的な分野は1つの可能性にすぎない。同様に、文法的な品詞を示すのにも十分使える。「8 リンク属性」で挙げた例文は、次のように分析することもできる。


  <interp id=NP1 type=pos value='noun phrase, singular'>
  <interp id=VV1 type=pos value='inflected verb, present-tense singular'>
  ...

[TOP]

17 技術文書


 技術文書用の追加要素  区分の生成  索引の生成

本書の中心は、「電子化以前」の既存文書をマーク付けする TEI の方式を述べることにあるが、新規の文書についても同じ方式が当てはまる。 SGML では、文書構造を明確に表すことや、同じ文書をさまざまな目的に応じて再利用できるようにすること(オンラインのハイパー・テキストやブラウズ可能な文書も活版の体裁にまとまった文書も、共通の SGML 文書から生成できること)などを勧告している。

このことを容易にするために、 TEI DTD の拡張として技術文書全般と特に SGML 関連の文書の特徴をマーク付けする専用の要素を TEI Lite はいくらか含んでいる。


[SECTION TOP]

技術文書用の追加要素

次の要素は、技術文書の特徴をマーク付けするのに使う。

<eg> 要素
現在とりあげている問題の簡単な具体例。例: SGML マーク付けの仕方や例など。
<code> 要素
プログラミング言語など形式的言語の短いコード。
<ident> (identifier) 要素
ある種の識別子。例:変数名、 SGML 要素名・属性名など。
<gi> (generic identifier) 要素
特別な型の識別子。例: SGML 総称識別子・要素名など。
<kw> 要素
形式的言語のキーワード。
<formula> 要素
非 SGML 記法などで任意に提示される数学的・化学的公式。
notation 属性
式に用いている記法名。デフォルト値は tex (式が TeX の組版方式を用いている意。)

Fortran 言語の入門書の一節をマーク付けするのにこれらの要素を使った例。


  <p>It is traditional to introduce a language with a program like the
  following:
  <eg>
    CHAR*12 GRTG
    GRTG = 'HELLO WORLD'
    PRINT *, GRTG
    END
  </eg></p>
  <p>This simple example first declares a variable <ident>GRTG</ident>, in
  the line <code>CHAR*12 GRTG</code>, which identifies <ident>GRTG</ident>
  as consisting of 12 bytes of type <kw>CHAR</kw>.  To this variable,
  the value <mentioned>HELLO WORLD</mentioned>
  is then assigned. This is followed by a <kw>PRINT</kw> statement and an
  <kw>END</kw> statement.

このようにタグ付けすることにより、テキストをフォーマットするアプリケーションは、適切に働く。(改行を保持する、フォントを区別する、等。)同様に、 <ident><kw> などのタグを使えば、便利な索引を作るのもずいぶん楽になる。

<formula> 要素は、本文とは区別された数式や化学式を取り込むために使うべきだ。公式は通常の本文には表れない特別な字体を使うのが普通なので、特殊な記法で表現する必要がある。使用する記法は notation 属性で示す。
Tex は規定値になっているが、他の記法を使う場合はあらかじめ DTD の中で notation 宣言をしておくこと。)


  <formula notation=tex>
    \(E = mc^{2}\)
  </formula>

SGML 対応プロセッサの場合、 <formula> 要素の中ではほとんどの文字が使える。データはパーサによって整形されることなく、その記法に連関するアプリケーションに渡される。唯一の例外は、 SGML 終了タグの開始文字( < )にすぐ続けて斜線( / )とアルファベットが来るとそれをパーサが認識してしまうことである。次のような架空の例では、 SGML 構文エラーが出てしまう。


  <formula notation=tex>
    \(E = mc^{2}</a\)
  </formula>

さいわい、数学的記法には実際に </ の並びが現れることはほとんどない。現れた場合の対処法は本書の範囲外である( P3 ガイドラインを参照)。

これは、それ自身が SGML で書かれた技術文書で SGML マーク付けをする際に問題になる。そういう文書では、例文中のマーク付けと文書そのもののマーク付けとをはっきりと区別せざるをえず、終了タグの現れる確率も高いからだ。最も一般的な解決法は、 SGML の例文をパーサの解析対象外データとして区別することである。次の例のように、 CDATA マーク済みセクション (CDATA marked section) という特別の SGML 構造の中に入れてしまうのである。


  <p>A list should be encoded as follows:
  <eg><![ CDATA [
    <list>
    <item>First item in the list</item>
    <item>Second item</item>
    </list>
  ]]>
  </eg>
  The <gi>list</gi> element consists of a series of <gi>item</gi>
  elements.

この例では、 <list> 要素は、マーク済みセクション(特別なマークアップ宣言 <![ CDATA [ で始まり ]]> で終わる。)の中に埋め込まれているため、文書そのものの構成部分とは見なされない。
テキスト中の SGML 要素名(又は総称識別子 generic identifiers )を参照するタグ <gi> の使い方にも注意。


[SECTION TOP]

区分の生成

現代的文書生産システムのほとんどは、内容一覧や索引を自動生成することができる。 TEI Lite の枠組みには、そのようにして生成されたセクションを置く場所をマーク付けする要素がある。

<divGen> 要素
テキスト処理のアプリケーションによって自動的に生成されたテキスト区分の現れる位置。
type 属性
生成されたテキスト区分の型(例: 索引、一覧表等)。属性値の例: index(索引が生成され、ここに挿入される。),toc(目次・内容一覧),figlist(図のリスト),tablist(一覧表) 等。

<divGen> 要素は、区分要素の入りうるところならどこにでも置くこと ができる。次の例では、生成された区分の種類を分けるための type 属性の使い方をも示している。最初の例が目次で2番目が索引である。


  <front>
  <titlePage> ... </titlePage>
  <divGen type=toc>
  <div type='Preface'><head>Preface</head> ... </div>
  </front>
  <body> ... </body>
  <back>
  <div1><head>Appendix</head> ... </div1>
  <divGen type=index n='Index'>
  </back>

もしも既存の索引・目次を生成するのではなくマーク付けする場合には、「12 リスト」 で触れた <list> 要素を使うべきである。

/→後付/
[SECTION TOP]

索引の生成

正しくタグ付けられた文書から目次を生成することは何ら問題なく自動処理できるのが普通だが、良質の索引を作るにはより注意深いタグ付けが必要だ。特定のやり方でタグ付けられたすべての個所を単に索引項目とするだけでは不十分である。しかし、例えば <term> 要素や <name> 要素でマークした個所を残らず拾い上げるならば、かなり索引らしいものになってくる。

TEI DTD には、索引とする語句と索引作成の方法とを同時にマーク付けできる <index> という特別なタグがある。

<index> 要素
索引を作る場所を示す。
level1 属性
索引の第1項目
level2 属性
索引の第2項目(あれば。以下同じ。)
level3 属性
索引の第3項目
level4 属性
索引の第4項目
index 属性
項目が属する索引を示す。

例えば、この節の第2段落は次のようになる。

   ...
  TEI lite also provides a special purpose <gi>index</gi> tag
  <index level1='indexing'>
  <index level1='index (tag)' level2='use in index generation'>
  which may be used ...

<index> 要素は、解釈・分析のタグにもなる。例えば、オビディウスの比較文体論的な研究をするためには、人物ごとの詩人の言及すべてを記録することが求められるかもしれない。『メタモルフォーゼ』の中の以下の行では、ジュピター( deus 及び confiteor の主題として)や雄牛の形をしたジュピター( imago tauri fallacis 及び teneo の主題として)その他への言及を記録することになる。 この分析は近刊の Willard McCarty, Burton Wright: An Analytical Onomasuticon to the Metamorphoses of Ovid, Princeton University Press) より許可を得て抜粋したものだ。 索引では、ある種の単純化が施されている。


  <l n=3.001>iamque deus posita fallacis imagine tauri
  <l n=3.002>se confessus erat Dictaeaque rura tenebat

注釈の必要は、「7 注記」で論じた <note> 要素、あるいは「16 解釈・分析」で扱った <interp> 要素を使うことで対処できるかもしれない。ここでは、さらに <index> 要素を使うことによっても満たせることを明らかにしておこう。

このオブジェクトが複数の索引を生成するとしよう。1つは神の名( dn : names of deities )、2つ目は語源学的参照( on : onomastic references )、3つ目は代名詞的参照( pr : pronominal references )その他といったように。索引は、たとえばこんな風になるだろう。


  <l n=3.001>iamque deus posita fallacis imagine tauri
    <index index="dn" level1="Iuppiter" level2="deus">
    <index index="on" level1="Iuppiter (taurus)"
                      level2="imago tauri fallacis"></l>
  <l n=3.002>se confessus erat Dictaeaque rura tenebat
    <index index="pr"    level1="Iuppiter" level2="se">
    <index index="v"     level1="Iuppiter" level2="confiteor (v227)">
    <index index="mons"  level1="Dicte" level2="rura Dictaea">
    <index index="regio" level1="Creta" level2="rura Dictaea">
    <index index="v"     level1="Iuppiter (taurus)"
                         level2="teneo (v9)"></l>

これで見れば、個々の <index> 要素の中で level1 属性の値を見出し語にとることによって適切な索引が生成される。そして、 level2 属性のキーワードには主格の形で引用された単語が並ぶ。実際の参照は、 <index> 要素の出現する個所で索引にとられる。ここでいえば、 <index> を含む <l> 要素の識別子がそれである。


[TOP]

18 文字コード、発音(アクセント)記号、その他

ヨーロッパ諸言語を使用する者にとって、文字コードの使用に関する TEI 勧告は単純なものである。ローカルに使う限り、自分の機械なりソフトなりのサポートする文字コードを使えばよい。もし特殊文字を打つキーが不足したら、自己流にキーボードをカスタマイズすればよい(例えば、アクセント文字を表すために、適当なアクセントキーを文字キーの直後に打つ。あるいは、 aEä を表すというように、通常の文章には現れそうもない文字の組み合わせを使って打つ等)。こうして使った文字はあとで一括置換によって正しい文字に改めることができる。
もし非ラテン文字を使っていたり、自己の分野で標準音訳法がある場合などはそれを使えばよい。音訳は反訳が可能である。これは普通に筆記で使われる夥しい語法文法の類の埒外となる特色だ。そして、この方法はもし何の合字 (ligatures) ・結合辞 (ties) ・発音〔アクセント〕記号 (diacritics) もいらないのであれば、非常に有用なものになるだろう。

異なるシステム間でファイルを交換するには、電子的な交換に際してもほとんど変わることのない次の文字のほかは SGML の実体参照 (entitiy references) を使って置き換えればよい。


  a b c d e f g h i j k l m n o p q r s t u v w x y z
  A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
  0 1 2 3 4 5 6 7 8 9
  " % & ' ( ) * + , - . / : ; < = > ? _   (space)

このリストからは、次の文字を除いてある。これらの文字は、国境や標準を越えた広範なネットワークにおいては実によく文字化けを起こしてユーザを苛立たせるものなのだ。ちょっと手元の Mac から PC 機にデータを転送するくらいなら、まず大丈夫だ。


  ! # $ [ \ ] ^ ` { } | ~

企業間のネットワークで正常なデータ転送を確保するため、アクセント文字や拡張ラテン文字、非ラテン文字、従来のキーボードにないシンボル文字などはすべて実体参照を用いて表現しなければならない。

標準的な SGML 実体宣言を行えば、 TEI 準拠の文書ファイルに独自の SGML 実体名を使うことができる。しかし、標準的な名前は冗長でも明確さの点で優れているので、表そうとする文字は英語を話す者なら十分理解でき、何ら特別なリストを使わなくとも参照されている実体文字がわかるはずだ。この点は、他の文法でアクセント文字を表す場合には当てはまらない。

上に掲げた文字が「文字化けする」ために使う実体名、西欧の主要言語のアクセント文字用の実体名等を次のリストに挙げる。 SGML 関連の仕事では公開実体文字セットとその内容一覧を使う。後述の名前は、 ISO に定めた公開実体文字セットに基づいたもので、広く使われており推奨できるものだ。

必要な文字がこの中にない場合、これと同じく、 ISO 公開実体文字セットで採られているのと同じ命名法を使って文字実体を生成してよい。

digraphs
二重音字。その文字に文字列 lig (ligature) を付けて実体名を作る。大文字に続ければそれは大文字となる。(実体名では大文字・小文字を区別する。)例: aelig (æ) ,AElig (Æ) ,szlig (ß)。
diacritics and accents
アクセント記号・発音記号。西欧の言語では、次の文字列をアクセントをもつ文字に付けて実体名を表す。大文字または小文字。
umlaut
ウムラウト、トレマ。例:auml (ä) , Auml (Ä) , euml (ë) , iuml ( ï -ママ) , ouml (ö) , Ouml (Ö) , uuml (ü) , Uuml (Ü)。
acute
鋭(揚音)アクセント (´ ) 、強調アクセント。例: aacute (á) , eacute (é) , Eacute (É) , iacute ( í ) , oacute (ó) , uacute (ú) 。
grave
抑音アクセント(`)。例: agrave (à) , egrave (è) , igrave ( ì ) , ugrave (ù) 。
circumflex
曲折(変調)アクセント(^)。例: acirc (â) , ecirc (ê) , Ecirc (Ê) , icirc ( î ) , ocirc (ô) , ucirc (û) 。
tilde
チルダ(~)。例: atilde (ã) , Atilde (Ã) , ntilde (ñ) , Ntilde (Ñ) , otilde (õ) , Otilde (Õ) 。
consonants
子音。以下の例は、西欧言語に見られる特殊な子音に対する実体名である。セディーユ ccedil (ç) , Ccedil (Ç) , eth (ð) , ETH ( Ð ) , thorn (þ) , THORN (Þ) , エスツェット szlig (ß) 。
punctuation marks
句読点。例: ldquo (“) , rdquo (”) , lsquo (‘) , rsquo (’) , mdash (— 全角1文字分のダッシュ〔 one-em dash 〕) , hellip (…  省略符号〔 horizontal ellipsis 〕) 。(次項の「文字化け」する文字のリストも参照。)
「文字化け」する文字
以上の表現の中にも、現在のインターネットで「文字化け」するかもしれない文字があり、次の実体によって表現してもよい。 excl ( ! ) , num (#) , dollar ($) , lsqb ( [ ) , rsqb ( ] ) , bsol (\) , circ ( ˆ ) , lsquo ( ‘ ) , grave , lcub ( { ) , rcub ( } ), verbar ( / ) , tilde (~) 。
/→見出し/
[TOP]

19 前文・後付


 前文  (    前文  )   後付

[SECTION TOP]

前文

昔の本にはよく、扉・前置きとしての書簡などがあって、本文以外に言語・社会面の知識を提供していた。 TEI P3 ガイドラインには、前文に決まって現れるテキスト要素を区別する方法が出てくるが、ここにそれを手短にまとめる。

[SECTION TOP]
【扉】

書物の扉は、 <titlePage> 要素で示す。この中の文章を、以下からふさわしい要素でマーク付けする。

<titlePage> 要素
前文・後付の扉。
<docTitle> 要素
扉にある文書の題名。全体の内容を示すもの。さらに <titlePart> 要素に細分する。
<titlePart> 要素
扉にある文書の各章節。また、文書名・著作権(帰属)表示以外で特に場所が決まっていない文章にも適用できる。
type 属性
各章節の役割。属性の例: main (主題),sub (副題),desc (主題の言い換え〔descriptive paraphrase〕) ,alt (代わりの題〔alternative title〕)等。
<byline> 要素
扉または最後にある(代表)執筆者名。
<docAuthor> 要素
扉にある文書の著者名。 <byline> 要素に含まれるが、含まれないこともある。
<docDate> 要素
扉等にある文書の日付。
<docEdition> 要素
扉にある出版履歴。
<docImprint> 要素
扉下部等にある印刷の記述(出版地・印刷日付・発行元)。
<epigraph> 要素
題辞・銘句。章節の初め・扉等にある引用。(出典の記述あり・なし。)

活字の区別が必要な場合、前述のように rend 属性を用いる。ただし、装飾題の字間スペースや字のサイズなどあまり細かい点までは、まだガイドラインに定めていない。言語の種別は、 lang 属性または <foreign> 要素を適宜使う。名前は、ここでも <name> 要素を用いてタグ付けする。

扉をタグ付けした2つの例:


  <titlePage rend=Roman>
    <docTitle><titlePart type=main>
      PARADISE REGAIN'D. A POEM In IV <hi>BOOKS</hi>.
      </titlePart>
      <titlePart>
      To which is added <title>SAMSON AGONISTES</title>.
      </titlePart>
    </docTitle>
    <byLine>The Author <docAuthor>JOHN MILTON</docAuthor></byline>
    <docImprint><name>LONDON</name>,
      Printed by <name>J.M.</name>
      for <name>John Starkey</name>
      at the <name>Mitre</name>
      in <name>Fleetstreet</name>,
      near <name>Temple-Bar.</name>
    </docImprint>
    <docDate>MDCLXXI</docDate>
  </titlePage>

<titlePage> <docTitle><titlePart type=main> Lives of the Queens of England, from the Norman Conquest;</titlePart> <titlePart type='sub'>with anecdotes of their courts. </titlePart></docTitle> <titlePart>Now first published from Official Records and other authentic documents private as well as public.</titlePart> <docEdition>New edition, with corrections and additions</docEdition> <byline>By <docAuthor>Agnes Strickland</docAuthor></byline> <epigraph> <q>The treasures of antiquity laid up in old historic rolls, I opened.</q> <bibl>BEAUMONT</bibl> </epigraph> <docImprint>Philadelphia: Blanchard and Lea</docImprint> <docDate>1860.</docDate> </titlePage>

[SECTION TOP]
【前文】

前文の主なテキスト・ブロックは、 <div> 要素や <div1> でマーク付けする。次に挙げるのは、 type 属性の値だが、これによって前文に共通したさまざまなタイプを区別することができる。

foreword
序文。書簡の形式などで著者・編者・出版者が読者に宛てて書いた文章。
preface
(同上)
dedication
献辞。読者以外の特定人物に向けた(手紙形式等の)文章。著者がその作品を推薦するというものが多い。
abstract
抜粋。作品の内容を要約した文章。
ack (acknowledgements)
挨拶・謝辞。
contents
目次。たいがい <list> 要素でタグ付けする。
frontispiece
口絵。説明等も含める。

他のテキスト部分と同じく、前文ではこれらは構造的な要素は無いか、あってもその役割は小さい。普通、 head 要素で括られるある種の見出し・題名で始まる。書簡の場合は、次の付加要素を含む。

<salute> 要素
挨拶・頭語(結語)。緒言・献辞等の前、あるいは書簡・序等の結びに置かれる。
<signed> 要素
署名。緒言・献辞等の結びの挨拶。
<byline> 要素
扉、序跋にある筆者(作者)名の記載。
<dateline> 要素
書簡・新聞連載などの初め(終わり)に(見出し・次回予告のような意味あいで)置く作成日時・場所その他の記述。
<argument> 要素
梗概・要旨。その一節で述べている論題の箇条書き・要約。
<cit> 要素
他の文書からの引用。出典の書誌解題を含む。
<opener> 要素
頭書。書簡などの初めに置く、上記 dateline, byline, salutation の類のグループ。
<closer> 要素
後付。書簡などの終わりに置く、上記 dateline, byline, salutation の類のグループ。

本文の各所に置かれる書簡も、もちろん同じ要素を持つ。

ミルトンの『コーマス』劈頭の献辞をタグ付けした例を示す。


  <div type='dedication'>
  <head>To the Right Honourable <name>JOHN Lord Viscount
  BRACLY</name>, Son and Heir apparent to the Earl of
  Bridgewater, &amp;c.</head>
  <salute>MY LORD,</salute>
  
  <p>THis <hi>Poem</hi>, which receiv'd its first occasion of
  Birth from your Self, and others of your Noble Family ....
  and as in this representation your attendant
  <name>Thyrsis</name>, so now in all reall expression
  <closer>
  <salute>Your faithfull, and most humble servant</salute>
  <signed><name>H. LAWES.</name></signed>
  </closer>
  </div>

[SECTION TOP]

後付

【後付の構成区分】

出版の実際はさまざまであり、後付は前文の項で挙げたほとんどすべての要素を含む。加えて、後付は以下に示すものを <back> 要素に含めてよい。これらは本文の構成区分同様に、 <div> 要素または <div1> 要素としてタグ付けし、 type 属性によって区別するのがよい。

appendix
付録。
glossary
用語集・定義集。通常、 type=gloss の形式をとる。
notes
<note> 要素のならび。
bibliography
書誌解題。通常、専用の <listBibl> 要素の中に、各項目を <bibl> 要素でまとめて並べる。
index
索引。一定の構造をもったリストか用語集の形式をとる。 <head> 要素を置いたり、前置き・後書きをつけたりすることもできる。( TEI P3 ガイドラインでは、文書作成の際に索引を生成するための特別な要素を定めている。「17 索引の生成」を参照。)
colophon
奥付。書物の後ろに印刷の場所・日時や印刷者を記したもの。現代の書籍では、よく出版の詳細や活字面の説明をしてある。
/→構造/
[TOP]

20  TEI ヘッダ


 ファイル情報  マークアップ情報  文書情報  更新履歴

活版の扉にあるような情報構造の分析は、 TEI 準拠のテキストではヘッダの中に記述する。ヘッダは、 <teiHeader> 要素で始まり、4つの主要部分から成る。

<fileDesc> 要素
電子化文書ファイルの書誌的記述をまとめる。
<encodingDesc> 要素
電子テキストとその元になる文書の関係をまとめる。
<profileDesc> 要素
電子テキストの書誌的記述以外の事項を詳細に述べる。特に、使用言語(副言語)の種類、外国語を使う場合の説明、関係者、背景等。
<revisionDesc> 要素
ファイルの更新履歴を簡潔にまとめる。

コーパスや類聚本は、作品各個の特徴があり、コーパス全体のヘッダと個々の作品のヘッダがあってよい。この時、ヘッダのタイプは type 属性で表す。次の例は、コーパス・レベルのヘッダである。


  <teiHeader type=corpus>

ヘッダの要素には、一つ以上の <p> 要素から成るものもあれば、次のようにグループ化されるものもある。

  • 名前の末尾が Stmt (statement) になる要素。構造的な情報を記録した要素の集合など。
  • 名前の末尾が Decl (declaration) になる要素。特別なマーク付けについての情報。
  • 名前の末尾が Desc (description) になる要素。普通の文章。

[SECTION TOP]

ファイル情報


 標題  版歴  サイズ  出版  叢書・覚書  典拠

<fileDesc> 要素は必須である。次の要素を使って文書ファイルの書誌的記述をまとめる。

<titleStmt> (title statement) 要素
作品の標題・解題等。
<editionStmt> 要素
テキストの各版の情報。
<extent> 要素
可搬媒体に適宜の単位で入れたときの電子テキストのサイズ。
<publicationStmt> 要素
電子テキストその他の出版・配布に関する情報。
<seriesStmt> 要素
叢書等の一部である場合、その情報。
<notesStmt> 要素
書誌的記述の他の覚え書きを集めたもの。
<sourceDesc> 要素
電子テキストの原文に関する書誌的記述。

最も簡単なヘッダの構造:


  <teiHeader>
    <fileDesc>
      <titleStmt> ... </titleStmt>
      <publicationStmt> ... <publicationStmt>
      <sourceDesc> ... <sourceDesc>
    </fileDesc>
  </teiHeader>

[SECTION TOP]
【標題】

<titleStmt> 要素には、次の要素が使える。

<title> 要素
作品の標題。記事・書籍・新聞・叢書等の題または副題。
<author> 要素
書誌的な参照の中での著者(個人・組織)。参考書目の中での著作者代表。
<sponsor> 要素
スポンサーとなる組織・機関の名前。
<funder> 要素
プロジェクト、文書の資金提供者名(個人・組織・機関)。
<principal> 要素
電子テキストの制作責任者名。
<respStmt> 要素
文書・出版・記録・叢書等の知的内容の責任者の著作権表示。著者・編集者等の要素には当てはまらないもの。

次のように、標題はコンピュータのファイルと原文とで区別するのが望ましい。


  [title of source]: a machine readable transcription
  [title of source]: electronic edition
  A machine readable version of: [title of source]

<respStmt> 要素は、次の副要素を含む。(次例を参照。)

<resp> 要素
個人の知的責任の性質を記した句。
<name> 要素
固有名詞・名詞句がある。

  <titleStmt>
    <title>Two stories by Edgar Allen Poe: a machine readable
              transcription</title>
    <author>Poe, Edgar Allen (1809-1849)
    <respStmt><resp>compiled by</resp>
    <name>James D. Benson</name></respStmt>
  </titleStmt>

[SECTION TOP]
【版歴】

<editionStmt> 要素は、書誌の中で <edition> 要素が使われている時、版ごとの情報をまとめる。以下の要素が含まれる。

<edition> 要素
テキストの一つの版の特徴を記す。
<respStmt> 要素
文書・出版・記録・叢書等の知的内容の責任者の著作権表示。著者・編集者等の要素には当てはまらないもの。

具体例:


  <editionStmt>
    <edition n=U2>Third draft, substantially revised
    <date>1987</date>
    </edition>
  </editionStmt>

電子テキストの版をどう決めるかは、マーク付け担当者に任される。


[SECTION TOP]
【サイズ】

<extent> 要素は、ファイルのサイズを示す。


  <extent>4532 bytes</extent>

[SECTION TOP]
【出版】

<publicationStmt> 要素は必須である。以下のような記述または要素グループが含まれる。

<publisher> 要素
出版・配布元の組織名。
<distributor> 要素
テキストの配布責任者または代理機関。
<authority> 要素
出版・配布元以外に電子テキストを提供した責任者または代理機関。

出版の記載が説明的に書かれている場合以外は、この3要素のどれかを使う。そこには、次の要素が現れる。

<pubPlace> 要素
出版地。
<address> 要素
出版者(組織・個人)の住所(アドレス)。
<idno> 要素
書物の識別 id 。(標準化の有無にかかわらない。)
type 属性
ISBN 等、番号の類別を記す。
<availability> 要素
テキストの利用規定。使用・配布に当たっての制限や著作権など。
status 属性
現在の利用許可に関するコード。値の例: restricted,unknown,free 等。
<date> 要素
日付。

  <publicationStmt>
    <publisher>Oxford University Press</publisher>
    <pubPlace>Oxford</pubPlace> <date>1989</date>
    <idno type=ISBN> 0-19-254705-5</idno>
    <availability>Copyright 1989, Oxford University
      Press</availability>
  </publicationStmt>

[SECTION TOP]
【叢書・覚書】

<seriesStmt> 要素は、出版物が叢書にある場合、その情報をまとめる。 <title> 要素、 <idno> 要素、 <respStmt> 要素が入る。

<notesStmt> 要素を使う場合、注記・注釈を含む <note> 要素が含まれる。伝統的な参考書誌での注釈領域については、 TEI の枠組みで専用の要素を割り当てている。


[SECTION TOP]
【典拠】

<sourceDesc> 要素は、コンピュータ・ファイルの元になった原典の詳細を記録する必須の要素である。ただの説明であったり、書誌的な引用だったりするが、その際次の要素を使う。

<bibl> 要素
緩やかな構成をもった書誌的引用。内部にタグを使うことも使わないこともある。
<biblFull> 要素
TEI ファイルの記述のすべての構成要素がある完全な構成をもった書誌的引用。
<listBibl> 要素
すべての書誌的引用のリスト。

具体例:


  <sourceDesc>
    <bibl>The first folio of Shakespeare, prepared by Charlton
      Hinman (The Norton Facsimile, 1968)</bibl>
  </sourceDesc>

<sourceDesc> <scriptStmt id=CNN12> <bibl><author>CNN Network News <title>News headlines <date>12 Jun 1989 </bibl> </scriptStmt> </sourceDesc>

[SECTION TOP]

マークアップ情報


 目的・選定方針  マークアップ宣言  タグ・参照・分類コード

<encodingDesc> (encoding description) 要素は、テキストの写し全体に及ぶ方法と編集規則を表す。このタグの使用を TEI では推奨している。ここには、テキストまたは下記の要素が含まれる。

<projectDesc> 要素
電子テキストのマーク付けの目的・ねらい。テキストの収集過程についての必要な情報を含む。
<samplingDecl> 要素
コーパスや類聚を作る際の選定方針や方法。
<editorialDecl> 要素
マーク付けの方針と事例の詳細。
<tagsDecl> 要素
SGML 文書に使ったタグ付けの詳細。
<refsDecl> 要素
規範的参照の構造。
<classDecl> 要素
マーク付けで使う分類コードの分類基準。

[SECTION TOP]
【目的・選定方針】

<projectDesc> 要素と <samplingDecl> 要素の例。


  <encodingDesc>
    <projectDesc>Texts collected for use in the Claremont
      Shakespeare Clinic, June 1990.
    </projectDesc>
  </encodingDesc>
   
  <encodingDesc>
    <samplingDecl>Samples of 2000 words taken from the beginning
      of the text
    </samplingDecl>
  </encodingDesc>

[SECTION TOP]
【マークアップ宣言】

<editorialDecl> 要素は、テキストをマーク付けする実例を表す。大概、以下の諸点にわたる。各々、段落を分けると便利である。

correction (校訂)
校訂方針。
normalization (改訂範囲)
原文を改訂する範囲・程度。
quotation (引用符)
原文の引用符の処置。残すか、実体参照で置き換えるか、引用開始符号と終了符号を区別するか、など。
hyphenation (ハイフネーション)
原文のハイフン(特に行末)の処置。残すか、実体参照で置き換えるか、など。
segmentation (区切り)
テキストの区切り方。文・音節・音素層 (graphemic strata) 等による。
interpretation (解釈)
テキストの分析・解釈。

具体例:


  <editorialDecl>
    <p>The part of speech analysis applied throughout
         section 4 was added by hand and has not been
         checked.
    <p>Errors in transcription controlled by using the
         WordPerfect spelling checker.
    <p>All words converted to Modern American spelling
         using Webster's 9th Collegiate dictionary.
    <p>All quotation marks converted to entity
         references &odq; and &cdq;.
  </editorialDecl>

[SECTION TOP]
【タグ・参照・分類コード】

<tagsDecl> 要素は、テキスト中に用いられている SGML タグの情報を表す。単純な要素一覧なのだが、次の特別な要素を使う。

<tagUsage> 要素
TEI 準拠の文書は最も外側に <text> 要素があるが、その中の要素の使い方についてここに記す。
gi (generic identifier) 属性
そのタグによって示される要素の名(総称識別子)。
occurs 属性
本文中にその要素が現れる数。

<rendition> 要素は、原文で要素の区別を表現する方法を表す。

<rendition> 要素
ある要素を特に区別して表現することを表す。
<tagUsage> 要素
<text> 中の特定要素の使い方を記す。
occurs 属性
その要素の出現度数。
ident 属性
共通属性 id に相当する値をもつ要素の出現度数。
render 属性
<rendition> 要素の識別子。

具体例:


  <tagsDecl>
    <tagUsage gi=text occurs=1>
    <tagUsage gi=body occurs=1>
    <tagUsage gi=p occurs=12>
    <tagUsage gi=hi occurs=6>
  </tagsDecl>

この(架空の)タグ宣言は、本文が12の段落を持っていて、中に6つの <hi> 要素がある場合のものである。 <tagsDecl> 要素を使う場合、関連するテキスト要素で本文に出てくるものすべてを <tagUsage> 要素で説明しなければならない。


<refsDecl> 要素は、タグ付けされた文書に標準的な参照方法を組み込む方法を説明する。最も簡単なのは、すべて文章で記すことである。具体例:


  <refsDecl>
    <p>The N attribute on each DIV1 and DIV2 contains the
    canonical reference for each such division in the form
    XX.yyy where XX is the book number in roman numeral and
    yyy is the section number in arabic.
  </refsDecl>

<classDecl> 要素は、ヘッダの他の部分で使われている記述的な分類方法の定義・出所をまとめるものである。次の要素を用いて最低1つの分類法を示さなければならない。

<taxonomy> 要素
分類体系。書誌的引用によって指示するか、または構造的な分類体系を明示する。
<bibl> 要素
ゆるやかな構造をもった書誌的引用で指示する場合。副次的構成要素がマーク付けされているものも、いないものもある。
<category> 要素
上位分類やユーザ定義の分類体系に含められた個々の分類項目。
<catDesc> 要素
分類体系やテキスト類型中の分類項目を短文の形で書いたもの。

最も簡単な例では、次のように書誌的参照によって分類体系を定義する。


  <classDecl>
    <taxonomy id='LCSH'>
      <bibl>Library of Congress Subject Headings
      </bibl>
    </taxonomy>
  </classDecl>

次に示すように、特別な目的の分類法を上の代わりに、または付け加えて、定義してもよい。


  <taxonomy id=B>
    <bibl>Brown Corpus</bibl>
    <category id=B.A><catDesc>Press Reportage
      <category id=B.A1><catDesc>Daily</category>
      <category id=B.A2><catDesc>Sunday</category>
      <category id=B.A3><catDesc>National</category>
      <category id=B.A4><catDesc>Provincial</category>
      <category id=B.A5><catDesc>Political</category>
      <category id=B.A6><catDesc>Sports</category>
           ...   
    </category>
    <category id=B.D><catDesc>Religion
      <category id=B.D1><catDesc>Books</category>
      <category id=B.D2><catDesc>Periodicals and tracts</category>
    </category>
      ...
  </taxonomy>

こうした分類項目と特定のテキストとをリンクさせる方法については、 <textClass> 要素中の <catRef> 要素を使う(後述)。


[SECTION TOP]

文書情報

<profileDesc> 要素は、テキストのさまざまな記述的側面を特徴づける情報を一つの枠組みで記録できるようにする。3つの付加的要素がある。

<creation> 要素
テキスト作成に関する情報。
<langUsage> 要素
テキストの言語・副言語・レジスタ・特殊方言等を記述。
<textClass> 要素
テキストの主題・性質を標準的な分類法・シソーラス等に従って記したもの。

具体例:


  <creation>
    <date value='1992-08'>August 1992</date>
    <name type=place>Taos, New Mexico</name>
  </creation>
/→分類/

<textClass> 要素は、 <classDecl> 要素によってあらかじめ定義された方式を参照してテキストを分類する。次の要素をいくつか含む。

<keywords> 要素
テキストの性質や主題を表すキーワード・語句。
scheme 属性
キーワードを定義した語彙集の名称。
<classCode> 要素
標準的な分類法によるテキストの分類コード。
scheme 属性
使用する分類方法・体系の名称。
<catRef> 属性
分類体系やテキスト類型で定義された分類項目(複数可)。
target 属性
関連する分類項目。

<keywords> 要素は、テキストの性質や主題を表すキーワード・語句の一覧を含む。 scheme 属性により、これらを <taxonomy> 要素で定義された分類体系にリンクする。


  <textClass>
    <keywords scheme=LCSH>
      <list>
      <item>English literature -- History and criticism --
           Data processing.</item>
      <item>English literature -- History and criticism --
           Theory etc.</item>
      <item>English language -- Style -- Data
           processing.</item>
      </list>
    </keywords>
  </textClass>

[SECTION TOP]

更新履歴

<revisionDesc> 要素は、テキストの更新記録(ログ)である。以下の要素を含む <change> 要素の並びをその内容とする。

<date> 要素
日付(書式は問わない。)
<respStmt> 要素
著者・編集者等専用の要素に該当しない、テキストの更新・記録の責任者に関する記録。
<item> 要素
リスト項目。

具体例:


  <revisionDesc>
    <change><date>6/3/91:</date>
      <respStmt><name>EMB</name><resp>ed.</resp></respStmt>
      <item>File format updated</item>
    <change><date>5/25/90:</date>
      <respSmt><name>EMB</name><resp>ed.</resp>
      <item>Stuart's corrections entered</item>
  </revisionDesc>

[TOP]

21 要素リスト


 共通属性   TEI Lite の要素

[SECTION TOP]

共通属性

TEI Lite の文書型定義( DTD )の要素は、どれも以下の共通属性を持っている。

ana
要素とその解釈とをリンクする。
corresp
要素と他の相当する要素とをリンクする。
id
要素を識別するもの。アルファベット文字で始まり、文字・数字・ハイフン・ピリオドを含む。
lang
要素の言語。特に指定がなければ、本文と同じ。
n
要素番号。どんな文字の並びでもよい。よく参照方式を記録するのに使う。
next
要素を同じ集合の中の直後の要素とリンクする。
prev
要素を同じ集合の中直前の要素とリンクする。
rend
原本の要素の体裁(イタリック体・ローマン体・ディスプレイ文字・ブロック体等。値はどんな文字列でもよい)。

[SECTION TOP]

TEI Lite の要素


 A-C  D-F  G-I  J-L  M-O  P-R  S-U  V-Z

次のリストは、 TEI Lite DTD のための要素すべてに簡単な説明をつけたものである。

<abbr> [TOP OF LIST]
省略形。展開形は expan 属性に示す。
<add>
付加語句。著者・筆記者・校訂者・注釈者等が書き加えた語句。
<address>
出版社・組織・個人等の住所・アドレス。
<addrLine>
住所・アドレスの1行。
<anchor>
文書中の指示対象位置(ポイント)を示す。
<argument>
梗概・要旨。その一節で述べている論題のリスト・説明。
<author>
書誌的参照で、作品の著者(個人・組織)を示す。すべての参考書目での著者代表。
<authority>
電子ファイルの作成責任者または代理人。(出版・配布者を除く。)
<availability>
テキストの利用に関する情報。使用・配布の制限、著作権等。
<back>
本文の後の付録等。
<bibl>
緩やかな構造をもった書誌的引用。内部要素はタグ付けされていなくともよい。
<biblFull>
完全な構造をもった書誌的引用。すべての要素は TEI のルールに従って記述してある。
<biblScope>
書誌的参照の及ぶ範囲。ページ番号のリストや分冊形式の各編など。
<body>
1つの単位となるテキストのまとまり。前文・後付を除く。
<byline>
作品の扉・序跋の中で、作品の著作代表責任者を示す。
<catDesc>
分類体系やテキスト類型の分類項目を短い文章で記述したもの。
<category>
上位の分類項目やユーザ定義の分類体系に埋め込まれた個々の分類項目。
<catRef>
分類体系やテキスト類型の分類項目(単数・複数)を参照する。
<cell>
表の1つのセル。
<cit>
典拠への書誌的参照をともなった他文書の引用。
<classCode>
標準とした分類方式によってテキストを分類したコード。 scheme 属性によって特定する。
<classDecl>
テキストに使われる分類コードを定義した分類体系(単数・複数)をまとめる。
<closer>
後付。(特に手紙の)最後に現れる datelinebylinesalutation その他の語句をまとめたもの。
<code>
形式言語(プログラミング言語等)のコードの一部。
<corr> (correct)
原文の誤りと思われる一節を改めた形。
<creation>
テキストの作成に関する情報。
<date> [TOP OF LIST]
日付。標準的な値を value 属性で示す。
<dateline>
日付・時間・場所等。手紙・新聞の読み物・その他のヘッダ・後付のようなものとして前・後に置かれるもの。
<del>
著者・筆記者・校訂者・注釈者等が原文から削除した文字・語句・文章、または原文で削除してある旨を記載したり、衍字・衍文や改竄個所を明示したりしたもの。
<distributor>
テキストを配布した個人・代理人の名前。
<div>
前文・本文・後付の内部の分節。
<div1><div7>
前文・本文・後付の内部の第1~第7レベルの分節。
<divGen>
テキスト処理プログラムによって自動的に生成されたテキスト分節の位置を示す。 type 属性によって索引・目次その他の区別を表す。
<docAuthor>
扉にある文書の著者名。(いつも <byline> の中にあるわけではない。)
<docDate>
(だいたい)扉にある文書の日付。
<docEdition>
扉にある改版履歴。
<docImprint>
(だいたい)扉末尾にある印刷記録。(出版地・出版日・出版者)
<docTitle>
扉にある文書の標題(その構成要素を含む)。さらに <titlePart> 要素に分かれる。
<edition>
テキストの版ごとの詳細情報。
<editionStmt>
1つの版に関連する情報のまとまり。
<editor>
参考書目で編集者・コンパイラ・翻訳者等、原著者に次ぐ責任を負う者(個人・組織・機関)。
<editorialDecl>
テキストのマーク付けに際しての編集原則・手続きの詳細。
<eg>
取り扱う技術的主題の簡単で短い例。コードの断片や SGML マーク付けの例など。
<emph>
文法的・修辞的に強調する語句を表す。
<encodingDesc>
電子テキストと原文の関係を述べる。
<epigraph>
題辞。章節や扉の初めに見える引用句。(出典の有無を問わない。)
<extent>
可搬媒体に適宜の単位で入れたときの電子テキストのサイズ。
<figure>
文書中にグラフィックを埋め込む位置を示す。属性は、画像そのもの(非 SGML 記法)を含む SGML 実体を示す。 <figure> 要素の中の段落はキャプションを表すのに使う。
<fileDesc>
電子ファイルの書誌的記述すべて。
<foreign>
テキスト本文以外の言語に属する語句を識別する。
<formula>
非 SGML 記法で任意に表した数学的・科学的公式。 notation 属性は、その公式を記した非 SGML 記法の名称を示す。
<front>
テキストそのものが始まる前に置かれた前文(ヘッダ・扉・序文・献辞等)。
<funder>
プロジェクトやテキストの資金調達者名(個人・組織・機関)。
<gap> [TOP OF LIST]
写本の省略部分を示す。 TEI ヘッダに記述された編集上の取捨選択によるもの、または原本が判読(聴取)できないためのもの。
<gi>
特別な識別子。 SGML 総称識別子、または要素名。
<gloss>
ある語句の注解・定義となる語句を示す。
<group>
単一の文または文章の集合。
<head>
見出し。節の小題やリスト・用語集の見出しなど。
<hi>
特に構造的な理由もなく、周囲の本文と視覚的に区別した語句。
<ident> (identifier)
ある種の識別子。変数名・ SGML 要素名・属性名など。
<idno>
参考書目を識別するための番号(基準は問わない)。 type 属性でその識別方式や基準を表す。
<imprint>
参考書目の出版・配布に関する情報をまとめたもの。
<index>
索引化する語句の位置をマークする。属性は、主な形、第二から第四レベルの語句を索引に入れるために使う。
<interp>
テキストの語句とリンク可能な注釈。属性には、 resp, type, value がある。
<interpGrp>
<interp> タグを集めたもの。
<item>
リスト項目。
<keywords> [TOP OF LIST]
テキストの主題や性質を特定するキーワードや語句のリスト。キーワードが(シソーラスでの)統制語ならば、それは scheme 属性で識別される。
<kw>
形式言語のキーワード。
<l>
韻文の(おそらく不完全な)1行。
<label>
リスト項目と関連したラベル。用語集では定義される語を指す。
<langUsage>
テキストに表された言語・副言語・レジスタ・方言等。
<lb>
特定の版(刷)のテキストでの新しい(印刷上の)行の始まり。
<list>
番号付き・番号なし、その他リストの形で並べた項目の連なり。
<listBibl>
すべての書誌的引用のリスト。
<mentioned> [TOP OF LIST]
言及されただけで使われていない語句を示す。
<milestone>
標準となる参照方式の変化によって示されるテキストの節の境界。属性には、 ed (edition) 、 unit (page その他) 、 n (new value) などがある。
<name>
固有名詞(句)。属性を使って、その種類を示したり、標準的な語形を記したり、独自の識別子により特定個人や物と関連づけたりすることができる。
<note>
注記・注釈。属性により、注記の種類・位置・典拠等を示す。
<notesStmt>
補注。書誌的記述の情報に加えてテキストに関する注記を集めたもの。
<num>
数字・番号。書式を問わない。標準的な値を value 属性で示す。
<opener>
分節の初め(特に手紙の最初)に置く datelinebylinesalutation の類の句の集合。
<orig> (original form)
原文での読み方。正規化した形は、 reg (regularized form) 属性で表す。
<p> [TOP OF LIST]
散文の段落(パラグラフ)。
<pb>
標準とした参照方式でのページの区切り目。
<principal>
電子テキストの作成にあたっての代表研究者名。
<profileDesc>
テキストの非書誌的な側面を詳細に記述したもの。特に言語や副言語、テキストの生み出された状況、関係者とその背景など。
<projectDesc>
電子テキストファイルをマーク付けした目的・ねらいを詳細に記述したもの。併せてテキストを収集した過程に関する関連情報を表す。
<ptr>
ポインタ。識別可能な要素(単数・複数)によって現在の文書の他の場所を指し示したもの。
<publicationStmt>
電子テキストその他の出版・配布に関する情報の集合。
<publisher>
出版社。参考書目の出版・配布の代表組織名。
<pubPlace>
参考書目の出版地名。
<q>
引用・引用らしきもの。
<ref>
参照。識別要素(単数・複数)によって、現在の文書中の他の場所を参照する。テキストやコメントを加えた形になっている場合もある。(→ ptrxref
<refsDecl>
本文について規範的参照を構成する方法を記す。
<reg>
一応「正規化・標準化」された読み方。原文の読み方は、 orig 属性で示す。
<rendition>
要素(単数・複数)の意図的な字体変更等についての情報。
<resp>
内容等の責任・保証について述べた句。
<respStmt>
著者・編集者等の専用要素には当てはまらないが、テキスト・編集・記録・叢書編纂等の代表者についてその責任・保証を記載したもの。
<revisionDesc>
電子ファイルの更新履歴。
<row>
表の1行。
<rs> (referring string)
多目的な名前(分類名称)や参照語句。属性には、その型・標準的な形・独自の識別子による特定個人(物)との関連を示す。
<s> (sentence unit) [TOP OF LIST]
文書を文などの単位に分けたもの。本文全体に及ぶ単純な規範的参照を行うために用いる。
<salute>
挨拶・頭語(結語)。緒言・献辞その他のテキスト区分の前、あるいは書簡・序等の結びに置かれる。
<samplingDecl>
コーパスや叢書を編纂する際にテキスト選定を行った根拠と方法を記したもの。
<seg>
ポインタで参照指示できるように、文書中に作ったテキスト・区分を特定する。 type 属性によって分類する。
<series>
書物や参考書目を含む叢書の情報。
<seriesStmt>
叢書の情報をまとめたもの。
<sic>
原文のママ。不正確に思われる原文の字句をそのまま写したもの。
<signed>
緒言・献辞その他のテキスト区分に添えられた結びの挨拶・署名など。
<soCalled>
いわゆる。著者・語り手が強調引用符 (scare quotes) やイタリック体を使って、内容は保証の限りでないことを表した語句。
<sourceDesc>
電子テキストの元になった原文の書誌的記述。
<sp> (speech)
脚本での会話。または散文・韻文での会話部分。話し手を who 属性で表す。
<speaker>
脚本の話し手の名前を示す特別な形のヘッダ、ラベル。
<sponsor>
(電子テキスト作成計画の)スポンサーとなる組織・機関の名称。
<stage>
脚本で舞台指示を行うト書き。
<table>
表。行と列から成る一覧表形式のテキスト。
<tagsDecl>
SGML 文書に加えるタグ付けについての詳細。(→ tagUsage
<tagUsage>
TEI 準拠の文書で最も外側の <text> 要素中での特定の要素の使用法を示す。(→ tagsDecl
<taxonomy>
分類体系。書誌的引用によって指示に代えるか、または構造的な分類体系によって明示したテキストの類型。
<term>
専門用語とされる(一連の)語句または記号によって指示したもの。
<textClass>
テキストの主題・性質を、標準となる分類方式・シソーラス等によって記述した情報の集合。
<time>
時間を表す語句。書式は問わない。標準的な値は、 value 属性で示す。
<title>
論文・書籍・記事・叢書等の標題。それに代わる題・副題を含む。
<titlePage>
テキストの扉ページ。前文もしくは後付の中に現れる。
<titlePart>
扉に示される作品の標題を細分したもの。文書の標題・著作権(帰属)表示等には属さず、扉の自由な場所に置かれる。
<titleStmt>
作品の標題とその内容保証に関する情報(解題)をまとめたもの。
<trailer>
終わり見出し。本文の最後の節に現れる末尾の標題・フッタ。
<unclear>
未詳の意。原文が判読(読み取り)不能で、確信を以て書き写せない語句・段落。
<xptr> [TOP OF LIST]
現在の文書内の他の場所、または外部文書を指示するポインタ。
<xref>
参照。識別要素(単数・複数)によって、現在の文書中の他の場所、または外部文書を指示するポインタ。テキストやコメントを加えた形になっている場合もある。(→ ptrref

[TOP]

22 リファレンス

この付録には、 SGML と関連主題の書誌的参照リストを挙げている。「13 書誌的引用」で述べた <bibl> 要素の使い方を示す例にもなっている。


  <listBibl>
  
  <bibl>
  ALA (American Library Association).  
  <title>ALA-LC Romanization Tables:  Transliteration Schemes
  for Non-Roman Scripts</title>, 
  approved by the Library of Congress and the American Library
  Association, tables compiled and edited by Randall K. Barry.
  Washington:  Library of Congress, 1991.
  </bibl>
  
  <bibl>ANSI (American National Standards Institute).  
  <title>ANSI X3.4-1986.  American National Standard for
  Information Systems --- Coded Character Sets --- 7-bit
  American National Standard Code for Information
  Interchange (7-bit ASCII).</title>
   [New York]:  ANSI, 1986.
  </bibl>
  
  <bibl>
  <author>Barnard, David, et al.</author>
  <title level=a>SGML-Based Markup for Literary Texts.</title>
  <title>Computers and the Humanities</title>
  <biblScope>22 (1988):  265-76.</biblScope>
  </bibl>
  
  <bibl>
  <author>Barron, David</author>
  <title level=a>Why use SGML?</title>
  <title>Electronic Publishing
  Origination, Dissemination and Design</title>
  <biblScope>2.1 (April 1989):  3-24.</biblScope>
  </bibl>
  
  <bibl>
  <author>Coombs, James H., Allen H. Renear, and
  Steven J. DeRose.</author>
  <title level=a>Markup Systems and the Future of
  Scholarly Text Processing.</title>
  <title>Communications of the ACM</title>
  <biblScope>30.11 (November 1987):  933-947.</biblScope>
  </bibl>
  
  <bibl>
  <editor>Cover, Robin C., et al.</editor>
  <title>A Bibliography on Structured Text:
  Technical Report 90-281</title>
  <publisher>Queen's University,</publisher>
  <pubPlace>Kingston, Ont.</pubPlace>
  <date>June 1990</date>
  <note place=inline>A current version of this bibliography
  is maintained at
  <code>http://www.sil.org/sgml/sgml.html</code>.
  </bibl>
  
  <bibl>
  Goldfarb, Charles F., 
  <title>The SGML Handbook.</title>
  Oxford:  Clarendon Press, 1990.
  </bibl>
  
  <bibl>
  <author>van Herwijnen, Eric.</author>
  <title>Practical SGML.</title>
  <publisher>Kluwer Academic Publishers</publisher>
  <date>1990; 2d ed. 1994.</date>
  </bibl>
  (*邦訳『実践 SGML 』日本規格協会 1992)
  
  <bibl>ISO (International Organization for 
  Standardization).
  <title>ISO 8859-1:  1987 (E).  Information processing
  --- 8-bit Single-Byte Coded Graphic Character Sets ---
  Part 1:  Latin Alphabet No.1.</title>
   (<title>Traitement de l'information --- Jeux de caracte
   ``res graphiques cod&eacute;s sur un seul octet ---
  Partie 1:  Alphabet latin no1.</title>)
  First edition --- 1987-02-15.  [Geneva]: 
  International Organization for Standardization, 1987.
  </bibl>
  
  <bibl>
  ISO (International Organization for Standardization).
  <title>ISO 8879-1986 (E).  Information processing 
  --- Text and Office Systems --- Standard Generalized 
  Markup Language (SGML).</title>
  First edition --- 1986-10-15.  [Geneva]:  International 
  Organization for Standardization, 1986.
  </bibl>
  
  <bibl>
  ISO (International Organization for Standardization).
  <title>ISO 8879:1986 / A1:1988 (E).  Information 
  processing --- Text and Office Systems --- Standard 
  Generalized Markup Language (SGML), Amendment 1.</title>
  Published 1988-07-01. [Geneva]: 
  International Organization for Standardization, 1988.
  </bibl>
  
  <bibl>
  ISO (International Organization for Standardization).
  <title>ISO/TR 9573-1988(E).  Information processing
  ---SGML support facilities---Techniques for using SGML.
  </title>
  Final text of 1988-09-12.
  </bibl>
  
  <bibl>
  ISO  (International Organization for Standardization), 
  and IEC(International Electrotechnical Commission). 
  <title>ISO/IEC 10646-1:1993.  Information technology 
  --- Universal Multiple-Octet Coded Character Set (UCS) 
  --- Part 1:  Architecture and Basic Multilingual Plane.
  </title>
  [Geneva]:  International Organization for
  Standardization, 1993.
  </bibl>
  
  <bibl>ISO (International Organization for
  Standardization), and IEC (International 
  Electrotechnical Commission).
  <title>ISO/IEC 10744: 1992.  Information
  Technology --- Hypermedia/Time-based Structuring 
  Language (HyTime).</title>
  [Geneva]:  International Organization for 
  Standardization, 1992.
  </bibl>
  
  <bibl>
  Langendoen, D. Terence, and Gary F. Simons.
  <title level=a>A Rationale for the TEI
  Recommendations for Feature-Structure Markup.
  </title>
  <title>Computers and the Humanities</title>
  (1995; in press).
  </bibl>
  
  <bibl>
  <author>Warmer, J., and S. van Egmond</author>
  <title level=a>The implementation of the Amsterdam 
  SGML parser.</title>
  <title>Electronic Publishing Origination, 
  Dissemination and Design</title>
  <biblScope>2.2 (July 1989):  65-90.</biblScope>
  </bibl>
  
  </listBibl>