perlexを読み解く

Perlexはペルシア語向けに作成された語彙辞書システムのことである.

Alexinaという語彙辞書フレームワークの上に構築されており,2013年現在では,間違いなく無料で使用できる最大の言語資源である.

しかし,このperlexの最大の欠点は,「説明がないこと」,つまり,documentが用意されていない.READMEには「no ducumentation」と自ら明言する始末.(READMEを見た瞬間「いや,書けよ」というツッコミをしてしまった)

なので,今回は,この辞書の意味を読み解いていく.

あまりにも,ファイルが多すぎるのだが,屈折を指示するファイルからその意味を考えて見ようと思う.

perlexにはmorph.faというファイルがあり(もちろんのごとく説明はない),xmlで記述されており,屈折辞が記述されている.

そこから意味を探ろうと思う.

まず前回,意味が不明瞭だったPreteritタグから.Preteritタグは

    <form suffix="m" tag="1sgPreterit"/>
    <form suffix="y" tag="2sgPreterit"/>
    <form suffix="" tag="2*3sgPreterit"/>
    <form suffix="ym" tag="1plPreterit"/>
    <form suffix="yd" tag="2plPreterit"/>
    <form suffix="nd" tag="2*3plPreterit"/>

と記述されている.
ここから,Preteritタグは「過去分詞の屈折辞」と判明した.

では,Preparfは何か?というと,

    <form suffix="eam" tag="1sgPreparf"/>
    <form suffix="ey" tag="2sgPreparf"/>

と,記述されている.つまり,「完了分詞の屈折辞」と判明.
では,過去分詞の屈折辞が混じっていたのは何だったのか?というと,

    <form suffix="m" tag="1sgPreparfFam"/>
    <form suffix="y" tag="2sgPreparfFam"/>

となっている.つまり,完了形の屈折辞でも,口語の時は,過去分詞に似た屈折をする.ということらしい(いままで知らなかった)

さらに2*の意味は

    <form suffix="e" tag="3sgPreparfFam"/>
    <form suffix="n" tag="2*3plPreparfFam"/>

を見る限り,「2つ目の候補」ということがわかる.

さらに新しくタグも見つかった.imperNormというタグがあった.例として,rftnのimperNormの活用された形を調べてみる.これを調べてみると,

brftyd (u'brftyd', u'V', u'rftn_____1', u'imperNormpl')
brw (u'brw', u'V', u'rftn_____3', u'imperNorm')

なので,これは「命令形」ということがわかった.

さらにProhibNormというタグは,どうやら「禁止の命令形」を意味しているようだとわかる.ただ,ProhibNormFormというタグもあり,「一体これは何??」状態になっている.

さらにgerPresのタグ.

    <form suffix="&#171;an" tag="gerPres"/>

これは「使役を意味する」(ペルシア語では現在分詞の末尾にanを付けると,使役形の語根になる)

これでわかったこと一覧を改めて書いていく.

  • infApocope イプシロン状態
  • partPas(Neg) 接尾辞としてeがつく.
  • partOblig 接尾辞としてnyがつく.
  • {1,2,3}{sg, pl}Preterit(Neg)(Fam) 過去分詞の活用タグ
  • {1,2,3}{sg, pl}Pastprog(Neg)(Fam) 直接法の過去分詞につくタグ
  • {1,2,3}{sg, pl}Preparf(Neg)(Fam) 完了分詞につくタグ
  • {1,2,3}{sg, pl}ImpComp(Neg) 直接法の完了形につくタグ
  • {1,2,3}{sg, pl}PreInd(Neg)(Fam) 直接法現在形につくタグ
  • {1,2,3}{sg, pl}PreSubj(Neg)(Fam) 接続法現在形につくタグ
  • imperNorm(pl) 命令形につくタグ
  • ProhibNorm(pl) 禁止表現につくタグ
  • ProhibNormForm(pl) これも禁止表現だろうが,違いがイマイチわかってない
  • partPres 接尾辞にnde「〜しながら」を意味する表現
  • gerPres 接尾辞にan 使役の表現
  • {1,2,3}{sg,pl}Irrel(Neg)(Fam) bwdnのみに使用するタグ.直接法とbwdnの活用.