perlexを読み解く
Perlexはペルシア語向けに作成された語彙辞書システムのことである.
Alexinaという語彙辞書フレームワークの上に構築されており,2013年現在では,間違いなく無料で使用できる最大の言語資源である.
しかし,このperlexの最大の欠点は,「説明がないこと」,つまり,documentが用意されていない.READMEには「no ducumentation」と自ら明言する始末.(READMEを見た瞬間「いや,書けよ」というツッコミをしてしまった)
なので,今回は,この辞書の意味を読み解いていく.
あまりにも,ファイルが多すぎるのだが,屈折を指示するファイルからその意味を考えて見ようと思う.
perlexにはmorph.faというファイルがあり(もちろんのごとく説明はない),xmlで記述されており,屈折辞が記述されている.
そこから意味を探ろうと思う.
まず前回,意味が不明瞭だったPreteritタグから.Preteritタグは
<form suffix="m" tag="1sgPreterit"/> <form suffix="y" tag="2sgPreterit"/> <form suffix="" tag="2*3sgPreterit"/> <form suffix="ym" tag="1plPreterit"/> <form suffix="yd" tag="2plPreterit"/> <form suffix="nd" tag="2*3plPreterit"/>
と記述されている.
ここから,Preteritタグは「過去分詞の屈折辞」と判明した.
では,Preparfは何か?というと,
<form suffix="eam" tag="1sgPreparf"/> <form suffix="ey" tag="2sgPreparf"/>
と,記述されている.つまり,「完了分詞の屈折辞」と判明.
では,過去分詞の屈折辞が混じっていたのは何だったのか?というと,
<form suffix="m" tag="1sgPreparfFam"/> <form suffix="y" tag="2sgPreparfFam"/>
となっている.つまり,完了形の屈折辞でも,口語の時は,過去分詞に似た屈折をする.ということらしい(いままで知らなかった)
さらに2*の意味は
<form suffix="e" tag="3sgPreparfFam"/> <form suffix="n" tag="2*3plPreparfFam"/>
を見る限り,「2つ目の候補」ということがわかる.
さらに新しくタグも見つかった.imperNormというタグがあった.例として,rftnのimperNormの活用された形を調べてみる.これを調べてみると,
brftyd (u'brftyd', u'V', u'rftn_____1', u'imperNormpl') brw (u'brw', u'V', u'rftn_____3', u'imperNorm')
なので,これは「命令形」ということがわかった.
さらにProhibNormというタグは,どうやら「禁止の命令形」を意味しているようだとわかる.ただ,ProhibNormFormというタグもあり,「一体これは何??」状態になっている.
さらにgerPresのタグ.
<form suffix="«an" tag="gerPres"/>
これは「使役を意味する」(ペルシア語では現在分詞の末尾にanを付けると,使役形の語根になる)
これでわかったこと一覧を改めて書いていく.
- infApocope イプシロン状態
- partPas(Neg) 接尾辞としてeがつく.
- partOblig 接尾辞としてnyがつく.
- {1,2,3}{sg, pl}Preterit(Neg)(Fam) 過去分詞の活用タグ
- {1,2,3}{sg, pl}Pastprog(Neg)(Fam) 直接法の過去分詞につくタグ
- {1,2,3}{sg, pl}Preparf(Neg)(Fam) 完了分詞につくタグ
- {1,2,3}{sg, pl}ImpComp(Neg) 直接法の完了形につくタグ
- {1,2,3}{sg, pl}PreInd(Neg)(Fam) 直接法現在形につくタグ
- {1,2,3}{sg, pl}PreSubj(Neg)(Fam) 接続法現在形につくタグ
- imperNorm(pl) 命令形につくタグ
- ProhibNorm(pl) 禁止表現につくタグ
- ProhibNormForm(pl) これも禁止表現だろうが,違いがイマイチわかってない
- partPres 接尾辞にnde「〜しながら」を意味する表現
- gerPres 接尾辞にan 使役の表現
- {1,2,3}{sg,pl}Irrel(Neg)(Fam) bwdnのみに使用するタグ.直接法とbwdnの活用.