PersianDependencyTreebankをMaltParserで学習させてみた。

見方がよくわからない….orz

1 به به PREP PREP attachment=ISO|senID=23472 26 ADV _ _
2 گزارش گزارش N IANM attachment=ISO|number=SING|senID=23472 1 POSDEP _ _
3 خبرنگار خبرنگار N ANM attachment=ISO|number=SING|senID=23472 2 MOZ _ _

のようになっている。(環境によっては右から表示になっているが…)

この解析結果の見方がわからない。
次のタスクは
> このTreebankの仕様書を読んで理解すること


Malt ParserをPersian Dependencyで学習させて、その評価がよくわからなかったので、試しに使ってみることにする。

今回はPersianDependencyTreebank/Data/2nd Representation (Automatic Conversion)にある2ndを利用する。(何が2ndがよーわからんけど)

学習結果のデータはmaltparserフォルダの中のper_depに出力されるはず。
あとはテスト用に自分で加工したデータがmaltparserフォルダ以下のfarsi_testにある。
これを評価する。
java -jar maltparser-1.7.2.jar -c test -i examples/data/talbanken05_test.conll -o out.conll -m parse

のパラメータを変更すれば、テストデータを評価できる。

たぶん