Correcting Comma Errors in Learner Essays, and..
Correcting Comma Errors in Learner Essays, and Restoring Commas in Newswire Text
コンマについての熱い情熱が伝わる論文。
コンマが抜けてる文にコンマを挿入したり、コンマを使いすぎてる文からコンマを削除する。というのがひとつ。
二つ目は、コンマを誤って使ってるのを訂正、なんだけど、それって一つ目とどう違うの?というのがわかっていない。
一つ目はstate-of-art、二つ目はnovelだと言ってる。
訓練は毎度おなじみCambridge Learner Corpusで、Non-Nativeの人の文。
コンマがどういう時に使われるのか?を頑張って類別していたり(table 1)、ちょうどいい訓練データがなかったので、コーパス自作しました(6 Annotation)って話だったり、苦労が忍ばれる。
(訓練はCambridge Learnerじゃないの?と思ったが、6 Annotationの内容は二つ目のタスク用らしい)
新規な内容をやろうとするとなかなか大変やね。という内容でした。
ちなみに、コンマを正しい位置に付与できれば、パージングの精度も上がるそうで、「これからそこのとこがんばりたいね」って締めくくっている。