読者です 読者をやめる 読者になる 読者になる

文書分類タスクでよく利用されるfeature selection

"Bias Analysis in Text Classification for Highly Skewed Data"(Lei and Huan)を読んでいて、「文書分類タスクでよく使われるfeature selectionは4つある。Information GainとChi-squared testとOdds ratioとBi-Normal Separationだ」みたいなことが書い…

twitterの情報拡散(retweet数予測モデル)に関する研究

twitterでの情報拡散系を知りたくて、関連する研究を漁っていたら、"A stochastic model of the tweet diffusion on the Twitter network"というのを見つけた。(いきなりこの論文を見つけたわけでなく、著者本人よる簡単な日本語要旨があったので、そっから…

twitterから有用な情報を発信するユーザーを発見する研究

やりたいこと Twitterネットワークの中から、「役にたつ(とtwitterユーザーが考える)」情報を発信するユーザーを発見したい。 そこで、この目的の研究を探してみた。 Twitterにおけるフォローに関する影響力に基づくハブ度の推定 以下、読んでみたメモ…

英語論文の論理関係語

論文書くときには論理関係に気を配らないといけない. 論理関係をはっきりさせるのには,接続詞の正しい使い方が必要不可欠だ.普段,話しことばで使っているいる英語とはたいぶ異なる. 頭がいい人は,論理関係を示す英語をきちんと頭に入れているのだが,…

Semi-Supervised Representation Learning for Cross-Lingual Text Classificationを読んだメモ

Min Xiao and Yuhong Guo, ACL 2013 1 この論文の要旨 要は,多言語文書分類. 従来のやり方だと,単語辞書を使うとか,MTシステムを使うとか,LDAで対訳トピックを抽出して選択的な翻訳をするだとか.そういった方法が使われてきた. この論文では,二段階…

Introducing PersPred, a syntactic and semantic database for persian complex predicates

ここ数日かけてじっくり読んだ論文.pdfはACL anthologyにあがってる 「次にどんな研究しようかな?」っていう漠然とした気分から,とりあえず最新だし読んでみた. NAACLのMulti Word Expressionのworkshopに投稿された論文.松本先生がペルシア語の複合動…

Word sense disambiguityに関するサーベイ

ペルシア語とオランダ語の単語間(クエリを利用した)翻訳をやりたくて,ちょっとサーベイしていた. ↑絶対,こんなことやろうとしている人間はこれまで1人もいないと断言できる.で,サーベイ中に,こんなpaperを発見してしまった. Word Sense Subjectivi…

英語論文を書くときのTips

言い回しの表現を見たいときはここなど http://www.gfd-dennou.org/member/hiroki/homepage/english/english.html直前になって、知っておきたいことは http://www.phontron.com/paper-guide.phpただし、引用符の中にピリオド。っていうのはどっちでも良い(…

日本手話におけるうなずきと接続詞の分析

堀内靖雄 亀崎紘子 西田昌史 黒岩真吾 市川薫 信学技報 2008-5 pp.91-96 要旨 うなずきには後続くうなずきと同期うなずき(通常は「うなずき」と表記)の2種類がある。 後続うなずきは、単語を表現したあと、少し遅れてうなずくこと。 同期うなずきは、単語…

手話の認知学的研究

神田和幸 情報福祉論文特集 電子情報通信学会誌 Vol. J90-D No.3 pp.609-616 2 手話使用者と手話の種類について 日本では純粋な聾者というのは少ない。聾者の定義はまったく存在せず、本人の自覚によるもののみ。 だから、日本手話だと聾者が申告しても、実…

A Comparison of Features for Automatic Readability Assessment

今週のお題「文化祭や学園祭の思い出」ふと、思ったので書いてみると、文化祭や学園祭とかそういうものにいい思い出がない。 なぜだか、この時期になると死にゃあしないけど、それなりに苦しい病気にかかることが多かったからだ。 じゃあ、代わりに剣道でも…

Building Readability Lexicons with Unannotated Corpora

Building Readability Lexicons with Unannotated Corpora Brooke, Julian et.al 2012 NACCL,Predicting and improving text readability for target reader populationsきょうのは単語の面からReadability評価に欠かせないlexiconを自動でつくっちゃう話。○…

Unsupervised Identification of Persian Compound Verbs

Unsupervised Identification of Persian Compound Verbs Mohammad Sadegh Rasooli and Heshaam Faili and Behrouz Minaei-Bidgoli MICAI (1)'11○ざっくり概要「ペルシア語の複合動詞を検出しよう」というタスク 使った手法はBootstrapとK-menas法いろいろ試…

Automatic analysis of syntactic complexity in second language writing

Automatic analysis of syntactic complexity in second language writing Xiaofei Lu International Journal of Corpus Linguistics, 15(4):474-496. 英語学習者の書いたエッセイを評価するシステムの設計について書かれた論文。 実際にシステムを作成して…

Computing and Evaluating Syntactic Complexity Features for Automated Scoring of Spontaneous Non-Native Speech

Chen, Miao Zechner, Klaus The 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies 2011 きょうのは構文の難しさの評価尺度を使って、speech(Non-native)にも応用をかけてみましょうよ。という話。writin…

A Basic Language Resource Kit for Persian

A Basic Language Resource Kit for Persian Mojgan Seraji, Bea ́ta Megyesi, Joakim Nivre Uppsala University, Department of Linguistics and Philologyざっくりまとめると、いままで数も少なく、あったとしても有料なことが多い、そんなペルシア語のツ…

Sign language machine translation overkill

CICPの役に立ちそうな論文探しをしていたら、先生が紹介してくださった論文。どうやって自然入力文を手話の表記に翻訳するか?を機械翻訳の手法を用いてみた。という内容。 対象はドイツ語→ドイツ手話。ドイツ手話にはお天気予報を元にデータを起こしたRWTH-…

Correcting Comma Errors in Learner Essays, and..

Correcting Comma Errors in Learner Essays, and Restoring Commas in Newswire Textコンマについての熱い情熱が伝わる論文。コンマが抜けてる文にコンマを挿入したり、コンマを使いすぎてる文からコンマを削除する。というのがひとつ。二つ目は、コンマを…