2013-10-01から1ヶ月間の記事一覧

関西女性の話し方はどうしておもしろいのか?

吹田市にある国立民族博物館に行った時に,偶然にも「ウィークエンドサロン 研究者と話そう」という企画をやっていたので,話を聞いてきた.講演者は民族博物館で機関研究員の金田純平研究員. 金田純平 | 国立民族学博物館講演の主な内容(ここ から引用) …

作業効率アップのためのキー操作

特によく使うGoogle Chromeについて Mac のキーボード ショートカット - Chrome ヘルプMacのウィンドウ切り替えについて アプリ間の切り替えと,同一アプリ間でのウィンドウ切り替えについて 【Mac】ウインドウを切替えるショートカットは変更した方が絶対い…

オランダ語民話データベースからお話本文だけを取得する

オランダ語が(ふつうの人は)わからないので,Googleページ翻訳を使ってページ丸ごと翻訳をオススメするオランダ語民話データベースは Nederlandse Volksverhalenbank具体的なお話はNederlandse Volksverhalenbank | Blader door items 検索オプションをNed…

Gensimを使ったトピック単語抽出 LSAを使ったトピック語抽出まで

以前,ちょろっとだけGensimを使ったことがあったんだけど,久しぶりに本格的に使うことになりそうなので,メモに残しておく Gensimでのコーパスの作り方 - kensuke-miの日記 gensim 文章をベクトル空間にする方法 - kensuke-miの日記インストールができてな…

Word sense disambiguityに関するサーベイ

ペルシア語とオランダ語の単語間(クエリを利用した)翻訳をやりたくて,ちょっとサーベイしていた. ↑絶対,こんなことやろうとしている人間はこれまで1人もいないと断言できる.で,サーベイ中に,こんなpaperを発見してしまった. Word Sense Subjectivi…

昔話の構造分解に関するサーベイ

特に昔話の構造分析では,AT (ATU) 分類が非常に信頼度が高い分類として扱われているらしいので,今回はこれに絞ったサーベイを.ATU分類の概要Anti AarneとStith Tompsonによる分類がAT index(AT分類) 少し前まで(昔話の研究では)世界的に認められてきた…

GUIでも動かせるアノテーションツール

係り受け木のアノテーションを行いたかったので,GUIで動かせるようなアノテーションツールを探していた.すると,こんなツールがあるらしい. brat rapid annotation tool

Perlexの動詞活用に登場する謎の記号について

Perlexの動詞屈折辞には謎の記号が出現する. 例えば3sgPreSubjNegFam n ↙e n £e 2*3plPreSubjNegFam n ↙n n £nのように. はじめはまったく意味がわからなかったのだが,ようやく意味がわかったので,ここに書き記しておく.端的に書くと,「謎の記号は動詞…

Perlexの文字コードが変な件について

前にも何度か紹介したが,lexiconのperlexは屈折辞の展開がされた後は文字化けがおきている.前の記事では,後でpythonスクリプトで修正する方法をとっていたが,特にqとŕで無理があるやり方だった.しかも,その後でまた変な文字化けを見つけたし...(要…

双対分解を理解するノート

元々の発端は http://aclweb.org/anthology/P/P13/P13-2004.pdf 岡野原さんによるレポート http://research.preferred.jp/2010/11/dual-decomposition/双対分解とは,argmax_y( g(y) + h(y) )が解けなくても(NP完全だから),argmax_z,y( g(z) + h(y) ) st. z…

「モーセ5書の成立」を読んだノート

大修館書店の「言語」03年12月号から 大修館書店モーセ5書の成立を紹介している記事.そもそもモーセ5書とは? 旧約聖書の最初の5文書のことを指す.具体的には「創世記,出エジプト記,レビ記,民数記,申命記」のこと. この5書はユダヤ教では別格で…

特集記事:「旧約聖書の言語」のまとめノート

研究室に大修館の「言語」が並んでいるのをふと見た.松本先生が「言語」を愛読しており,バックナンバーが全部そろっているのだとか. ぼくも何冊か読んだことがあるが,(自然)言語好きにはたまらない雑誌だろう. それだけに廃刊になったのは残念.とこ…