2015-03-01から1ヶ月間の記事一覧

早く、簡単に共起語ペアの頻度を数える

やりたいこと 共起語ペアのカウントを取りたい。 単に基礎集計をやりたいだけなので、matrixを作る必要はない。 解決策 タプルで共起語ペアを作って、カウントする 手順は 共起語のタプルを作って、リストに放り込んでいく collection::Counter.most_common(…

MeCabの制約付き解析モードを利用する

MeCabの制約付き解析モードを利用する やりたいこと 標準の辞書だけだと、どうしても不要な単語まで分割してしまう。 かといって、辞書ファイルの内容をいじるのは割と手間がかかる作業だ。 そこで、「制約つき解析モード」を利用することにした。工藤さんに…

USERS 顧客主義の終焉と企業の命運を左右する7つの戦略 を読んだ

「USERS 顧客主義の終焉と企業の命運を左右する7つの戦略」を読んだ USERS 顧客主義の終焉と企業の命運を左右する7つの戦略作者: アーロン・シャピロ,萩原雅之,梶原健司,伊藤富雄出版社/メーカー: 翔泳社発売日: 2013/09/03メディア: 単行本(ソフトカバー)…

nltkでタプルのbigramカウントをする

やりたいこと (word, POS)のタプルの状態でbi-gramのカウントを取りたい 解決法 nltkで普通にできた。 import nltk list_input = [('I', 'Noun'), ('feel', 'Verb'), ('happy', 'Adj'), ('You', 'Noun'), ('feel', 'Verb'), ('happy', 'Adj')] corpus = nltk…

スゴいと噂のsparkを動かしてみる

やりたいこと sparkとかいう分散処理系の何かがスゴいらしいので、とりあえず動かしてみたい sparkって何ができるの?? 一言「分散処理」 ただ、分散処理でも、Hadoopと違って、ストレージに保存せずにon memoryで分散処理を実行できる いちいちストレージ…

sbtでプロジェクト管理をする話

やりたいこと scalaのプロジェクトを管理したい。 (なんだかよくわからないけど、みんながsbtを使っているので、自分も使ってみたい。) やってみたこと sbtのインストール macなら、 brew install sbt まあ、公式マニュアルの通りなんですけどね。 sbtで管…

macでtreeコマンドを使う

やりたいこと macのコマンドラインでtreeコマンドを使う 解決策 まずはbrewでtreeをインストール % brew install tree 特定の階層数で制限をつけて表示するときは、--dirsfirstと-L 階層数のオプションをつけて実行する。 % tree -d --dirsfirst -L 2 試しに…