2015-03-03から1日間の記事一覧

nltkでタプルのbigramカウントをする

やりたいこと (word, POS)のタプルの状態でbi-gramのカウントを取りたい 解決法 nltkで普通にできた。 import nltk list_input = [('I', 'Noun'), ('feel', 'Verb'), ('happy', 'Adj'), ('You', 'Noun'), ('feel', 'Verb'), ('happy', 'Adj')] corpus = nltk…

スゴいと噂のsparkを動かしてみる

やりたいこと sparkとかいう分散処理系の何かがスゴいらしいので、とりあえず動かしてみたい sparkって何ができるの?? 一言「分散処理」 ただ、分散処理でも、Hadoopと違って、ストレージに保存せずにon memoryで分散処理を実行できる いちいちストレージ…

sbtでプロジェクト管理をする話

やりたいこと scalaのプロジェクトを管理したい。 (なんだかよくわからないけど、みんながsbtを使っているので、自分も使ってみたい。) やってみたこと sbtのインストール macなら、 brew install sbt まあ、公式マニュアルの通りなんですけどね。 sbtで管…