2013-02-01から1ヶ月間の記事一覧

stanford POS tagger をPythonで呼び出すまとめ

Stanford POS tagger といえば、最大エントロピー法を利用したPOS Taggerだが(知ったかぶり)、これはjavaで書かれている。 それはいいとして、Pythonで呼び出すには、すでになかなか便利な方法が用意されている。Pythonの自然言語処理パッケージのnltkを使…

大規模サーバーでjavaを実行するときにうまいことメモリを確保する

こう書いておけばいいらしい。 server -XX:+AggressiveHEAP http://d.hatena.ne.jp/koichiarchi/20071127/1196143106

まゆゆの「やびゃあ」を推定するタスクに挑んでみた。

要旨渡辺麻友とは、国民的なアイドルグループAKB48の人気メンバーであり、特に若者層から絶大な支持を受けている大物スターアイドルである。(以下、渡辺麻友のことを、通称「まゆゆ」と表現する)ある調べによると[1]、日本国民の5分の1は彼女を何らかの…

gitignoreというもの

.gitignoreというものを知った(初心者にはありがち?)要は「更新を無視するファイルリスト」と考えたらいいらしい。emacsで編集するときに発生するファイル名~とか、pythonのファイル名.pycとかをここに表記するようだ。(知らなかった)http://www.omakas…

PythonでKNPのパーサーを書いてみた

他の用事で使うことがあったのを、焼き増ししただけのコード。 でも一応は動いている。特にjumanとKNPの呼び出しなんかは標準入出力を使っているあたりにサボリが見られる。 ほんとは http://blog.higasy.net/?p=11 みたいにサーバーモードで呼び出しできた…

リストの最後にアクセスするには

滅多に使わないから忘れていたが、Pythonの配列では−のインデックスが利用できる。なので、最後の要素にアクセスしたいなら、-1とすればいいわけだ。例 >a = [1,2,3]>a[-1] 3とね。

マークダウンのリアルタイム確認

マークダウンの記法はまだそこまで頭に入ってなくって..いちいち調べて確認...は非常にめんどうな作業だった。でも、「もしかしたら、リアルタイムでhtml表示してくれるeditorとかあるんじゃね?」と思って調べてみたら、やっぱりあった。 ありがとう。どこ…