2013-01-01から1年間の記事一覧

Bitbucketからリポジトリ削除して、新しくpushするまでのまとめ

コードの共有をするためにBitbucketを使っている(Gitリポジトリをそのまま使える。っていうくらいの認識しかないが)けど、何をとち狂ったか、前回のpush時に巨大モデルファイル(少なくとも3GB超)をいくつもpushしてしまった。単純に.gitignoreを書き忘れ…

リストのコピーをするには?

要は[:]を使えばいいらしい. コピーもとがls_orgで,コピー先がls_targだった場合, ls_targ = ls_org[:]でリストの内容はまるまるコピーされる.ただし,二次元配列のときはちょっと違うようだ.詳しくは http://tsuchiya-yoshihiro.blogspot.jp/2008/03/p…

Emacsをpythonでより快適に。しようとして、すべてマニュアルインストールしたまとめ

EmacsでPythonの自動補完をしようとした。ので、その時のまとめを書いてみる。まずは手動インストールを試みる。 http://www.sakito.com/2012/11/emacs-python-jedi.htmlなんか、すげー簡単そうに書いてあるけども、実際はぜんぜん簡単ではない。 この人の場…

stanford POS tagger をPythonで呼び出すまとめ

Stanford POS tagger といえば、最大エントロピー法を利用したPOS Taggerだが(知ったかぶり)、これはjavaで書かれている。 それはいいとして、Pythonで呼び出すには、すでになかなか便利な方法が用意されている。Pythonの自然言語処理パッケージのnltkを使…

大規模サーバーでjavaを実行するときにうまいことメモリを確保する

こう書いておけばいいらしい。 server -XX:+AggressiveHEAP http://d.hatena.ne.jp/koichiarchi/20071127/1196143106

まゆゆの「やびゃあ」を推定するタスクに挑んでみた。

要旨渡辺麻友とは、国民的なアイドルグループAKB48の人気メンバーであり、特に若者層から絶大な支持を受けている大物スターアイドルである。(以下、渡辺麻友のことを、通称「まゆゆ」と表現する)ある調べによると[1]、日本国民の5分の1は彼女を何らかの…

gitignoreというもの

.gitignoreというものを知った(初心者にはありがち?)要は「更新を無視するファイルリスト」と考えたらいいらしい。emacsで編集するときに発生するファイル名~とか、pythonのファイル名.pycとかをここに表記するようだ。(知らなかった)http://www.omakas…

PythonでKNPのパーサーを書いてみた

他の用事で使うことがあったのを、焼き増ししただけのコード。 でも一応は動いている。特にjumanとKNPの呼び出しなんかは標準入出力を使っているあたりにサボリが見られる。 ほんとは http://blog.higasy.net/?p=11 みたいにサーバーモードで呼び出しできた…

リストの最後にアクセスするには

滅多に使わないから忘れていたが、Pythonの配列では−のインデックスが利用できる。なので、最後の要素にアクセスしたいなら、-1とすればいいわけだ。例 >a = [1,2,3]>a[-1] 3とね。

マークダウンのリアルタイム確認

マークダウンの記法はまだそこまで頭に入ってなくって..いちいち調べて確認...は非常にめんどうな作業だった。でも、「もしかしたら、リアルタイムでhtml表示してくれるeditorとかあるんじゃね?」と思って調べてみたら、やっぱりあった。 ありがとう。どこ…

日本手話におけるうなずきと接続詞の分析

堀内靖雄 亀崎紘子 西田昌史 黒岩真吾 市川薫 信学技報 2008-5 pp.91-96 要旨 うなずきには後続くうなずきと同期うなずき(通常は「うなずき」と表記)の2種類がある。 後続うなずきは、単語を表現したあと、少し遅れてうなずくこと。 同期うなずきは、単語…

手話の認知学的研究

神田和幸 情報福祉論文特集 電子情報通信学会誌 Vol. J90-D No.3 pp.609-616 2 手話使用者と手話の種類について 日本では純粋な聾者というのは少ない。聾者の定義はまったく存在せず、本人の自覚によるもののみ。 だから、日本手話だと聾者が申告しても、実…

リストの要素を逆順にソートする

リスト型配列がlstだった場合、lst.reverse()とすると逆順にソートされる。 意外に忘れがちなので、便利http://www.python-izm.com/contents/application/reverse.shtml

gitでよく使うんだけど、よく忘れてしまうコマンドまとめ

ま、なんだかんだいって一番使うのは $ git push -u origin masterと$ git pullなんだけどね。 でも、あとのコマンドもやっぱり大切なので、 http://sourceforge.jp/magazine/09/03/16/0831212/5後は他の人のリポジトリに関係すること・他の人からの提案につ…

サーバーでKNPのコンパイルが通らないときのまとめ

http://twitter.com/niam/status/20722221425のように、サーバー上でKNPを構築しようとすると、普通通りにいかない。 原因は、TinyCDBのインストール場所がKNPの想定と異なる場所にあるから。そこで、 http://www.shirayu.net/diary/0724.htmlのようにconfig…

Pythonの文字列削除について

Pythonで標準的に用意されている文字列削除のコマンドといったら、 lstrip rstrip stripあたりがよく使われるんだろうが、私は大きな勘違いをしていた。 というのもstripを使えば、文字列の中にあるすべてに対してその処理をしてくれるもんだと思っていたが…