2013-07-01から1ヶ月間の記事一覧

CKYアルゴリズムの流れ

久しぶりにCKYチャートをいじることになって,「あれ,どことどこのマスが親を生成するんだっけ?」と,まあ,こうなってしまう.そこで,ちょっと探してみると,Yahoo知恵袋にこんな良解説がなされていたので,紹介.構文解析:CYKアルゴリズム 情報 数学 …

subcategorizationの概念

"The Lefff, a freely available and large-coverage morphological and syntactic lexicon for French", Benoît Sagot, 2010 を読んでいるときに出て来たのが"sub categorization"あれ,これ何だっけ?と思ったので復習がてらに[この本](http://www.amazon.…

拡張ラテン文字(latin-1)の入力方法(Ubuntu系)

前回はMac OSXでの入力方法について触れたが,ぼくはubuntuマシンも持っている関係上,ubuntuでもlatin-1が入力できるようにしないといけない.そこで,調べてみると.ubuntuではOSXのようにopt+aのような入力方法ではなく,補助インプットメソッドのiBusを…

拡張ラテン文字キーボードの使い方

ペルシア文字の翻字方法の検討 - kensuke-miの日記でも紹介したが,アラビア文字を計算機で効率的に扱うためにはラテン文字に置き換えてしまった方がよい. そこで,今回のぼくのアラビア文字→ラテン文字変換スクリプトの実装には多くのラテン文字を用いた.…

ペルシア文字の翻字方法の検討

計算機でアラビア文字を扱うのは正直いうとしんどい.文字が全体的に見にくいし,母音記号はハムゼは拡大しまくってやっと存在が見つかる.といったそんな印象. 見にくいと何が困るかって,目には見えてないけど,違う文字コードの系列になっていたら計算機…

ペルシア語の文字入力

誰得な内容ですが..ペルシア語を正しくコンピューターで扱う話.これがきちっと守れないと,「検索した単語が出てこない!」とか「レポート書いたけど,間違いだらけじゃないか!」という原因になるので,きちっと守りましょう.というお話です.実はアラ…

problem in handling Farsi ezafe characters

As you know, we concatenate words with Ezafe when two words have a relation of modifier word and modified word.But, You may not know the concatenation rule when the last character of modified word is HEH+HAMZA.In Arabic unicode set, HEH+HA…

威の飼い方2

(前回から) ヤフオクで格安ジャンク品のサブノートパソコンをHDD移植まで完了させたぼく!結果やいかに!スイッチを押してみると...そこに出ているメッセージを要約すると, 「カーネルがこのマシンのCPUに合ってないんだってば.適切なカーネルを使い…

威の飼い方

突然だけど,ぼくの手元には古いマシンがある. Interlinkいうペットネームで知られるそのマシンは,知る人ぞ知る,そんな日本Victor製造のサブノートパソコンで,画面サイズがわずか8.9インチという小ささ,まさにネットブックの先駆けとも言える存在な…

アラビア語系統の言語を扱うのに優れたエディタは?

元々ソフト事情 - Linux / オープンソースとアラビア語 at Scratchpad, the home of temporary mini-wikis!っていうサイトがいくつか情報を提供してくれていたんだけど,最終更新が06年と古い.でいまの時代により適したエディタは?ってことで色々試してみ…

Pythonでスマートなファイルの読み込み方法は?

元は http://blog.lampetty.net/blog_ja/index.php/archives/418あまり考えてなかったんだけど,どでかいファイルを扱う時はメモリの消費を抑える書き方が一番いい(特にNLPはメモリの消費がデカい場合がそれなりにある)結論からいうと,「ぼくの書き方はま…