2013-07-01から1ヶ月間の記事一覧
久しぶりにCKYチャートをいじることになって,「あれ,どことどこのマスが親を生成するんだっけ?」と,まあ,こうなってしまう.そこで,ちょっと探してみると,Yahoo知恵袋にこんな良解説がなされていたので,紹介.構文解析:CYKアルゴリズム 情報 数学 …
"The Lefff, a freely available and large-coverage morphological and syntactic lexicon for French", Benoît Sagot, 2010 を読んでいるときに出て来たのが"sub categorization"あれ,これ何だっけ?と思ったので復習がてらに[この本](http://www.amazon.…
前回はMac OSXでの入力方法について触れたが,ぼくはubuntuマシンも持っている関係上,ubuntuでもlatin-1が入力できるようにしないといけない.そこで,調べてみると.ubuntuではOSXのようにopt+aのような入力方法ではなく,補助インプットメソッドのiBusを…
ペルシア文字の翻字方法の検討 - kensuke-miの日記でも紹介したが,アラビア文字を計算機で効率的に扱うためにはラテン文字に置き換えてしまった方がよい. そこで,今回のぼくのアラビア文字→ラテン文字変換スクリプトの実装には多くのラテン文字を用いた.…
計算機でアラビア文字を扱うのは正直いうとしんどい.文字が全体的に見にくいし,母音記号はハムゼは拡大しまくってやっと存在が見つかる.といったそんな印象. 見にくいと何が困るかって,目には見えてないけど,違う文字コードの系列になっていたら計算機…
誰得な内容ですが..ペルシア語を正しくコンピューターで扱う話.これがきちっと守れないと,「検索した単語が出てこない!」とか「レポート書いたけど,間違いだらけじゃないか!」という原因になるので,きちっと守りましょう.というお話です.実はアラ…
As you know, we concatenate words with Ezafe when two words have a relation of modifier word and modified word.But, You may not know the concatenation rule when the last character of modified word is HEH+HAMZA.In Arabic unicode set, HEH+HA…
(前回から) ヤフオクで格安ジャンク品のサブノートパソコンをHDD移植まで完了させたぼく!結果やいかに!スイッチを押してみると...そこに出ているメッセージを要約すると, 「カーネルがこのマシンのCPUに合ってないんだってば.適切なカーネルを使い…
突然だけど,ぼくの手元には古いマシンがある. Interlinkいうペットネームで知られるそのマシンは,知る人ぞ知る,そんな日本Victor製造のサブノートパソコンで,画面サイズがわずか8.9インチという小ささ,まさにネットブックの先駆けとも言える存在な…
元々ソフト事情 - Linux / オープンソースとアラビア語 at Scratchpad, the home of temporary mini-wikis!っていうサイトがいくつか情報を提供してくれていたんだけど,最終更新が06年と古い.でいまの時代により適したエディタは?ってことで色々試してみ…
元は http://blog.lampetty.net/blog_ja/index.php/archives/418あまり考えてなかったんだけど,どでかいファイルを扱う時はメモリの消費を抑える書き方が一番いい(特にNLPはメモリの消費がデカい場合がそれなりにある)結論からいうと,「ぼくの書き方はま…