2014-06-01から1ヶ月間の記事一覧

bashスクリプトの中でheaderファイルを挿入するには?

bashスクリプトを書いているときに、「ファイルにheaderを挿入するコマンド」を使いたいときがある。 例えば、SQLから取得してきたファイルをcsvとして整形して保存しておく時とか。 この時、ぼくはよくSQLから取得してきた文字列を変数に格納して、それから…

アダルトビデオコミュニティで人気のビデオは?

前回は、「blackでblowjobな内容なビデオが人気である」であると仮定して、視聴数とコメント数で人気度を表現しようとした。 視聴数とコメント数の分布を確認すると、べき乗分布になっており、べき乗分布の最大セグメントは同じビデオだろうと考えた。 そこ…

ビッグデータで見るアダルトビデオコミュニティ

※この記事はpandasやMコマンドの練習お題として選んだ「アダルトビデオコミュニティの分析」をコードと共に紹介するシリーズです 以前、アダルトビデオコミュニティの統計データの紹介をしたことがある。 長いこと放置していたが、せっかくなので、このデー…

日付の名前がついたファイルを週ごとに連結する

ログファイルを扱っていると、タイトルのような需要がちょくちょく出てくる。 例えば、一週間でログインしたユーザーのみを知りたいときとか。 この場合、日付の名前がついたファイルを週ごとに連結して、sortしてuniq・・・ってことになるのだが、週ごとに…

Rのエスケープ文字はダブルのエスケープ

R

URLの文字分割したい時など、?とかの特殊記号が登場する。 しかし、単純に?でstrsplit関数を使うと、文字が全部分解されてしまう。Fu*k これは?がメタ文字として扱われているためで、?を文字として扱って分割するにはエスケープを2つもつけないといけない。…

foreachとldplyを使ってforループの記述から脱却しよう

R

例えば、ある関数をforループで毎回呼び出して処理させている時は、foreachとldplyに置き換えられる。 一般に、後者の方が処理速度が早いらしい。 ま、そんな言語設計してる時点でどうかしてると思うがな! GetSum <- function(a){ x <- a + 1 + 2 return_df …

シェルスクリプト内で改行を含めたprint的なことをしたい

変数の中身を表示するprint的なアレはechoを使えばよいが、echoだと改行されない。 そこで、改行されるようにするには・・・ echo "${変数}" とダブルクオートでかこってやればよい ここに書いてある

R5クラスを利用してクラスを実装する

R

Rでクラスを実装するには3つの方法がある。 S3オブジェクト S4オブジェクト R5オブジェクト 世に出回っている多くのクラスはS3で実装されているようだが(自分の見た限りだと)、S3は「インスタンス生成時に型エラーを出さない」という致命的な欠陥がある。…