2011-11-11

隠れマルコフ連鎖

Hiddenなだけにな！

2011-09-01

1日の終わりは23:59:59ぴったりではない！

時刻tが○月×日内であることを判定する条件文に「○月×日0:00:00 ≦ 時刻t ≦ ○月×日23:59:59」と書く阿呆が一定数いる。このロジックは○月×日23:59:59.001を「翌日」と判定するので、秒未満を扱う処理系において1/86400の確率で誤動作する。絶対に書いてはいけない。正しくは「○月×日0:00:00 ≦ 時刻t ＜翌日0:00:00」である。

秒単位で時刻を取り扱う処理系においても、移植性を考慮し、正しいロジックで実装を行うべきである。たとえばMySQLの日付型は秒単位だが、Microsoft SQL Serverの日付型はミリ秒単位である。したがって、MySQLで(ロジックは間違っているが正しく)動作するコードは、SQL Serverに移植すると動かなくなる。

2010-02-11

hCalendarは用法を守って使わないと「更新」に弱い

ご無沙汰しております。最近何をしていたかと申しますと、気がついたら「スケジュール情報」に関する研究に従事しておりました。マニアックなテーマであるためにうまくfitする学会が見つからず、あまり学会発表できませんでしたが、紆余曲折の末に修士号をいただける運びとなりました。

そんな話はさておき。

先日、id:amachang氏によるhCalendarの紹介記事を見つけました(→hCalendar を使って予定を公開しよう！ - IT戦記)。この記事はhCalendarの概要と自作のJavaScriptライブラリについて記述されたものであり、特にhCalendarの概要については非常にわかりやすく説明されております。自作のライブラリを開発してしまうくらいですから、id:amachang氏のhCalendarへの期待は並ではないでしょう。

しかし私は、hCalendarを使用してスケジュール情報を記述する際に「1つのHTMLリソースにつき1つのスケジュール情報」というルールを守らない限り、スケジュール情報を利用する側の人間に不便を強いることになると考えております(このルールは私が勝手に考えているものであり、hCalendarの思想には無いものですのでご注意ください)。

確かにhCalendarで記述されたスケジュール情報はGoogleのロボットに特別扱いされたり、コピペだけで簡単にGoogle Calendar・Yahoo Calendarに取り込むライブラリを作れたりするかもしれません。それが便利であることに関して異論はありません。

ですが、そのライブラリを使用してGoogle Calendarにスケジュール情報を取り込んだ後に、内容が変更されたらどうなるのでしょうか。願わくはGoogle Calendarに取り込んだ「私のスケジュール情報」に変更内容が反映されたいところです。

スケジュール情報は往々にして、開催されるまでに何度も内容が変更・加筆されるものです。例えば私は、修士論文審査の日程に関するメールを2週間おきに3通も受信しました。最初のメールには「日程の詳細は後日お知らせいたします。」と記述されておりました。次のメールに記述された日程が最後だろう思ったら、直前になって発表者の変更があったために、またまた変更を通知するメールが届きました。このようなローカルな場合でなくても、例えば様々な学会の論文投稿締め切り日は頻繁に延期になりますし、電車・飛行機の発着予定時刻も事故などの理由により頻繁に変わります。予定を決める側としても「最初から開始日時・終了日時・詳細をキッチリ決めてください。あとで修正できませんから」というのはやりづらくて堪らないのではないでしょうか。

この理由から、スケジュール情報の内容に更新があったことを検知する方法について考えなければなりません。修士論文発表会の場合はたまたま変更通知がメールで届いたので助かりましたが、全てのスケジュール情報についてこれが可能なわけではありません(飛行機の発着時刻の変更を全てメールで送られたら堪らないでしょう)。PubSubHubbubなども同様です。

RSSのように、固有のURLをスケジュール情報に対応付ける方法があります。hCalendarはHTMLリソースに記述されているのですから、そのHTMLを示すURLを定期的にクロールすれば良いのです。iCalendar形式で記述されたスケジュール情報では、よく行われていることです。

1つのHTMLリソース(対応するURLも1つだけ)に複数のスケジュール情報が記述してはいけない理由がここにあります。1つのURLに対応するスケジュール情報が複数できてしまうので、1つのスケジュール情報に対応できないのです。出現する順番をURLに付加する方法は、はてなブックマークみたくコンテンツの順番が頻繁に変更される場合に破綻します。

例えばイベント開催支援ツールアテンド : ATNDは、用法を正しく守って使用している例です。イベント詳細ページ(例:ATNDデモ（タイトル）自由に参加/キャンセルをしてみてください : ATND)には、hCalendarで記述されたスケジュール情報が1つしか無いことがわかります。ですので、このスケジュール情報に更新があったかどうかを検知するには、http://atnd.org/events/1の内容をクロールすれば良いのです。

このような例であれば良いのですが、例えばスケジュール情報のまとめサイトを作る際に苦労するかもしれませんね。スケジュール情報一覧があるページ(以下「一覧ページ」)には複数のスケジュール情報が掲載されるでしょうが、用法を守るとなるとhCalendarで記述できるスケジュール情報は1つだけ。仕方が無いので、1つのスケジュール情報について詳細に記述するページ(以下「詳細ページ」)にジャンプしてもらって、そこからhCalendarを取り込んでもらうことになるでしょう。一覧ページからわざわざ詳細ページにジャンプしないと欲しいスケジュール情報が取り込めないなんて、聞くからに不便そうではありませんか。まぁ、これはhCalendarのコンセプト上の限界なので、諦めるしかなさそうですが。

そんなわけで、個人的には

いいことずくめです！
これは hCalendar を使わない手はない！
(hCalendar を使って予定を公開しよう！ - IT戦記より引用)

というのは言いすぎかな、という気がします。iCalendar形式で記述されたファイルをHTTPでダウンロードできるようにする方が数倍は有意義な気がしてなりません*1(もちろん、iCalendarファイルには1つのVEVENTコンポーネントしか含まれていない、という前提で)。

*1:私はiCalendar形式の不満と解決について論文に書いたら、修士号がいただける運びとなりましたが。

2008-04-19

Apacheモジュール開発記その1

Apache

改めましてこんにちはxorです。その0を書いた後、あらぬトラブルに見舞われ、その解決に時間を取られておりました。情けない。

おさらい

さて、その0にて必要最低限のApacheモジュールの作り方を説明したが、ここで改めて簡単な説明をしておきましょう。

apxs2が使える環境にする
- 前回はaptitude(apt-get)を用いた場合しか書いてませんでした
- yumの場合はhttpd-develをインストールすると良いらしい(参考:http://ke-tai.org/blog/2008/01/09/mod_chxj_install/)
$ apxs2 -n モジュール名 -g
- 「モジュール名」というディレクトリが生成される
$ cd モジュール名
- ディレクトリの中にはMakefileとmod_モジュール名.cとmodules.mkというファイルがあるはず
ここから下はroot権限でやらないと失敗すると思うのでsu
# apxs2 -i -a -c モジュール名.c
Apacheの設定ファイルにモジュールのことを記述
- Debianの場合
  1. /etc/apache2/mods-availableに「モジュール名.conf」と「モジュール名.load」というファイルを作る
  2. 「モジュール名.conf」には「SetHandler モジュール名」
  3. 「モジュール名.load」には「LoadModule モジュール名_module /usr/lib/apache2/modules/mod_モジュール名.so」と書いておく
  4. /etc/apache2/mods-enabledに、先ほどの「モジュール名.conf」と「モジュール名.load」のシンボリックリンクを作成する
- 他の場合もだいたい同じだと信じたい
Apacheを再起動 $ apache2ctl restart

こうすると、「http://localhost/ディレクトリ名/」にアクセスすることで「The sample page from mod_モジュール名.c」と書かれたページが表示されるはずです。ここでは「モジュール名」とか「ディレクトリ名」とか書きましたが、どちらも任意のものを使ってください。例えばモジュール名が「gvr」なら、/etc/apache2/mods-enabledにはgvr.loadとgvr.confという名前のシンボリックリンクができていると思われます。こんな感じで、適宜置き換えて読んでください。…というのもかなりきついので、ここではmod_testというモジュールを作ります。モジュール名は「test」です。

あと、モジュール名とディレクトリ名は別に一致してなくても問題はありません。まぁ、今回は混乱を避けるために一致させておきます。そんなわけでディレクトリ名も「test」です。できあがったモジュールはhttp://localhost/testにて動作確認できます。

基本的な原理

さて、それでは早速apxs2によって生成したmod_test.cの中身を見てみましょう。こんな感じだと思います。

/* 
**  mod_test.c -- Apache sample test module
**  [Autogenerated via ``apxs -n test -g'']
**
**  To play with this sample module first compile it into a
**  DSO file and install it into Apache's modules directory 
**  by running:
**
**    $ apxs -c -i mod_test.c
**
**  Then activate it in Apache's apache2.conf file for instance
**  for the URL /test in as follows:
**
**    #   apache2.conf
**    LoadModule test_module modules/mod_test.so
**    <Location /test>
**    SetHandler test
**    </Location>
**
**  Then after restarting Apache via
**
**    $ apachectl restart
**
**  you immediately can request the URL /test and watch for the
**  output of this module. This can be achieved for instance via:
**
**    $ lynx -mime_header http://localhost/test 
**
**  The output should be similar to the following one:
**
**    HTTP/1.1 200 OK
**    Date: Tue, 31 Mar 1998 14:42:22 GMT
**    Server: Apache/1.3.4 (Unix)
**    Connection: close
**    Content-Type: text/html
**  
**    The sample page from mod_test.c
*/ 

#include "httpd.h"
#include "http_config.h"
#include "http_protocol.h"
#include "ap_config.h"

/* The sample content handler */
static int test_handler(request_rec *r)
{
    if (strcmp(r->handler, "test")) {
        return DECLINED;
    }
    r->content_type = "text/html";      

    if (!r->header_only)
        ap_rputs("The sample page from mod_test.c\n", r);
    return OK;
}

static void test_register_hooks(apr_pool_t *p)
{
    ap_hook_handler(test_handler, NULL, NULL, APR_HOOK_MIDDLE);
}

/* Dispatch list for API hooks */
module AP_MODULE_DECLARE_DATA test_module = {
    STANDARD20_MODULE_STUFF, 
    NULL,                  /* create per-dir    config structures */
    NULL,                  /* merge  per-dir    config structures */
    NULL,                  /* create per-server config structures */
    NULL,                  /* merge  per-server config structures */
    NULL,                  /* table of config file commands       */
    test_register_hooks  /* register hooks                      */
};

test_handlerという関数とtest_register_hooksという関数がありますね。しかし、お馴染みのmain関数がありません。

なぜなら、Apacheのモジュールは単独で動作するアプリではなく、Apacheに寄生するものだからです。つまり、main関数のように実行して終わり、では無いのです。代わりに必要な処理は

Apache(母体)の起動の時に呼び出す関数
Apache(プロセス)の起動の時に呼び出す関数
http://localhost/testにリクエストがあったときに呼び出す関数

くらいでしょうか。いきなり浮世離れしてますね。

ですが、ソースコード中に出てくる文字列をよく見てみると、Webアプリを作ったことのある人ならお馴染みのキーワードが出てきていると思われます。例えば「r->content_type = "text/html"」とか「return OK」とか。

弄ってみる

試しにいろいろ弄ってみましょう。この「OK」って、実は「200 OK」のことです。その証拠に、この「return OK」を「return HTTP_NOT_FOUND」に書き換えてみてください。http://localhost/testにアクセスすると404 Not Foundが返ってくるでしょう。他にもHTTP_FORBIDDENとかHTTP_METHOD_NOT_ALLOWEDとかHTTP_GONEとか、いろいろなメッセージが用意されています。全部見てみたい方はhttp://httpd.apache.org/dev/apidoc/apidoc_HTTP_ACCEPTED.htmlを御覧ください。ただ、残念ながらRFC2324で定義された418 I'm a teapotは用意されていない…(まぁアレはHTTPじゃなくてHTCPCPなのだが)。

次に、content_typeを弄ってみましょう。初期値はtext/htmlですが、これをtext/plainにすれば全てがプレーンテキストとして表示されるはずです。application/xxにすれば「どのアプリケーションで開きますか？」とブラウザが訊いてくるかもしれません。まぁ、好きなMIMEタイプを書いて遊んでみてください。

最後に「The sample page from mod_test.c」ですね。ここも、書き換えればその通りに出力されます。また、ここではap_rputs関数を1回しか呼んでいませんが、もちろん2回でも3回でも呼んでいただいてOKです。例えば1回目で「jinsei」、2回目で「makegumi」を引数にして2回呼んだ場合、「jinseimakegumi」と出力されます。また、rputs関数の代わりにrprintf関数を使うこともできます。これはその名の通り、printf風のフォーマットを使って出力ができる関数です。例えば「ap_rputs("test",r)」の代わりに「ap_rprintf(r,"test")」と書いても、同じく「test」と出力されます。さらにap_rprintfはprintfと同等の機能を持つので、例えば「ap_rprintf(r,"add:%02d+%04d=%d",5,12,5+12)」と書けば「add:05+0012=17」と出力されます。

こんな感じで、雛型だけでも弄りまくってみてください。

2008-03-17

Apacheモジュール開発記その0

Apache

突然、Apacheのモジュールを作りたくなった。別に必要に迫られたわけではない。単なる趣味である。

そもそもApacheが単独で使われることは殆ど無い。Apache単独では、Perlで書かれたCGI スクリプトを実行することすらできない。Apacheは、モジュールをインストールすることによって多機能になるのである。有名なモジュールとしてはmod_dir、mod_ssl、mod_cgi、mod_userdir、mod_perl…などが挙げられる。

先ほど挙げたモジュールは最初から提供されているものだが、これが全てではない。Apacheのモジュールは自分で作ることも出来る。例えばmod_uploaderは、よくあるアップローダをApacheのモジュールにしたものである。Perlやphpを使ったアップローダがあるにも関わらずApacheモジュール版が作られたのは、Apacheのモジュールに次のような利点があるからである。

高速
省メモリ

こりゃもうやるしかないっすよ。「高速」とか「省メモリ」って、まさに厨をワクワクさせる単語のオンパレードじゃないですか。

開発に必要な道具

幸いなことにxorはDebianを使っていたので、必要なパッケージはapt-get installでほぼ全て手に入った。使用しているApacheのバージョンは2なので、1.3系のパッケージを使ってはいけない(使っても正しく実行されない)。

まず、apxs2が実行できるかどうかを確認する。実行できない場合はapt-get installで

apache2-prefork-dev
apache2-threaded-dev

というパッケージのいずれかをインストールしなければならない。使用するのはどちらか片方だけである。どちらをインストールするかは、Apacheのプロセスのモードによって決定する。Apacheのプロセスを調べるにはapache2 -Vと入力する。すると、

$ apache2 -V
Server version: Apache/2.2.X (Unix)
Server built:   AAA 99 200X 99:99:99
Server's Module Magic Number: 99999999:9
Server loaded:  XXX 9.9.9, XXX-Util 9.9.9
Compiled using: XXX 9.9.9, XXX-Util 9.9.9
Architecture:   32-bit
Server MPM:     Prefork
  threaded:     no
    forked:     yes (variable process count)
Server compiled with....
 -D APACHE_MPM_DIR="server/mpm/prefork"
:

となる(http://d.hatena.ne.jp/j7400157/20070612/1181574944から拝借)。この例の7行目に「Server MPM : Prefork」と書いてあるのがお解りだろうか。この場合はapache2-prefork-devをインストールする。そうではなく、例えば

$ apache2 -V
Server version: Apache/2.2.X (Unix)
Server built:   AAA 99 200X 99:99:99
Server's Module Magic Number: 99999999:9
Server loaded:  XXX 9.9.9, XXX-Util 9.9.9
Compiled using: XXX 9.9.9, XXX-Util 9.9.9
Architecture:   32-bit
Server MPM:     Worker
  threaded:     yes (fixed thread count)
    forked:     yes (variable process count)
Server compiled with....
 -D APACHE_MPM_DIR="server/mpm/worker"
:

のような場合にはapache2-threaded-devをインストールする。

# apt-get install apache2-****-dev

以上によってapxs2というシェルスクリプトがインストールされているはずである。

apxs2でひな形生成〜コンパイル〜インストール

apxs2はすさまじく万能なモジュール開発支援プログラムである。ひな形の生成からコンパイル・インストールまで一通りのことを全てやってくれる。ここではmod_infotechという名前のモジュールを作ってみることにする。

最初にひな形の作り方からである。ひな形を作るディレクトリにて

$ apxs2 -n infotech -g

とやることで、infotechというディレクトリが作られるはずである。このディレクトリの中にはMakefile・modules.mk・mod_infotech.cという3つのファイルが入っているはずだ。このmod_infotech.cこそがmod_infotechのソースコードである。

次にmod_infotech.cのコンパイルである。Makefileがあることからも解るとおりmakeすればコンパイルされるが、apxs2を使うことでコンパイルしたファイルをApacheモジュールのディレクトリにコピーするところまでやってくれる。というわけで

# apxs2 -i -a -c mod_infotech.c

とやる。これでコンパイル自体は完了だ。なお、Apacheモジュールのディレクトリにコピーする際にはroot権限が必要である場合が多い。その場合はこのコマンドもroot権限で行わないと途中で失敗する。

最後にApacheにこのモジュールをインストールするところである。Apacheのモジュールの設定は全て/etc/apache2/mods-available(ここに無かったらfindとgrepを駆使してmods-availableを探してください)に保存されている。ここにinfotech.loadとinfotech.confというファイルを作成する(touchでOK)。次にinfotech.loadに以下のような記述を行う。

LoadModule infotech_module /usr/lib/apache2/modules/mod_infotech.so

infotech.confには次のような記述を行う。

<Location "/infotech/">
  SetHandler infotech
</Location>

最後にApache2をRestartする。

# apache2ctl restart

これでhttp://localhost/infotech/にアクセスすると、The sample page from mod_infotech.cと表示されるはずである。

2006-12-18

ついに公開::BLOCKSUM

V R

http://youtube.com/watch?v=2WzXMZEkfBs
今まで黙っていましたが、ずっとこんなものを作ってました。
コミックマーケット71 3日目(12/31) 西い-43aにて。
公式サイトはhttp://www3.to/blocksumです。

Thanks K.K!

2006-04-20

PCに何を求めているのか

昨日のエントリーのトラックバック先を見ていて思ったこと…

みんなすごいことをPCに期待してるんだなぁ
そりゃPCの性能も足りないと思うわけだ
この話は「君には必要なのかもしれない、でも俺には不要なんだ」って結論で終わりそうだ　よかったよかった

久々にたくさんのトラックバックをもらって、やっとわかった。どうしてこんなに自分の考えは受け入れられないんだろう？と思っていたが…なるほど、そういうことをPCにしてもらいたいわけか。確かに現段階のPCの性能では絶対に実現できないだろうと思える機能ばかりだ。
今の自分にはPCに対する不満がない。もう十分過ぎる。これ以上PCが強力になったら、自分の能力では理解できなくなってしまうからだ。CPUの速度はすでに（俺には）理解不能な領域に達している。HDDの容量も理解不能（具体的に中に何が入っているのかをすべて把握するとか）だ。これからどんなにCPUが進化しても、どんなにHDDが進化しても、それらはいずれも俺にとって理解不能な物体であり、それ故に新しいものに交換することに意味は無い（意味不明であることに変わりは無いから）。

：

きっと、ものを作るのが好きだという俺の性格が災いしているんだと思う。目の前で何かが動いているとき、それがどうして動いているのか解らないと俺はダメなんだ。PCが速くなったら、ある時にはもう理解できない領域にいるだろう。そうなったら、ついこの間まで俺の相棒だったマシンは一気にブラックボックスと化す。そんな恐ろしい装置を使うことは俺にはできない。