«前の日記(2004年01月05日) 最新 次の日記(2004年01月07日)» 編集

Matzにっき

<< 2004/01/ 1 1. [生活]元旦
2. [生活] New Year's Resolution
2 1. 初夢
2. [生活]帰宅
3 1. [家族]姪を預かる
2. [家族]実家
3. [tDiary]tdiary grep
4 1. [教会]断食安息日
2. [生活]小豆雑煮
5 1. [tDiary]tdiary grep(2)
6 1. [生活]体調不良
2. [Ruby]M17N
7 1. [言語]まつもとゆきひろの「プログラミング言語論」【前編】
2. [Ruby]M17NとCitrus project
8 1. [生活]出社
2. [M17N]Citrus Project
3. [テレビ]『FIRE BOYS』
4. [tDiary]tdiarygrep(3)
5. [M17N]文字オブジェクト
6. [news]年始、ロボットと愛し合う
9 1. [言語]Plankalkül
2. [生活]新年会
10 1. [家族]休日
11 1. [教会]岡山
2. [tDiary]tdiarygrep(4)
12 1. [家族]休日
13 1. [Linux]カーネル2.6.0
2. [天気]冬
3. [本]『なつのロケット』
4. [家族]家庭の夕べ
14 1. [Ruby]Riteの課題
2. [日記]アクセス数
15 1. [PC]秋葉原
2. [METI]ハッカー甲子園
16 1. [Ruby]getaddrinfo(3)
17 1. [OSS]オープンソースを支援する経済産業省の狙い
18 1. [教会]出雲
2. [PC]VAIO U101
19 1. [OSS]「オープンソース・バブルを危惧する」
2. [OSS]オープンソースソフトウェア協会
3. [家族]家庭の夕べ
20 1. [Ruby]getaddrinfo(その2)
2. [OSS]Nokia to release Perl for smartphones
3. [Ruby]getaddrinfo(その3)
4. [OSS]オープンソース技術者の流動化
21 1. [Ruby]getaddrinfo(その4)
2. [Ruby]getaddrinfo(その5)
22 1. [言語]Scala
2. [言語]Soopy
3. オープンソースソフトウェア協会(その2)
4. [天気]雪
23 1. [家族]雪と温泉
24 1. [OOP]OOPSLA proceedings
25 1. [教会]松江
2. [OSS]OSSAJ
3. [Rite]6.894 Object-Oriented Dynamic Languages
26 1. [OOP]Applying Traits to the Smalltalk Collection Classes
2. [家族]家庭の夕べ
27 1. [生活]散髪
2. [言語]Traits
28 1. [OOP]Mix-in
2. [教会]ホームティーチング
3. [OOP]Mix-in(コメントあれこれ)
4. [Net]Orkut.com
29 1. [言語]SelfとMix-in
30 1. アポ
31 1. [家族]病院
2. [映画]『聖杯伝説』
>>

2004年01月06日 [長年日記]

_ [生活]体調不良

急に寒くなったせいか、昨日あたりから体調が悪く、寒気がしたり、鼻炎が悪化したりしたので自宅作業。

とはいえ、今は子供たちも冬休みなので、作業がはかどらない。 家族全員で引きこもり状態。 結局仕事もたいして進まないし。

これではいくらなんでもいかんだろうと、夜は温泉にでかける。 結構寒いのね。

_ [Ruby]M17N

で、仕事が進まないなりにRuby M17Nについて考えていたのだが、CHISEあたりをヒントに

  • 整数で文字を表すのはやめる
  • 文字も文字列も二つの文字列ポインタ(始端と終端)で表現
  • 文字に対する操作はその文字列の「最初の文字」が対象になる
  • 文字に対する操作は基本的にその文字の属性の取得
  • 文字列に対する操作は(一部を除き)文字に対する操作で記述したものをfall backとして用意

という方針でなんとかなるのではないかと考える。 これだと、たとえば「文字=コードポイント」という仮定もないのでより広い範囲で対応できるだろう。 ステートフルなエンコーディングにはいずれにせよ対応できないけど(効率上の問題であきらめた方が良さそう)。

もっとも、これだと以前作ったもの(ruby_m17nブランチ)の実装はほとんど流用できないなあ。

課題は

  • 正規表現エンジンはどうするか。鬼車は独自のencoding対応が入っちゃってるし。
  • 不正なバイト列にどう対処するか

だな。特に前者。 エンジンの自作はできれば避けたいけど、鬼車をフォークするってのもなあ。


«前の日記(2004年01月05日) 最新 次の日記(2004年01月07日)» 編集