狩野さんのコメントに続き、 曽田さんから丁寧なフォローをいただいた。ありがたいことだ。
いただいた情報に従い調べると、現時点でのCitrusの主眼はiconvの実装と、 wchar_tを用いた処理のようだ。どちらもCSI(Code Set Independent)を目指していて、 興味深い。
今回RubyのM17Nと銘打って実装したい部分は、 「各種エンコーディングを変換することなく行う文字列操作」 なので、直接はオーバーラップしないことも分かった。
ただ、今後文字列のエンコーディング変換についての考察は必須なので、 その際にはCitrus Projectのiconvの実装を{参考にする、取り込ませてもらう}ことにしよう。
予約しておいたドラマをようやく見る。第一回目。 なんのことはない『め組の大悟』のドラマ化なのだが、面白かった。 なんかドラマを見ようという気になったのは久しぶり。 前回は『サイコドクター』と『アルジャーノンに花束を』だっけか。
要するに原作付きに弱いらしい。
『FIRE BOYS』については、原作から変えてある点がかなりたくさんあったのだが、 それがどれも自然で気にならない。 落合先生が音楽の先生ってことはスマトラ島のエピソードはありえないのねとか、 「めだかヶ丘」ってことは千石国際空港のネタもなさそうとかは思ったけど。
現場の描写については実際を知らないのでなんともいえないが、嫌な感じは受けなかった。
しかし、毎回火事の撮影ってのはいろんな意味で辛そうだなあ。
追記:
しかし、大悟役の人はもう少し体が大きく見える人のほうがよかったかもしれないなあ。
「今日のリンク元」を見る限り、最近の私のエントリでもっともヒットしたのはMatz版tdiarygrepらしい。お役に立ててなによりです。
「文字オブジェクトは導入するんでしょうか」とのことだが、 いろいろ考えたあげく、素のRuby M17Nは文字オブジェクトは導入しない。
ともさんが欲しがっている「文字」に対する機能は将来的にもRuby/CHISE(のようなadd-on)が提供するものと考えている。文字に対するrequirementは本当にさまざまなので。それに「文字」そのものが必要なことは意外と少ないものだ。
ただ、Ruby M17Nが提供する「属性」を使った正規表現マッチはできればやりたいと考えているのだが、 ただ、現時点では正規表現の実装をどうするかさえ決めてないので、断言はできない。
あ、そうそう。ともさんのコメントには「文字列を code point の列とする」とありました。 ruby_m17nブランチでは確かにその通りで、コードポイントで文字を近似していました。 今度のM17N化では文字列の内部表現も文字の内部表現もバイト列で、 こうすることで複数のコードポイントから構成される「文字」もちゃんと文字として扱えるようになるはずです。
新生ITmediaの記事。そういう愛もあるのね...っていうか、そう来るか。爆笑。