彷徨えるフジワラ

年がら年中さまよってます

unicode

Python のファイル I/O API と文字コード

Mercurial で case insensitive filesystem 周りの修正をする際に仕込んだ知識のまとめエントリその3。でも case insensitive とは関係の無い話を。今回の作業で知ったのだけれど、Python のファイル I/O 系 API では、引数が Unicode かバイト列かに応じて…

トルコ文字と case insensitive filesystem

Mercurial で case insensitive filesystem 周りの修正をする際に仕込んだ知識のまとめエントリその2。トルコ語 (Turkish) の文字には、『アイ』(I) の文字のバリエーションに以下の4つがあるらしい。 U+0049: LATIN CAPITAL LETTER I U+0069: LATIN SMALL …

グルジア文字と case insensitive filesystem

Mercurial で case insensitive filesystem 周りの修正をする際に仕込んだ知識のまとめエントリその1。グルジア語 (Georgian) の文字 U+10A0 と U+2D00 は、Unicode 仕様上は大文字/小文字の関係にあるので、例えば最新の Python 処理系で以下のような条件…