unicode
Mercurial で case insensitive filesystem 周りの修正をする際に仕込んだ知識のまとめエントリその3。でも case insensitive とは関係の無い話を。今回の作業で知ったのだけれど、Python のファイル I/O 系 API では、引数が Unicode かバイト列かに応じて…
Mercurial で case insensitive filesystem 周りの修正をする際に仕込んだ知識のまとめエントリその2。トルコ語 (Turkish) の文字には、『アイ』(I) の文字のバリエーションに以下の4つがあるらしい。 U+0049: LATIN CAPITAL LETTER I U+0069: LATIN SMALL …
Mercurial で case insensitive filesystem 周りの修正をする際に仕込んだ知識のまとめエントリその1。グルジア語 (Georgian) の文字 U+10A0 と U+2D00 は、Unicode 仕様上は大文字/小文字の関係にあるので、例えば最新の Python 処理系で以下のような条件…