国際化/マルチリンガル化 w3m
2003/03/08
坂本 浩則
はじめに
w3m を国際化/マルチリンガル化しました。w3m-0.4.1 に対する拡張版を 以下に置いてあります。
http://www2u.biglobe.ne.jp/~hsaka/w3m/index-ja.html#m17n
patch/w3m-0.4.1-m17n-20030308.tar.gz
patch/README.m17n-ja
まだ開発版であり、(私が日本語しか解さないため)十分なテストはできて いませんが興味ある方はお試しください。
現在のところ以下の機能があります。
扱える文字コード
日本語
EUC-JP - US_ASCII, JIS X 0208, JIS X 0201, JIS X 0212
(EUC-JISX0213) (JIS X 0213)
ISO-2022-JP - US_ASCII, JIS X 0208, JIS X 0201, JIS X 0212, etc.
ISO-2022-JP-2 - US_ASCII, JIS X 0208, JIS X 0201, JIS X 0212,
GB 2312, KS X 1001, ISO 8859-1, ISO 8859-7, etc.
ISO-2022-JP-3 - US_ASCII, JIS X 0208, JIS X 0201, JIS X 0213, etc
Shift_JIS(CP932) - US_ASCII, JIS X 0208, JIS X 0201, CP932 の拡張文字
Shift_JISX0213 - US_ASCII, JIS X 0208, JIS X 0201, JIS X 0213
中国語(簡体字)
EUC-CN(GB2312) - US_ASCII, GB 2312
ISO-2022-CN - US_ASCII, GB 2312, CNS-11643-1,..7, etc.
GBK(CP936) - US_ASCII, GB 2312, GBK
GB18030 - US_ASCII, GB 2312, GBK, GB18030, Unicode
HZ-GB-2312 - US_ASCII, GB 2312
中国語(台湾、繁体字)
EUC-TW - US_ASCII, CNS 11643-1,..16
ISO-2022-CN - US_ASCII, CNS-11643-1,..7, GB 2312, etc.
Big5(CP950) - Big5
HKSCS - Big5, HKSCS
韓国語
EUC-KR - US_ASCII, KS X 1001 Wansung
ISO-2022-KR - US_ASCII, KS X 1001 Wansung, etc.
Johab - US_ASCII, KS X 1001 Johab
UHC(CP949) - US_ASCII, KS X 1001 Wansung, UHC
ベトナム語
TCVN-5712 VN-1, VISCII 1.1, VPS, CP1258
タイ語
TIS-620 (ISO-8859-11), CP874
その他
US_ASCII, ISO-8859-1 〜 10, 13 〜 15,
KOI8-R, KOI8-U, NeXT, CP437, CP737, CP775, CP850, CP852, CP855, CP856,
CP857, CP860, CP861, CP862, CP863, CP864, CP865, CP866, CP869, CP1006,
CP1250, CP1251, CP1252, CP1253, CP1254, CP1255, CP1256, CP1257