|
|
|
|
| Debian sarge下python2.3.5不支持gb2312编码吗?【已解决】 |
 Debian sarge下python2.3.5不支持gb2312编码吗?【已解决】 - lsnake [ 2005-07-22 10:05 | 619 byte(s)]
 PS:程序中汉字串的数量不少,有不做手工转码的好办法吗? - lsnake [ 2005-07-22 10:11 | 20 byte(s)]
 Re: PS:程序中汉字串的数量不少,有不做手工转码的好办法吗? - passworld [ 2005-07-22 12:37 | 18 byte(s)]
 Re:passworld - lsnake [ 2005-07-22 15:49 | 120 byte(s)]
 Re:passworld - lsnake [ 2005-07-22 19:55 | 438 byte(s)]
|
|
|
|
[Original]
[Print]
[Top]
|
最近系统升级到了Debian Linux 3.1,python版本为2.3.5。以前在1.x下运行得很好的几个有汉字的小程序就有问题了,我加入了gb2312的coding,python提示为不能识别的编码,改成mbcs,python抛出异常:
SyntaxError: <exceptions.AttributeError instance at 0x402163ac>
改成utf-8倒是可以运行。但我有一个疑问,就是我的程序要从网上一个gb2312编码的网页中查找一个中文字符串的匹配,如果用utf-8的话是否还能得到正确的匹配呢?
是否需要在匹配前手工做一下转码的工作,该怎样转码?
另外是否python2.4对gb2312一类双字节编码支持的更好呢,我有必要立即升级到2.4吗?
我是python新手,请各位多多指教!
|
|
|
[Original]
[Print]
[Top]
|
|
[Original]
[Print]
[Top]
|
网上搜索的结果再一次证明:goole真是好东西!
我得到的结论是:
1.linux下(我想甚至在其它*nix下)的python 2.3只支持utf-8。而windows平台下的2.3是支持gb*, cp936这样的编码的。应该是ActiveState在其中加入了cjk支持吧。我想passworld的python大概也是在windows下吧?
2.我有两个选择:要么升级到python 2.4(包含cjkcodecs),要么在2.3下安装cjkcodecs;手工转码太麻烦了,是不能接受的。
谢谢linuxforum的网友们!
|
|
|
[Original]
[Print]
[Top]
|
|
|