if type(str).__name__!="unicode": str=unicode(str,"utf-8") else: pass
>>> import urllib >>> rawdata = urllib.urlopen('http://HdhCmsTestgoogle.cn/').read() >>> import chardet >>> chardet.detect(rawdata) {'confidence': 0.98999999999999999, 'encoding': 'GB2312'} >>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。
chardet 安装
下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。
或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。
python setup.py install参考
chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/
更多Python字符编码判断方法相关文章请关注PHP中文网!
声明:本文来自网络,不代表【好得很程序员自学网】立场,转载请注明出处:http://www.haodehen.cn/did85900