python 遍历字符串(含汉字)实例详解
python 遍历字符串(含汉字)实例详解
s = "中国china" for j in s: print j
首先一个,你这个'a'是什么编码?可能不是你所想的gbk
>>> a='中国' >>> a
这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明gbk。
另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。
接下来是遍历问题。
Linux的shell大都默认是utf-8,所以一个中文字符是三个字,所以要三个三个地读,你可以试下:
>>> a[:3]
出来就是个”中”字
windows的command的默认是cp936,也就是gbk,一个中文字符是两个字,所以两个字两个字地读(a[:2])。
还有另一种遍历的方法,把字符串转换成unicode,这样中文英文都是一个字,就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,英文字母只占一个字。
s = u"中国china" for j in s: print j
输出如下:
中 国 c h i n a
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
相关文章
如何在conda虚拟环境中配置cuda+cudnn+pytorch深度学习环境
这篇文章主要介绍了如何在conda虚拟环境中配置cuda+cudnn+pytorch深度学习环境,想在服务器上配置深度学习的环境,看了很多资料后总结出来了对于新手比较友好的配置流程,需要的朋友可以参考下2023-03-03PyTorch常用函数torch.cat()中dim参数使用说明
这篇文章主要为大家介绍了PyTorch常用函数torch.cat()中dim参数使用说明,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2023-04-04详解Python list和numpy array的存储和读取方法
这篇文章主要介绍了详解Python list和numpy array的存储和读取方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2019-11-11
最新评论