时间:2021-05-23
python 遍历字符串(含汉字)实例详解
s = "中国china"for j in s: print j首先一个,你这个'a'是什么编码?可能不是你所想的gbk
>>> a='中国'>>> a这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明gbk。
另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。
接下来是遍历问题。
Linux的shell大都默认是utf-8,所以一个中文字符是三个字,所以要三个三个地读,你可以试下:
>>> a[:3]出来就是个”中”字
windows的command的默认是cp936,也就是gbk,一个中文字符是两个字,所以两个字两个字地读(a[:2])。
还有另一种遍历的方法,把字符串转换成unicode,这样中文英文都是一个字,就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,英文字母只占一个字。
s = u"中国china"for j in s: print j输出如下:
中国china感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
swiftCharacter类型详解及实例1、遍历字符串//for-in遍历Stringforcinstr.characters{print(c)}//c是Ch
C++宽字符与普通字符的转换实例详解把字符串转换成宽字符串,实例代码:wstringstring2Wstring(stringsToMatch){#ifdef_
python里使用正则的findall函数的实例详解在前面学习了正则的search()函数,这个函数可以找到一个匹配的字符串返回,但是想找到所有匹配的字符串返回
本文实例讲述了python实现在字符串中查找子字符串的方法。分享给大家供大家参考。具体如下:这里实现python在字符串中查找子字符串,如果找到则返回子字符串的
一、判断字符串中包含中文字符的方法遍历数组,对每个字节使用string.byte(),发现有大于127的,就是汉字,可以参照下面的代码。二、计算字符串宽度函数复