时间:2021-05-22
有时在处理文件时候,我们需要将中文姓名转换为拼音,或者是转换为拼音首字母,本文将介绍三种Python实现的方法,最后给一个批量操作的代码案例!
开门见山,Python中文字转拼音可以使用xpinyin,直接使用pip安装即可?
pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com接着导入xpinyin下的 Pinyin 方法如下
from xpinyin import Pinyin首先试试中文名转拼音,
p = Pinyin()result1 = p.get_pinyin('叶伏天')result1结果如下:
'ye-fu-tian'tone_marks可以显示声调
result2 = p.get_pinyin('叶伏天', tone_marks='marks')结果如下:
'yè-fú-tiān'去掉空格?
s = result1.split('-')result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize()result3结果如下:'Ye Futian'有时需要中文名转拼音首字母,也很简单?
另一种方法是使用pypinyin,安装同样可以使用pip
# 安装pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com直接导入就行?
import pypinyin再来看看中文名转拼音的实现办法
result1 = pypinyin.pinyin('叶庭云', style=pypinyin.NORMAL)result1结果如下:
[['ye'], ['ting'], ['yun']]启用多音节来实现声调
result2 = pypinyin.pinyin('叶庭云', heteronym=True)result2结果如下:
[['yè', 'xié'], ['tíng'], ['yún']]因为返回的是一个嵌套的list,所以需要简单调整一下
result_ = [i[0] for i in result1]result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()result3结果如下:
'Ye Tingyun'启用多音字模式时,竟然发现 ‘叶' 也是多音字,查询了资料发现确实是这样,涨知识啦!
下面是中文名转拼音首字母的方法
最后一种办法是使用snownlp,同样的pip安装与导入如下:
# 安装pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com# 导入from snownlp import SnowNLP中文名转拼音?
s = SnowNLP('叶庭云')s.pinyin结果如下:
['ye', 'ting', 'yun']将list转为字符串
result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize()result4结果如下:
'Ye Tingyun'最后是中文名转拼音首字母
现在,掌握了基本使用后,我们就能利用批量操作来解放双手
import pypinyinimport pandas as pddf = pd.read_excel('学生名单_test.xls')df.head()先导入一份学生名单如下
下面是使用pypinyin批量将全部学生的中文姓名转换为拼音
pinyin_name = []first_pinyin = []for i in df['姓名']: result = pypinyin.pinyin(i, style=pypinyin.NORMAL) result_ = [i[0] for i in result] result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() result3 = ''.join([i[0].upper() for i in result_]) print(result2, i, sep=' ') pinyin_name.append(result2) first_pinyin.append(result3) df['英文名'] = pinyin_namedf['拼音首字母'] = first_pinyindf.head()或者是转换为拼音首字母,运行结果如下:
以上就是python 批量将中文名转换为拼音的详细内容,更多关于python 中文名转换为拼音的资料请关注其它相关文章!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
问:使用PQMagic将NTFS分区转换FAT32后,导致许多文件无法打开,多数是中文名的文件和文件夹,请问如何解决?答:微软不推荐将NTFS分区转换为FAT3
设计一个算法,将URL转换成5部分,分别是:schema、netloc、path、query_params、fragment。问题URL的中文名叫统一资源定位符
本文实例讲述了Python实现处理逆波兰表达式。分享给大家供大家参考,具体如下:中文名:逆波兰表达式外文名:ReversePolishNotation别名:后缀
soyea是数源牌子的电视,soyea是一个家电品牌,是杭州电视机厂生产的电视,中文名叫“数源”。电视系统发送端把景物的各个微细部分按亮度和色度转换为电信号后,
不论是JCE还是CKEDITOR,都没解决中文名文件的问题,要么上传失败,要么传上去了中文名不能被web访问。相比之下,JCE更加人性化,比如文件上传后默认被选