时间:2021-05-22
本文实例讲述了Python中文分词实现方法。分享给大家供大家参考,具体如下:
在Python这pymmseg-cpp 还是十分方便的!
环境 ubuntu10.04 , python2.65
步骤:
1 下载mmseg-cpp的源代码http://code.google.com/p/pymmseg-cpp/
2 执行:
tar -zxf pymmseg-cpp*.tar.gz //解压后得到pymmseg 目录cd pymmseg\mmseg-cpppython build.py #生成 mmseg.so文件3 将 pymmseg 目录复制到 /usr/local/lib/python2.6/dist-packages 中
4 测试有没有成功:
test.py文件:
from pymmseg import mmsegmmseg.dict_load_defaults()text = '今天的天气真好啊,我们一起出去玩一下吧'algor = mmseg.Algorithm(text)for tok in algor: print '%s [%d..%d]' % (tok.text, tok.start, tok.end)更多关于Python相关内容感兴趣的读者可查看本站专题:《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python Socket编程技巧总结》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》
希望本文所述对大家Python程序设计有所帮助。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
本文实例讲述了Python中文分词工具之结巴分词用法。分享给大家供大家参考,具体如下:结巴分词工具的安装及基本用法,前面的文章《Python结巴中文分词工具使用
本文实例讲述了Python结巴中文分词工具使用过程中遇到的问题及解决方法。分享给大家供大家参考,具体如下:结巴分词是Python语言中效果最好的分词工具,其功能
本文实例讲述了Python实现按中文排序的方法。分享给大家供大家参考,具体如下:安装中文库sudoapt-getupdatesudoapt-getinstall
本文实例讲述了php实现的中文分词类。分享给大家供大家参考,具体如下:该中文分词类源码使用http://tools.jb51.net/code/jb51_php
本文实例讲述了python实现的读取网页并分词功能。分享给大家供大家参考,具体如下:这里使用分词使用最流行的分词包jieba,参考:https://github