时间:2021-05-26
本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:
一、需求:
最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。
二、解决方案:
要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。
三、实现代码:
复制代码 代码如下: $len_all = strlen($comment['text']);
$len_st = mb_strlen($comment['text'], 'UTF-8');
if(($len_all-$len_st)/(2*$len_st) < 0.5){
$error = "中文字符少于百分之五十";
}
如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。
希望本文所述对大家的PHP程序设计有所帮助。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
本文实例讲述了php自定义函数实现统计中文字符串长度的方法。分享给大家供大家参考,具体如下:中文字符计算为2个字符英文字符计算为1个代码/***可以统计中文字符
本文实例总结了php中文字符串截取方法,非常实用的技巧。分享给大家供大家参考。具体方法分析如下:用PHP函数substr截取中文字符可能会出现乱码,主要是sub
我们在实际过程中要经常去检测含有中文字符串的实际长度,因为中文字符,和英文字符在一起的话.判断起来你麻烦点.原理跟在asp中的一样.逐个去判断.是中文加2英文加
PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理:PHP自带的函数如strlen()、mb_st
本文实例讲述了php截取中文字符串函数。分享给大家供大家参考。具体实现方法如下:复制代码代码如下:$sublen){returnjoin('',array_sl