自动生成文章摘要[JavaScript 版本]

时间:2021-05-18

By dknt From bbs.blueidea.com

搜了搜这个,发现找不到答案。所以自己写了一个,很多程序绕过这个问题,往往人工来决定在何处截断,太麻烦了。

实现内容:截断一段含有HTML代码的文本,但是不会出现围堵标记没有封闭的问题。

一个PHP版本的在这里!: 自动生成文章摘要[PHP版本]。

核心部分如下:
复制代码 代码如下:
functionGenerate_Brief(text,length){
if(text.length<length)returntext;
varForemost=text.substr(0,length);

varre=/<(\/?)(BODY|SCRIPT|P|DIV|H1|H2|H3|H4|H5|H6|ADDRESS|PRE|TABLE|TR|TD|TH|INPUT|SELECT|TEXTAREA|OBJECT|A|UL|OL|LI|BASE|META|LINK|HR|BR|PARAM|IMG|AREA|INPUT|SPAN)[^>]*(>?)/ig;

varSinglable=/BASE|META|LINK|HR|BR|PARAM|IMG|AREA|INPUT/i
varStack=newArray(),posStack=newArray();
while(true){
varnewone=re.exec(Foremost);
if(newone==null)break;

if(newone[1]==""){
varElem=newone[2];
if(Elem.match(Singlable)&&newone[3]!=""){
continue;
}
Stack.push(newone[2].toUpperCase());
posStack.push(newone.index);

if(newone[3]=="")break;
}else{
varStackTop=Stack[Stack.length-1];
varEnd=newone[2].toUpperCase();
if(StackTop==End){
Stack.pop();
posStack.pop();
if(newone[3]==""){
Foremost=Foremost+">";
}
}

};
}
varcutpos=posStack.shift();
Foremost=Foremost.substring(0,cutpos);

returnForemost;
}


测试用例如下:
[input] truncate as charactors