一段采集程序代码

时间:2021-05-25

<%@LANGUAGE="JScript"CODEPAGE="936"%>
<scriptlanguage=VBScriptrunat="Server">
Functionbytes2BSTR(vIn)
strReturn=""
Fori=1ToLenB(vIn)
ThisCharCode=AscB(MidB(vIn,i,1))
IfThisCharCode<&H80Then
strReturn=strReturn&Chr(ThisCharCode)
Else
NextCharCode=AscB(MidB(vIn,i+1,1))
strReturn=strReturn&Chr(CLng(ThisCharCode)*&H100+CInt(NextCharCode))
i=i+1
EndIf
Next
bytes2BSTR=strReturn
EndFunction

FunctionajaxRead(theURL)
dimXmlHttp
setXmlHttp=CreateObject("Microsoft.XMLHTTP")
XmlHttp.Open"GET",theURL,false
XmlHttp.setRequestHeader"Content-Type","text/HTML"
XmlHttp.Send

dimhtmlstr
htmlstr=bytes2BSTR(XmlHttp.responseBody)
ajaxRead=htmlstr
EndFunction
</script>

<%
varADOConn;
functionOpenDatabase(){
try{
ADOConn=newActiveXObject("ADODB.Connection");
ADOConn.Open("Provider=Microsoft.Jet.Oledb.4.0;DataSource="+Server.MapPath("getcaiku.mdb"));
}catch(e){
ADOConn.close;
Response.Write("数据库连接出错,请检查连接字串。");
Response.End;
}
}

functionCloseDatabase(){
ADOConn.close;
}

Response.Buffer=1;
Server.ScriptTimeout=99999;
//////////可修改以下参数////////////////
varbeginid=230;//开始ID
varendid=500;//结束ID
////////////////////////////////////////
vararr,tstr,tid,getdata;
varcountid=0;
Response.Write("开始采集:从"+beginid+"到"+endid+"<hr>");
Response.Flush;
OpenDatabase();
varre=newRegExp("<title>(.*?)-彩酷</title>","ig");

for(varfi=beginid;fi<(endid+1);fi++){
tid=String(fi);
getdata=ajaxRead("http://mms.caiku.com/sendcring.aspx?uid=0&id="+tid);
if(arr=re.exec(getdata)!=null){
tstr=String(RegExp.$1);
if(tstr!=null&&tstr!="undefined"&&tstr!="")
tstr=tstr.replace("'","");
ADOConn.execute("INSERTINTOgetdata(title,tid)VALUES('"+tstr+"',"+tid+")");
Response.Write(tid+":"+tstr+"___>OK!<br>");
countid++;
Response.Flush
}
}
re.close;
CloseDatabase();
Response.Write("<hr>采集完毕!共录入数据"+countid+"条。");
%>

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章