时间:2021-05-22
最近学习Python,于是就用Python写了一个抓取Discuz!用户名的脚本,代码很少但是很搓。思路很简单,就是正则匹配title然后提取用户名写入文本文档。程序以百度站长社区为例(一共有40多万用户),挂在VPS上就没管了,虽然用了延时但是后来发现一共只抓取了50000多个用户名就被封了。。。
代码如下:
复制代码 代码如下:
# -*- coding: utf-8 -*-
# Author: 天一
# Blog: http:///home.php?mod=space&uid="+str(uid)
uid +=1
theResponse = urllib2.urlopen(theUrl)
thePage = theResponse.read()
#正则匹配用户名
theFindall = re.findall(pattern,thePage)
#等待0.5秒,以防频繁访问被禁止
time.sleep(0.5)
if theFindall :
#中文编码防止乱码输出
thedatas = theFindall[0].decode('utf-8').encode('gbk')
#写入txt文本文档
f = open('theUid.txt','a')
f.writelines(thedatas+'\n')
f.close()
if __name__ == '__main__':
BiduSpider()
最终成果如下:
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
本文实例为大家分享了bootstrap表单的具体代码,供大家参考,具体内容如下表单和图片用户名:密码:用户名:密码:用户名:密码:用户名:密码:用户名:密码:¥
本文实例讲述了php用户密码加密算法。分享给大家供大家参考,具体如下:今天在拿Discuz进行二次开发时需要在代码里验证Discuz的用户名密码,结果不小心掉进
可以定时打开QQ并且让它自己输入用户名和密码的脚本复制代码代码如下:dimprogramprogram="c:\ProgramFiles\Tencent\qq\
1.将adduser.php复制到discuz根目录下;/--adduser.php内容如下--/2.手工采集用户名,也放于discuz根目录下/--usern
功能如下:如果用户名为空提示“用户名不能为空”如果用户名存在提示“用户名[xxxxxx]已经存在,请使用其他用户名,4”如果用户名不存在提示“用户名[xxxxx