时间:2021-05-22
Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。
Python由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。
像Perl语言一样, Python 源代码同样遵循 GPL(GNU General Public License)协议。
早就听说Python语言操作简单,果然名不虚传,短短几句,就实现了基本的功能。
要检测目标网站上是否存在指定的URL,其实过程很简单:
1、获得指定网站网页的HTML代码
2、在HTML代码中查找指定的URL
3、如果存在,OK;否则,Error
整个程序引用了两个lib库,urllib2和sgmllib。
urllib2库主要定义了一些访问URL(基本通过HTTP)的函数与类。
sgmllib库主要负责解析HTML代码。
import urllibfrom sgmllib import SGMLParserclass URLLister(SGMLParser):def reset(self):SGMLParser.reset(self)self.urls = []def start_a(self,attrs):href=[v for k,v in attrs if k=='href']if href:if (href[].count('http://网站URL')==):self.urls.extend(href)links = ['http://',]for eachlink in links:f = urllib.urlopen(eachlink)if f.code ==:parser = URLLister()parser.feed(f.read())f.close()if (len(parser.urls)>=):print 'The link from '+eachlink+' is OK!'else:print 'The link from '+eachlink+' is ERROR!'这其中几个主要函数:
1、urllib2.urlopen(url[, data][, timeout])//打开一个URL
2、SGMLParser.feed(data) //获得需要解析的HTML数据
3、SGMLParser.start_tag(attributes) //指定需要解析的HTML标签,在本程序中,我们调用了start_a,说明我们需要解析HTML代码中<a>标签。通过查找<a>标签中href属性的value,可以获得该网页上所有链接的信息,只要我们指定的URL存在,就OK了。
这其实是一个很小的脚本,但也让我激动不已。一来,我已经跨进了Python的世界,并用它解决了实际工作中的问题,二来,它的简单语法、缩进格式着实让我眼前一亮。今后,希望能够多多使用Python,解决实际工作中的种种问题,做到学以致用.
以上内容是针对Python检测网站链接是否已存在的相关介绍,希望对大家有所帮助!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
Xenu是一款深受业界好评,并被广泛使用的死链接检测工具。Xenu-死链接检测工具时常检测网站并排除死链接,对网站的SEO非常重要,因为大量死链接存在会降低用户
要求:批处理(.bat)添加多个新的域名到hosts,先检测是否已存在,如果已存在的域名就不添加其他尚未存在的域名,则直接添加google搜寻是有找到代码如下:
流程:1、在程序初始化的时候创建互斥量2、检测互斥量返回的错误代码,看是否已存在这个互斥量3、若已存在相同的互斥量,则释放创建的互斥句柄,并复位互斥量,然后,退
安全检测技术。为提高Web网站的安全性,可采用有效的安全检测技术,借助相应的技术受手段,对网站进行全面的漏洞扫描,检测网页当中是否存在不安全隐患,如非法篡改、挂
Python操作文件时,我们一般要先判断指定的文件或目录是否存在,不然容易产生异常。例如我们可以使用os模块的os.path.exists()方法来检测文件是否