时间:2021-05-22
1.环境
2.下面demo是截取“去哪儿”官网的验证码
# -*- coding=utf-8 -*-# CodeDemo.py# PyCharm Slade 2019/7/20# import selenium,osfrom selenium import webdriverfrom PIL import Imagedef aucthcode(coderddr): """ 传参验证码的Xpath 页面全图为'code.png' 命名这个你们开心就好 验证码截图名为"aucthcode.png :param coderddr: :return: """ driver.save_screenshot('code.png') element = driver.find_element_by_xpath(coderddr) # 获取验证码的div位置 left = element.location['x'] +280 top = element.location['y'] +81 right = left + element.size['width'] + int(13) bottom = top + element.size['height'] + int(2) img = Image.open('code.png') imgcod = img.crop((left,top,right,bottom)) # 根据 div的长宽截图 imgcod.save('aucthcode.png') print((left,top,right,bottom))if __name__ == '__main__': driver = webdriver.Chrome() driver.maximize_window() driver.get('https://user.qunar.com/passport/login.jsp') driver.find_element_by_css_selector('a.pwd-login').click() aucthcode('//*[@id="captcha"][1]/p[1]') driver.quit() # img = Image.open('code.png') # imgcod = img.crop((1392,393,1490,425)) # 根据 div的长宽截图 # imgcod.save('aucthcodeN.png')注:代码中的验证码截取坐标,不一定是标准的,我是通过获取元素的坐标为基础参数,然后在main里面进行调试最终得到我适用的坐标
运行效果展示 code.png
运行截取的验证码效果展示 aucthcode.png
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
本文研究的主要是Python验证码识别的相关代码,具体如下。Talkischeap,showyoutheCode!importnumpyasnpimportma
大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1、计算验证码 2、滑块验证码 3
1、介绍在爬虫中经常会遇到验证码识别的问题,现在的验证码大多分计算验证码、滑块验证码、识图验证码、语音验证码等四种。本文就是识图验证码,识别的是简单的验证码,要
主要记录一下:图片验证码1.获取登录界面的图片2.获取验证码位置3.在登录页面截取验证码保存4.调用百度api识别(目前准确率较高的识别图片api)本次登录的系
最近在折腾验证码识别。最终的脚本的识别率在92%左右,9000张验证码大概能识别出八千三四百张左右。好吧,其实是验证码太简单。下面就是要识别的验证码。我主要用的