时间:2021-05-23
1、直接贴代码
#!C:/Python27#coding=utf-8 from selenium import webdriverfrom selenium.webdriver.common.keys import Keysfrom pytesser import *from PIL import Image,ImageEnhance,ImageFilterfrom selenium.common.exceptions import NoSuchElementException,TimeoutExceptionimport os,time def before(): driver.get(src) time.sleep(1) driver.maximize_window() # 浏览器全屏显示 print ('\n浏览器全屏显示 ...') def Convertimg(): imglocation = ("//*[@id='loginForm']/div[4]/div[2]/img[1]") #下载验证码图片保存到本地 driver.save_screenshot('E:\\pythonScript\\Codeimages\\code.png') #打开本地图片 im = Image.open('E:\\pythonScript\\Codeimages\\code.png') left = driver.find_element_by_xpath(imglocation).location['x'] top = driver.find_element_by_xpath(imglocation).location['y'] right = driver.find_element_by_xpath(imglocation).location['x'] + driver.find_element_by_xpath(imglocation).size['width'] bottom = driver.find_element_by_xpath(imglocation).location['y'] + driver.find_element_by_xpath(imglocation).size['height'] im = im.crop((left, top, right, bottom)) im.save('E:\\pythonScript\\Codeimages\\screenshot.png') print u"\n保存验证码图片完成" #移除截屏的图片 os.remove('E:\\pythonScript\\Codeimages\\code.png') print u"\n删除截屏图片完成" #处理验证码图片 src = ('E:\\pythonScript\\Codeimages\\screenshot.png') #调用裁剪图片方法 Cutedge(src) #移除截屏的图片 os.remove('E:\\pythonScript\\Codeimages\\screenshot.png') #灰化图片处理 im = Image.open('E:\\pythonScript\\Codeimages\\CutedgeImage.png') imgry = im.convert('L') #二值化处理 threshold = 100 table = [] for i in range(256): if i < threshold: table.append(0) else: table.append(1) out = imgry.point(table, '1') out.save('E:\\pythonScript\\Codeimages\\rgb.png') #vcode = pytesseract.image_to_string(out) #print (vcode) txtcode = image_to_string(out) print u"\n识别出验证码文字为:",image_to_string(out) print len(txtcode.strip()) print if len(txtcode.strip()) == 4: print u"长度相等" else: print u"长度不相等,退出" driver.quit() #输入用户名和密码 driver.find_element_by_id("username").send_keys("123456") driver.find_element_by_id("password").send_keys("123456") time.sleep(2) #对文本框输入验证码值 driver.find_element_by_id("verifyCode").send_keys(txtcode.strip()) time.sleep(3) #点击登录 driver.find_element_by_xpath("//*[@id='loginForm']/div[5]/div/img").click() #driver.find_element_by_class_name('loginbtn').click() time.sleep(7) #针对有黑色边框的验证码图片的裁剪边缘 def Cutedge(src): #设置要裁剪的区域 im = Image.open(src) w, h = im.size print u"\n验证码原图宽、高尺寸为:",w,h box = (2,2,110,30) im.crop(box).save('E:\\pythonScript\\Codeimages\\CutedgeImage.png') print u"\n保存裁剪的图片 CutedgeImage.png" # src = ("https://") method_2(src) isPass() #clickOutput()2、控制台日志
浏览器全屏显示 ... 获取到元素的文本值为: 保存验证码图片完成 删除截屏图片完成 验证码原图宽、高尺寸为: 113 34 保存裁剪的图片 CutedgeImage.png 识别出验证码文字为: gnbn 开始执行任务,执行间隔时间为10分钟 ... 正在执行第 1 次... 2017-05-25 18:10:24 刷新当前页面 ... 等待间隔时间为9分钟 ...以上这篇Python完全识别验证码自动登录实例详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
无论是是自动化登录还是爬虫,总绕不开验证码,这次就来谈谈python中光学识别验证码模块tesserocr和pytesseract。tesserocr和pyte
大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1、计算验证码 2、滑块验证码 3
1、介绍在爬虫中经常会遇到验证码识别的问题,现在的验证码大多分计算验证码、滑块验证码、识图验证码、语音验证码等四种。本文就是识图验证码,识别的是简单的验证码,要
目标:爬取自己账号中购买的课程视频。一、实现登录账号这里采用的是手动输入验证码的方式,有能力的盆友也可以通过图像识别的方式自动填写验证码。登录后,采用sessi
主要记录一下:图片验证码1.获取登录界面的图片2.获取验证码位置3.在登录页面截取验证码保存4.调用百度api识别(目前准确率较高的识别图片api)本次登录的系