python网络爬虫实现发送短信验证码的方法

时间:2021-05-22

前言:今天要总结的是如何用程序来实现短信发送功能。但是呢,可能需要我们调用一些api接口,我会详细介绍。都是自己学到的,害怕忘记,所以要总结一下,让写博客成为一种坚持的信仰。废话不多说,我们开始吧!

网络爬虫实现发送短信验证码

在实现我们目标的功能之前,我们要有自己的思路,否则你没有方向,又如何实现自己的代码功能呢?

我们要发送短信,那么我们其实是需要分析的。我们可以去分析一个可以发送短信的网站页面。

我们来到这里如下:


可以看到这是一个注册界面,我们在注册时会被要求需要填写手机号码的·,其实还有一栏验证码识别,像这里打开没有,那你就填写几个号码,发送,多刷新几次,就可以了。

不为别人添麻烦,我填写自己的号码。
多次刷新会出现,不过要填写不同的手机号码。你们懂的,我们要看到这个有验证码的界面。


我们打开chrome谷歌抓包工具,也就是邮件检查即可。我们点击network直接进行抓包,记得在抓包前最好清除下面出现的一切包。我们要点击验证码,让网页做出反应,然后同步一下,进行抓包。


当我们填写手机号以后,我们只要点击那个验证码,然后进行抓包如下


看到没有,其实点击同步瞬间只有一个数据包的,在你做其他的动作时,可能会出现其他的数据包,但是与此无关。

我们直接点进去看


我们看这个url

https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time=1613969346256

我们打开这个url看看庐山真面目

留意观察这个time参数,很明显是一个时间戳参数

时间戳参数又是什么概念呢?这里有必要介绍一下

时间戳 : 格林威治时间1970年1月0点0分0秒到目前为止
秒级时间戳:10数字
毫秒级时间戳 :13位数字
微秒级时间戳:16位数字

可以看到这个time参数属于毫秒级别的时间戳的。

我们访问这个见面,每次刷新都会有不同的验证码,返回当前的时间。如果我们要获取当前的验证码,我们需要url,前面的参数都一样,只有time,我们需要获取time时间。如何获取呢。

python中有一个time库,我们导入,来看如何使用。

下面展示一些 内联代码片。

import timedef get_time() : " 获取当前的时间戳" now_time =str(int(time.time()*1000))#获取毫秒级的时间戳 print('当前的时间戳',now_time) return now_timeget_time()

来看运行结果

我们目前可以这样去做

我们把这个获取到的时间戳参数加入到url中,我们可以实现动态的获取,每次要要获取这个二维码时就需要指定当前的时间time参数,那我们完全可以这样来构造这个url。我们用一个变量来接收获取的时间戳,然后以字符串的形式加入到time后面。
下面展示一些 内联代码片。

import timedef get_time() : " 获取当前的时间戳" now_time =str(int(time.time()*1000))#获取毫秒级的时间戳 print('当前的时间戳',now_time) return now_timetime_one = get_time()img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_oneprint(img_url)

我们来看是否可以获取到相应正确的url


我们点入那个蓝色的链接,来看有没有获取到这个验证码图片。

测试证明我们完全是对的。

下一步我们要做的是实现代码的访问,获取并保存这个验证码。为什么保存,我们应该知道这点知识。

看这三个提交栏,很明显是一个要提交表单的。提交那就需要post,而post请求呢,就是要提交我们的数据,及手机号码和图形验证码。

当我们把数据提交上去以后,我们在手机上就会收到短信验证码。我们以此来实现发送短信验证码的功能。

我们来保存图片验证码
下面展示一些 内联代码片。

import timeimport requests def get_time() : " 获取当前的时间戳" now_time =str(int(time.time()*1000))#获取毫秒级的时间戳 print('当前的时间戳',now_time) return now_timetime_one = get_time()img_url = 'https://uc.creditcard.ecitic.com/citiccard/ucweb/newvalicode.do?time='+time_oneprint(img_url)headers = { 'User-Agent' :'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36'}response = requests.get(url=img_url,headers = headers)img_data = response.contentwith open('yzm.jpg',mode = 'wb') as file : file.write(img_data)


可以看到在代码编辑器右边已经出现了保存的图片。

下一步我们继续来分析这个手机号码的数据和图片验证码的数据在哪里传入,又是如何实现。

我们输入一个手机号码,然后输入图片验证码,然后点击免费获取。此时再次进行抓包,抓包的方法与上文的第一次抓包方法相同。

我们来看会出现什么样的包。


蓝色部分的就是我们寻找的目标包。然后我们如何去做?点击打开查看相应的代码。


看到没有post请求,是因该提交表单数据的。我们看看下面的表单数据

这里你会发现有一点不同电话号码是直接的数字,图片验证码就需要你来处理了,因为我们上文保存的验证码是图片,你如何识别到这图片验证码里面额数据,来进行传入呢?这里我们还需要一个网站。

超级鹰,是用来识别验证码的,其实我们还是调用这个接口。


我们点击开发文档,我们是用Python写的代码。所以我们点击python的图标,来这里来查看我们需要的。


在下面找到超级鹰图像识别,然后点击下载。把里面的api接口的py文件导入到你的python编辑器。我这里是用Pycharm写的。所以直接将解压出来的Python文件拖入pycharm。


下面是里面的部分代码。


这里面做了小小的修改。我们直接来看这段代码写了什么。
我来告诉大家原始的代码有问题,很低级的问题。

#!/usr/bin/env python# coding:utf-8import requestsfrom hashlib import md5class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = username password = password.encode('utf8') self.password = md5(password).hexdigest() self.soft_id = soft_id self.base_params = { 'user': self.username, 'pass2': self.password, 'softid': self.soft_id, } self.headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)', } def PostPic(self, im, codetype): """ im: 图片字节 codetype: 题目类型 参考 http:///citiccard/ucweb/getsms.do?&timestamp'+time_tworequests_two = requests.post(url=code_url,data= data,headers=headers,cookies=cookies)print(requests_two.json())

我们来看运行结果


ok,短信发送成功
需要注意的是,如果你发送多次的话,那么会出现提醒你短信发送频率过高的提示。这是服务器的响应。

我们总结一下该程序实现了发送验证码的功能,如果你需要实现发送你想要的文本,那么你需要调用其它的接口。别的就不多说了,毕竟爬虫也需要讲武德。

到此这篇关于python网络爬虫实现发送短信验证码的方法的文章就介绍到这了,更多相关python爬虫发送短信验证码内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章