77百科网
当前位置: 首页 生活百科

怎么更快获取验证码(如何获取验证码)

时间:2023-06-13 作者: 小编 阅读量: 1 栏目名: 生活百科

获取验证码的方法按照以往的经验,有4种方法:让开发帮忙去掉验证码代码,重新部署环境弄个万能验证码,每次登陆都可以登陆用cookie添加登录名和密码避开验证码的方式老老实实获取验证码图片,识别出验证码方法一:遇到好说话的开发,他一般都能帮忙去掉验证码的代码。pytesseract的安装pytesseract依赖于tesseract,需要先安装tesseract。

工作中,如何用python和selenium提取验证码呢?

获取验证码的方法

按照以往的经验,有4种方法:

  1. 让开发帮忙去掉验证码代码,重新部署环境
  2. 弄个万能验证码,每次登陆都可以登陆
  3. 用cookie添加登录名和密码避开验证码的方式
  4. 老老实实获取验证码图片,识别出验证码

方法一:

遇到好说话的开发,他一般都能帮忙去掉验证码的代码。

但是代码去掉了,还需要重新部署一套没验证码的环境,麻烦,不推荐。

方法二:

还是需要开发的帮助,弄一个万能验证码,但测试环境弄的万能验证码可千万不能搞到正式环境。

故不推荐,还是先想想别的办法。

方法三:

该方法的难点是:如何在cookie中找到登陆用户名和密码的name,再将用户名和密码添加进去。

方法四:

最容易想到的办法,重点讲这个方法,此处有2个思路。

  1. 截图登陆页面,再截取验证码图片,识别;
  2. 直接在登陆页面,定位到验证码,将验证码图片另存为,识别;

该方法实现过程中,用到第三方库pytesseract,所以先安装需要引用的库。

pytesseract的安装

pytesseract依赖于tesseract,需要先安装tesseract。

安装Tesseract模块:

git文档地址:https://digi.bib.uni-mannheim.de/tesseract/

请安装不带dev的稳定版,下载后就是一个exe安装包,直接右击安装即可。

一般安装在默认路径,如果不在默认路径,请记住该路径。

下载培训数据:

需要下载相应的培训数据,直接下载整个zip文件,解压后将文件复制到’tessdata‘目录中。

一般为:C:\Program Files (x86)\Tesseract-OCR\tessdata

配置环境变量:

  1. 编辑系统变量里面 path,添加安装路径:C:\Program Files (x86)\Tesseract-OCR
  2. 添加TESSDATA_PREFIX变量,值为:C:\Program Files (x86)\Tesseract-OCR\tessdata
  3. 最后,在cmd命令模式下测试是否安装成功:
  4. tesseract test.jpg text -l chi_sim

安装python的第三方库: 

pip install pillow #一个python的图像处理库,pytesseract依赖

pip install pytesseract

修改pytesseract.py文件:

找到pytesseract的安装包,C:\Python34\Lib\site-packages\pytesseract。

编辑pytesseract.py文件,该步骤必须做,不然编译时会报错。

修改内容如下:

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

代码实现

上面讲述了实现的2种思路,现在分别说明代码实现过程。

思路一:

  1. 先计算浏览器与登陆页面截图的比例值
  2. 再计算对应的验证码图片位置
  3. 再将获取到的验证码图片,先进行二值化处理
  4. 处理后的图像采用pytesseract库转化

截图保存验证码

二值化处理验证码图片

验证码图片转化

上述图片转化过程中,注意参数设置。

不设置参数时,总是将1转化为7,设置后转化准确率杠杠滴。

当然,目前只是识别数字型的验证码,文字类型的方法应该是类似的。

思路二:

  1. 先定位到验证码的位置
  2. 将验证码图片另存到一个路径
  3. 该路径下获取最新的验证码图片
  4. 验证码图片二值化处理
  5. 处理后的图像采用pytesseract库转化

验证码另存为图片

后面的图片处理和获取验证码过程与思路一相同。

,
    推荐阅读
  • 亡组词(亡能组哪些词)

    我们一起去了解并探讨一下这个问题吧!亡命、逃亡、出亡、流亡、亡魂、救亡、亡国、丧亡、生死存亡、亡殁、悼亡。兴亡、存亡、名存实亡、家破人亡、未亡人、亡故、衰亡、唇亡齿寒、废亡。

  • 板粟焖鸡步骤(如何做板粟焖鸡)

    接下来我们就一起去研究一下吧!板粟焖鸡步骤鸡肉半只、栗子250克、姜小段、蒜3瓣、青椒3根、朝天椒4根、五花肉150克。热锅下少量油,下五花肉,改中小火煎出油来,煎至五花肉两面微黄,下鸡肉炒至微黄,加一勺盐混炒。加入姜蒜辣椒,少许盐,混炒。加一勺生抽,上色后装盘。放入高压锅中,蒸20分钟。

  • 佛山顺德高新技术企业工作人员子女入学申请程序2022

    佛山顺德2022年高新技术企业工作人员子女入学申请程序申请人按照以下程序向企业所在镇(街道)申请入读义务教育阶段起始年级公办学校:(一)个人申请顺德区高新技术企业工作人员子女申请入读小学一年级或初中一年级的,由其父、母或监护人提供有关材料,报所在企业审核推荐。

  • 孕妇嗜睡正常吗(怀孕初期孕妇嗜睡正常吗)

    因为怀孕后,女性绒毛膜性腺激素增加,使得身体容易疲累。基础新陈代谢增加所致女性孕后基础新陈代谢增加,妊娠期母体分泌系统产生变化,体内热量消耗快,血糖不足,就容易造成嗜睡的现象。

  • 007工作制介绍(工作制简介)

    007工作制介绍?

  • pos刷卡能收手续费吗(POS刷卡手续费那些事儿)

    即0扣,0手续费;对超市、大型仓储式卖场、水电煤气缴费、加油、交通运输售票商户刷卡交易实行发卡行服务费、网络服务费优惠。在三方机构办理POS机时,借记卡、贷记卡手续费一定会高于成本费率,高出部分才是三方机构的盈利。在银行办理POS机,资金安全不必说,费率一般要高于三方机构。

  • 2022成都新都桂湖景区川渝免票活动细则

    新都桂湖景区积极参与“川渝一家亲——景区惠民游”活动,开展“万张门票免费送”和“门票买一送一”优惠活动。活动主题川渝一家亲——景区惠民游活动时间即日起至2022年12月31日活动内容1.活动期间桂湖景区向重庆和四川籍游客免费提供1万张景区门票;2.重庆和四川籍游客凭本人身份证到售票窗口免费领取门票,每天免费发放50张门票,领完为止;3.重庆籍游客实行门票买一送一优惠,即购买一张门票即可赠送一张门票。

  • tiktok新手零基础教程(如何从0-1打造TikTok账号)

    第1步:创建帐户首先,在手机上下载TikTok应用程序,并选择创建一个帐户。首次创建帐户时,默认情况下为个人帐户。获得10,000名粉丝后,还可以加入创作者基金,通过粉丝的观看次数获利。鼓励你的观众在TikTok上发布他们使用产品的视频,你可以通过发起一个挑战活动来做到这一点。

  • 电脑各个硬件的正常工作温度(温度决定寿命电脑硬件温度控制在几度最合适)

    1、CPU温度:一般情况是45-65℃或更低,要是高于75-80℃则该了解下CPU和风扇间的散热硅脂是否失效、风扇是否有问题等情况。不过安装鲁大师会携带其他软件一起安装。