当前位置: 首页> 科技> 名企 > python爬虫滑块验证及各种加密函数(基于ddddocr进行的一层封装)

python爬虫滑块验证及各种加密函数(基于ddddocr进行的一层封装)

时间:2025/9/12 17:03:12来源:https://blog.csdn.net/qq_62975494/article/details/141167496 浏览次数:0次

git链接: https://github.com/JOUUUSKA/spider_toolsbox

这里写目录标题

  • 一.识别验证码
    • 1、识别英文+数字验证码
    • 2、识别滑块验证码
    • 3、识别点选验证码
  • 二、下载系列
    • 1、下载视频
    • 2、下载图片
    • 3、下载文本
  • 三、常用加密类型
    • 1、AES系列
    • 2、DES系列
    • 3、RSA系列
    • 4、SHA系列
    • 5、BASE64
    • 6、HMAC
    • 7、PBKDF2

一.识别验证码

git链接: https://github.com/JOUUUSKA/spider_toolsbox
创作不易记得stars

1、识别英文+数字验证码

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()   spidertool.ocr_img(img_path)

返回给图片中显示的验证码

2、识别滑块验证码

一张图为带坑位的原图,如下图
在这里插入图片描述
一张图为原图,如下图
在这里插入图片描述

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()  spidertool.ocr_slide_with_hole(bgimg_path, fullpage_path)

返回图片中显示的滑块图缺口坐标

小滑块为单独的png图片,背景是透明图,如下图

在这里插入图片描述
然后背景为带小滑块坑位的,如下图
在这里插入图片描述

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()  spidertool.ocr_slide_with_clean(bgimg_path, fullpage_path)

3、识别点选验证码

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()    spidertool.ocr_click_choose(test_img_path, result_img_path)

二、下载系列

1、下载视频

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()    spidertool.download_video(url)

2、下载图片

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()    spidertool.download_img(url)

3、下载文本

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()    spidertool.download_character(txt)

三、常用加密类型

使用说明:
加密模式的填充类型统一设定为PKCS7
加密类型中只有 SHA系列,HMACPBKDF2 的输出格式只能为hex固定格式
其他的加密类型都能 自行指定 输出格式为base64或者hex

加密函数的 形参 中
指定output_format='hex’则输出为hex返回值,
指定output_format='base64’则输出为base64返回值

解密函数的 形参 中
指定input_format='hex’则输出为hex返回值
指定input_format='base64’则输出为base64返回值

使用示例

1、AES系列

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()  cryptor.encrypt_AESCBC(data, key, iv)
cryptor.decrypt_AESCBC(encoded_ciphertext, key, iv)cryptor.encrypt_AESECB(data, key)
cryptor.decrypt_AESECB(encoded_ciphertext, key)

2、DES系列

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_DESCBC(data, key, iv)
cryptor.decrypt_DESCBC(encoded_ciphertext, key, iv)cryptor.encrypt_DESECB(data, key)
cryptor.decrypt_DESECB(encoded_ciphertext, key)

3、RSA系列

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_RSA(data, pubkey)
cryptor.decrypt_RSA(data, privkey)

4、SHA系列

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_MD5(data)
cryptor.encrypt_SHA1(data)
cryptor.encrypt_SHA256(data)
cryptor.encrypt_SHA384(data)
cryptor.encrypt_SHA512(data)

5、BASE64

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_Base64(data)

6、HMAC

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_HMAC(data, key, digestmod)

7、PBKDF2

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()  cryptor.encrypt_PBKDF2(password, salt)

若是对此项目中的API存疑,
可鼠标中键点击进入项目内部查看源码注释,
笔者已做好详细的注释供各位参考
若还不清楚,可通过电子邮箱联系作者1393827820@qq.com

git链接: https://github.com/JOUUUSKA/spider_toolsbox

本文所有资源由JOUUUSKA提供
git主页: https://github.com/JOUUUSKA

关键字:python爬虫滑块验证及各种加密函数(基于ddddocr进行的一层封装)

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: