首页 > Python基础教程 >
-
python通过pillow识别动态验证码的示例代码
在上网时,经常会遇到验证码,本次试验将带领大家认识验证码的一些特性,并利用 Python 中的 pillow 库完成对验证码的破解。感兴趣的可以了解一下
目录
生活中,我们在登录微博,邮箱的时候,常常会碰到验证码。在工作时,如果想要爬取一些数据,也会碰到验证码的阻碍。本次试验将带领大家认识验证码的一些特性,并利用 Python 中的 pillow 库完成对验证码的破解。
环境配置
- Python 2.7
- Pillow 模块
有个问题就是python2.7目前只能让使用到2020年,现在再利用2.7下载好多东西都会报错,也该是时候更新到python3.7了,本文还是依赖于2.7的环境。
识别验证码的代码下载地址:python_captcha_jb51.rar
安装 pillow(PIL)库
1 2 3 |
|
识别过程
将验证码文件python_captcha下载到运行目录下,解压后,在 python_captcha 目录新建 crack.py 文件,进行编辑。
1 2 3 4 5 6 7 8 9 |
|
输出:
颜色直方图的每一位数字都代表了在图片中含有对应位的颜色的像素的数量。
每个像素点可表现 256 种颜色,你会发现白点是最多(白色序号 255 的位置,也就是最后一位,可以看到,有 625 个白色像素)。红像素在序号 200 左右,我们可以通过排序,得到有用的颜色。
1 2 3 4 5 6 7 8 |
|
输出:
我们得到了图片中最多的 10 种颜色,其中 220 与 227 才是我们需要的红色和灰色,可以通过这一讯息构造一种黑白二值图片。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
|
输出:
局限及遇到的问题
1 |
|
此行命令流在windows环境下运行会报错,具体原因可参考python(2)中文编码乱码问题;
该命令流有很大的局限性,识别的动态代买也只有此类:
到此这篇关于python通过pillow识别动态验证码的示例代码的文章就介绍到这了
原文链接:https://blog.csdn.net/weixin_42535423/article/details/103964883