当前位置:
首页 > temp > 简明python教程 >
-
Python借助于AI来实现验证码识别,内含python3示例
借助于AI工具来实现验证码识别,内含python3示例
验证码识别的场景十分常见
本文主要讨论作为普通开发者(缺乏/没有Ai学术(教育/实践)背景)的前提下,来低成本快速实现验证码识别
本次测试的验证码主要有两种
1. 无干扰的纯数字验证码
2. 有干扰的数字加字母验证码
1. 百度AI大脑
https://ai.baidu.com/tech/ocr/general
下边我用python3来示例在
https://console.bce.baidu.com/ai/?fromai=1#/ai/ocr/app/list
这里新建应用
记录appid, apikey, secret key
复制代码 隐藏代码 import requests import base64 import shortuuid from pprint import pprint #填上自己的app 信息 appid = "" key = "" secret = "" def Token(): host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id={}&client_secret={}'.format(key, secret) response = requests.get(host) # if response: # pprint(response.json()) return response.json()['access_token'] token = Token() request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic" f = open('./code/code.png', 'rb') img = base64.b64encode(f.read()) params = {"image":img,"language_type":"CHN_ENG"} # access_token = '[调用鉴权接口获取的token]' request_url = request_url + "?access_token=" + token headers = {'content-type': 'application/x-www-form-urlencoded'} response = requests.post(request_url, data=params, headers=headers) pprint (response.json())
2 腾讯AI
https://ai.qq.com/product/ocr.shtml#common
腾讯ocr示例在这里新建应用
https://ai.qq.com/console/application/create-app
记录以上app信息 APP_ID,APP_Key
复制代码 隐藏代码 import base64, hashlib, json, random, string, time from urllib import parse import requests from pprint import pprint # 填写app信息 app_id = "" app_key = "" def GetAccessToken(formdata, app_key): dic = sorted(formdata.items(), key=lambda d: d[0]) sign = parse.urlencode(dic) + '&app_key=' + app_key m = hashlib.md5() m.update(sign.encode('utf8')) return m.hexdigest().upper() def RecogniseGeneral(app_id, time_stamp, nonce_str, image, app_key): host = 'https://api.ai.qq.com/fcgi-bin/ocr/ocr_generalocr' formdata = {'app_id': app_id, 'time_stamp': time_stamp, 'nonce_str': nonce_str, 'image': image} app_key = app_key sign = GetAccessToken(formdata=formdata, app_key=app_key) formdata['sign'] = sign try: r = requests.post(url=host, data=formdata, timeout=20) except requests.exceptions.ReadTimeout: r = requests.post(url=host, data=formdata, timeout=20) if (r.status_code == 200): return r.json() else: print(r.text) def Recognise(img_path): with open(file=img_path, mode='rb') as file: base64_data = base64.b64encode(file.read()) nonce = ''.join(random.sample(string.digits + string.ascii_letters, 32)) stamp = int(time.time()) recognise = RecogniseGeneral(app_id=app_id, time_stamp=stamp, nonce_str=nonce, image=base64_data, app_key=app_key) # for k, v in recognise.items(): # print(k, v) return recognise img_path = "./code/code.png" response = Recognise(img_path) pprint(response) code = response['data']['item_list'][0]['itemstring'].replace(" ", "") print(code)
原文:https://www.cnblogs.com/pythonQqun200160592/p/15209964.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程
检测数据类型的四种方法
js中数组的方法,32种方法
前端操作方法
数据类型
window.localStorage.setItem 和 localStorage.setIte
如何完美解决前端数字计算精度丢失与数