解决UI自动化过程中的图文验证码问题,过程大致分为两个步骤:1.自动下载网页上指定的图片2.识别图片上的文本内容本文以“识别页面上指定图片的文本“为例。代码实现效果环境准备PytesseractTesseract-OCRPillow手动安装pytes...
解决UI自动化过程中的图文验证码问题,过程大致分为两个步骤:
1. 自动下载网页上指定的图片
2. 识别图片上的文本内容
本文以“识别页面上指定图片的文本“为例。
Pytesseract
Tesseract-OCR
Pillow
命令:
http://8rr.co/Krrw
双击exe程序直接安装即可
Python自带的图文简单处理模块,正常安装Python的时候会自动安装,故无需另外手动安装。(若没自动安装则可手动安装:pip install Pillow)
初始化并放大浏览器初始化元素定位方式:本文使用CSS选择器方式定位
页面全屏截图截图转为Image对象获取指定图片的大小和位置裁剪图片
识别裁剪后的图片上的文本内容
修改tesseract文件的默认路径
全文详见:http://xpxw.com/?id=165