python模块学习之光学识别模块(pytesseract)

python admin 89℃ 0评论

初级验证码识别从这里开始

需要先安装tesserocr

win7 64位安装如下:

https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v4.0.0-beta.1.20180414.exe

安装完成后,将安装文件设置为环境变量:d:\Program Files (x86)\Tesseract-OCR

linux下安装我不多介绍,大家自行查询

以下示例代码只支持英文字符,不支持噪点干挠

# -*- coding: utf-8 -*-

import pytesseract

from PIL import Image

# 打开一个图片
image=Image.open('test.png')

# 调用pytesseract的image_to_string方法识别出图片中的文字,返回识别出来的文字
text=pytesseract.image_to_string(image)

# 打印文字看看效果
print text

 

转载请注明:朋克网 » python模块学习之光学识别模块(pytesseract)

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址