python图片识别文字代码(python批量识别图片指定区域文字内容)
类别:脚本大全 浏览量:1659
时间:2021-10-11 00:31:40 python图片识别文字代码
python批量识别图片指定区域文字内容python批量识别图片指定区域文字内容,供大家参考,具体内容如下
简介
对于一张图片,需求识别指定区域的内容
1.截取原始图上的指定图片当做模板
2.根据模板相似度去再原始图片上识别准确坐标
3.根据坐标剪切出指定位置图片,也就是所需的内容区域
4.对指定位置图片进行ocr识别
环境
ubuntu18.04
python2.7
所需python模块
1.aircv
用于识别模板再原始图的位置坐标
|
pip install aircv |
2.pillow
用于剪裁图片
|
pip install pillow |
3.tesseract
文字识别
在此也可以用平台端的api进行更精准的识别
ubuntu下tesseract环境安装
|
sudo apt - get install libpng12 - dev sudo apt - get install libjpeg62 - dev sudo apt - get install libtiff4 - dev sudo apt - get install gcc sudo apt - get install g + + sudo apt - get install automake |
1.tesseract-ocr安装
|
sudo apt - get install tesseract - ocr |
2.pytesseract安装
|
pip install pytesseract |
python代码
识别对应位置
|
#!/usr/bin/python2.7 # -*- coding: utf-8 -*- import aircv def matchimg(imgsrc, imgobj, confidence = 0.2 ): """ 图片对比识别imgobj在imgsrc上的相对位置(批量识别统一图片中需要的部分) :param imgsrc: 原始图片路径(str) :param imgobj: 待查找图片路径(模板)(str) :param confidence: 识别度(0<confidence<1.0) :return: none or dict({'confidence': 相似度(float), 'rectangle': 原始图片上的矩形坐标(tuple), 'result': 中心坐标(tuple)}) """ imsrc = aircv.imread(imgsrc) imobj = aircv.imread(imgobj) match_result = aircv.find_template(imsrc, imobj, confidence) # {'confidence': 0.5435812473297119, 'rectangle': ((394, 384), (394, 416), (450, 384), (450, 416)), 'result': (422.0, 400.0)} if match_result is not none: match_result[ 'shape' ] = (imsrc.shape[ 1 ], imsrc.shape[ 0 ]) # 0为高,1为宽 return match_result |
图片剪裁
|
#!/usr/bin/python2.7 # -*- coding: utf-8 -*- from pil import image, imageenhance def cutimg(imgsrc, out_img_name, coordinate): """ 根据坐标位置剪切图片 :param imgsrc: 原始图片路径(str) :param out_img_name: 剪切输出图片路径(str) :param coordinate: 原始图片上的坐标(tuple) egg:(x, y, w, h) ---> x,y为矩形左上角坐标, w,h为右下角坐标 :return: """ image = image. open (imgsrc) region = image.crop(coordinate) region = imageenhance.contrast(region).enhance( 1.5 ) region.save(out_img_name) |
图片识别
|
#!/usr/bin/python2.7 # -*- coding: utf-8 -*- import pytesseract from pil import image image = image. open ( 'bb.png' ) code = pytesseract.image_to_string(image) print (code) |
对于三方api识别自行研究
以上就是本文的全部内容,希望对大家的学习有所帮助。
原文地址:https://blog.csdn.net/qq_41616397/article/details/87980510
您可能感兴趣
- python实现在同一电脑上tcp通信(Python两台电脑实现TCP通信的方法示例)
- python中的reload(搞清楚 Python traceback的具体使用方法)
- python怎么爬取excel数据(python爬取内容存入Excel实例)
- pythondjango工作机制(Python后台开发Django会话控制的实现)
- python字典键对应的值(Python 互换字典的键值对实例)
- python爬百度api有次数限制吗(对python借助百度云API对评论进行观点抽取的方法详解)
- python常用的切片操作(使用python PIL库实现简单验证码的去噪方法步骤)
- 多个图片拼接python实现(python实现两张图片的像素融合)
- python中if语句应学会什么(Python基础之条件控制操作示例if语句)
- python菜单栏中常用的菜单(Python3实现的简单三级菜单功能示例)
- python可以编写数据加密解密吗(python简单实现AES加密和解密)
- python去除字符串中间的空格(Python去除字符串前后空格的几种方法)
- python变量与对象的关系(Python面向对象程序设计类变量与成员变量、类方法与成员方法用法分析)
- pyqt一键部署python环境(python使用PyQt5的简单方法)
- python3json序列化(Python3.5 Json与pickle实现数据序列化与反序列化操作示例)
- python实现两个变量的交换(在Python 中同一个类两个函数间变量的调用方法)
- 挑战新国标电自天花板,九号机械师MMAX 110P深度体验(挑战新国标电自天花板)
- 《满江红》不要只当电影看,学生应该这样做(满江红不要只当电影看)
- 电影《民间怪谈录之走阴人》定档8月5日,开启一场中式惊悚之旅(电影民间怪谈录之走阴人定档8月5日)
- 原创图画书,以儿童视角讲述中国故事(以儿童视角讲述中国故事)
- 八月再见 愿你岁月不扰,余生静好(八月再见愿你岁月不扰)
- 赏读 八月再见,九月你好(赏读八月再见九月你好)
热门推荐
- css position详解(深究CSS定位position的常用技法)
- 阿里云主机Windows 2008 32位 64位自助正版激活图文教程(阿里云主机Windows 2008 32位 64位自助正版激活图文教程)
- SQL Server中raiserror
- sql常遇到的问题(SQL语句执行超时引发网站首页访问故障问题)
- laravel接口响应时间(laravel请求参数校验方法)
- centos7配vlan(如何在 CentOS/RHEL 系统中使用带 VLAN 标记的以太网卡)
- 接到面试通知后必须做哪些准备
- vue 路由的两种模式(Vue3使用路由VueRouter4的简单示例)
- 云服务器搭建网站怎么选择合适(访问量过万的网站需要多大云服务器?)
- css中设置flex布局浮动是否会生效(深入理解CSS系列之flex兼容)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9