我需要使用Matlab(或其他可以执行此操作的语言)开发一个光学字符识别程序,以便能够提取这张照片上的读数。
该程序必须能够上传尽可能多的图片文件,因为我需要处理大约40000张图片。
该任务的总体目的是记录照片中所示特定燃气表的日内燃气读数。这是当前设置的网络摄像头,可对其进行编程以每分钟记录一次读数,因此OCR程序将有助于随后获得历史性的盘中天然气读数数据。
哪个是最好的软件,并且有任何在线资源可用于此?
回答:
我将分解基本的识别步骤如下:
- 在图像中找到仪表显示
- 隔离并清理数字
- 计算特征
- 使用您通过历史示例训练的模型对每个数字进行分类
假设特定位置的相机不移动,则步骤1仅需执行一次。第2步将包括增强对比度和过滤噪声之类的操作。步骤3可以包括您可以想到的任何有用的计算,例如“墨水”(白色)像素的均值和偏度。第4步将利用您构建的模型将单个数字分类为'0','1',...'9',并且可以使用k最近邻,逻辑回归,SVM,神经网络等完成。
更多&回答...