当前位置:文档之家› 最简单的屏幕OCR文字识别

最简单的屏幕OCR文字识别

最简单的屏幕OCR文字识别编程者说 2008-05-22 13:40:37 阅读747 评论0 字号:大中小 订阅 .

使用office2003附带的MODI可以进行OCR文字识别,不需要取样,使用简单,识别率很不错。
适合用于识别比较规范的文本。缺点是必须安装office2003及Microsoft Document Imaging组件。

这种方法适合于普通印刷体文字识别,不太适合做验证码识别。


使用MODI进行文字识别,简单讲,只需要下面几步:

MODI.Document doc = new MODI.Document();

doc.Create(fileName);

MODI.Image img = (MODI.Image)doc.Images[0];
https://www.doczj.com/doc/9e10614951.html,ANGUAGES lang = https://www.doczj.com/doc/9e10614951.html,ANG_CHINESE_SIMPLIFIED;
img.OCR(lang, true, true);

string result= https://www.doczj.com/doc/9e10614951.html,yout.Text;

doc.Close(false);


miLANG_CHINESE_SIMPLIFIED可以识别中文与英文,但如果只有英文,应该设定英文语言,正确的指定语言ID可以提高识别率。

注:参考文献中的选择语言的代码已经过时了,直接用内部的枚举就可以了,而且从枚举来看,现在的MODI已经支持超过10中语言了。


使用office2003附带的MODI可以进行OCR文字识别,不需要取样,使用简单,识别率很不错。
适合用于识别比较规范的文本。缺点是必须安装office2003及Microsoft Document Imaging组件。

这种方法适合于普通文字识别,不太适合做验证码识别。
验证码识别请参考教程:https://www.doczj.com/doc/9e10614951.html,/ape/book/fap/f2/ix.html

本程序使用了comx插件,请参考贴子:https://www.doczj.com/doc/9e10614951.html,/bbs/dispbbs.asp?BoardID=4&ID=179&replyID=

下面是演示源代码:

下载模拟精灵: https://www.doczj.com/doc/9e10614951.html,/Fairy_Ape.exe
打开模拟精灵,把下面的代码粘贴到源码编辑,按F5运行即可。

img = image.new();--创建一个图片对象
img:capture(0,100,200,300,400);--抓屏,范围x=100,y=200,宽=300,高=400
img:save(_LASDIR.."\\test.bmp"); --保存图片到脚本目录(也就是_LASDIR)下

--导入comx插件
import("std");
import2("comx","https://www.doczj.com/doc/9e10614951.html,/ape/import/comx/comx.dll");

--创建MODI对象(必须安装office2003中的Microsoft Document Imaging组件)
mdoc = comx.CreateObject("MODI.Document");
if(not mdoc)then
win.messageBox("请将安装office2003及Microsoft Document Imaging组件","屏幕ocr文字识别")
return
false;
end;

--导入图片
mdoc:Create(_LASDIR.."\\test.bmp");
--进行OCR识别,参数分别为语言ID,是否自动诱转,是否自动拉伸
mdoc:OCR( 0x804,_FALSE,_FALSE);

local mi = mdoc.Images(0);
--快速获取取全部文本
win.messageBox(https://www.doczj.com/doc/9e10614951.html,yout.Text,"mdoc.Images(0).Layout.Text");

--获取字符详细信息
local word = https://www.doczj.com/doc/9e10614951.html,yout.Words(0)
local str = "Id: " .. word.Id .. "\r\n"

str = str .. "Line Id: " .. word.LineId .. "\r\n";
str = str .. "Region Id: " .. word.R

egionId .. "\r\n";
str = str .. "Font Id: " .. word.FontId .. "\r\n";
str = str .. "Recognition confidence: " .. word.RecognitionConfidence .. "\r\n";
str = str .. "Text: " .. word.Text;

win.messageBox(str,"mdoc.Images(0).Layout.Words(0)")

mdoc:OCR 函数的第一个参数指定语言ID
在简体中文office中可选的语言ID有:

自动选择 0x800
英语 9
简体中文 0x804
在繁体中文office中可选的语言ID有:

自动选择 0x800
英语 9
繁体中文 0x404
正确的指定语言ID可以提高识别率。
如果mdoc:OCR 没有在图片中找到文字,会报错并终止模拟程序。


相关主题
文本预览
相关文档 最新文档