纸质文件数字化永远是我国信息时代政府企业办公不变的旋律,这种信息化管理的需求催生了一大批专业的系统集成商和IT信息服务商,通用软件也为用户节约了大量的成本和时间,但也因为差异化的逐步缩小带来了激烈的行业竞争,提供个性化增值服务逐渐成为IT信息服务商增强竞争力的关键和发展趋势。
日前,国内领先的OCR技术生产商、文档影像技术和应用解决方案提供商北京文通科技有限公司推出全新IT-DOC影像数据采集系统,集软硬件于一身,作为针对第三方开发商难题开发的通用程序组件为系统集成开发商和IT信息服务商提供了更加简洁、便利、易用的控件平台,更好的帮助其开发并满足日益个性化的用户需求,提升了市场竞争力。
软硬一体 功能齐全
在IT-DOC影像数据采集系统使用过程中,用户可以方便的进行纸质文档扫描,并且实现图像处理、版面分析、图像识别、校对,最终导出所需要的文件格式。
首先在图像采集环节,IT-DOC影像数据采集系统集软件硬件一体,可与平板扫描仪D300+、高速扫描DSL3100、DSL320相连,不管是单张扫描还是多张连续扫描,都可以轻松“搞定”,多张扫描速度可达35-70面/分钟。采集图像后,系统会自动进行图像处理,除具有一般OCR产品自动或手动倾斜校正,图像旋转,清除页面阴影、黑边、杂点的功能外,还可智能裁剪,对图像单个或批量删除。操作便捷,降低了办公成本,节约了工作时间和人工。
另外,它将档案、图书、公文、报纸等版面分为横排文本、竖排文本、图像、表格四种类型,自动进行版面分析,用户也可以亲自动手体验手动版面分析,良好的版面分析效果,保障了文字高识别率。
精准识别 逐字校对
据了解,IT-DOC影像数据采集系统延续了文通在OCR领域一贯的超强识别能力,其内置文通公司最新研发的高性能文字识别引擎,中文字识别率高达99.8%,英文、日文、韩文的识别率也居世界领先水平。采用的UNICODE国际编码标准可以在同一操作系统下同时处理中日韩等多种文字的识别和校对。而它所具有的增量识别功能,可保留其他已经完成校对的文字区域,只识别手工编辑修改过的或新增加的区域,灵活、方便的识别避免了重复操作,极大的节省了时间,在很大程度上提高了系统集成商的产品“卖点”和竞争力。
识别完成后通过横向文字校对功能,对识别结果与原始图像人工逐字逐句的比较,找到错误的地方并修改。而浮动跟踪条也提高了校对速度,直观、方便、快捷的看到对应显示的识别结果与原始图像。该控件可以导出TXT、RTF、XLS、双层PDF四种格式文件。而双层PDF在业内是标准文件检索格式,图像在上,文档在下的方式方便检索和管理。
特色应用
除了强大的产品功能外,便捷、高效的调用也是第三方开发商十分关心的问题。IT-DOC影像数据采集系统可以应用于C/S或B/S模式的应用系统,可以使用各种开发语言与开发工具在Windows平台上方便地进行接口调用,只要拥有开发能力,就可以使用该控件根据需求扩展开发。而与其相连的用户界面与调用接口都非常简洁易用,方便应对不同的系统模式,无论对于实际用户使用或者二次开发厂商都十分容易上手,不仅提高了用户或集成的开发速度,也提升了用户或集成商的竞争力。
据悉,IT-DOC影像数据采集系统可用于企业级协同办公软件厂商、项目管理系统厂商、内容管理厂商、大型集成商、软件开发商、ERP或财务软件等开发商,目前与集成商中科软件签订了战略合作协议。业内人士对此表示,为各种OA系统、文档管理系统、ERP系统增加纸质公文数字化处理能力是信息化发展不可回避的课题,功能强大、个性化的产品将为整个市场注入新的活力,也是IT信息服务商、系统集成商摆脱同质化竞争的重要砝码。
【免责声明】本文仅代表作者个人观点,与IT09数码网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件内容有任何疑问或质疑,请联系本网将迅速给您回应并做处理。