合合信息获中国信通院OCR服务智能化“增强级”等级评估，助力可信AI发展

图源：中国信通院

新民晚报讯（记者金志刚）作为将图像信息转换为文字信息的关键技术，OCR（光学字符识别）技术能够在多场景下实现数据信息提取，有效提高业务效率，被广泛应用于金融、交通、医疗等多个领域。OCR技术的不断进步能够帮助机器更好地理解图像和文档，有助于推动AI在图像识别与文档处理领域中的可信化落地。近日，合合信息通过中国信息通信研究院（以下简称“中国信通院”）“可信AI—OCR智能化服务”评估工作，并获得“增强级”评级。

近年来，我国对数据的重视程度不断加强。2022年1月，国务院印发的《“十四五”数字经济发展规划》进一步提出，到2025年要初步建立数据要素市场体系，并对充分发挥数据要素价值作出重要部署。然而，现阶段有大量的数据信息以图片形式存储，数据流通仍存在隐形的壁垒。

现阶段，由于OCR标准体系尚不健全，技术和产业缺少统一指导，市场上的OCR产品类目繁多，却未就“智能化”相关定义形成清晰的概念，给消费者在选购产品、政府在审批企业项目、平台企业管理产品准入时带来了选型难题。

中国信通院持续关注OCR技术及应用的发展情况，联合业内多家企业共同制定《OCR服务智能化分级技术要求和评估方法》，制定了OCR服务在功能、性能、安全等方面的技术要求以及评估方法，为OCR、智能文档处理技术的研发和产业应用提供参考。OCR智能化服务评估依据《OCR服务智能化分级技术要求和评估方法》开展，共涉及3大能力域、6项能力项及十余项关键指标，综合评估OCR产品的功能、性能和服务成熟度。

其中，功能维度涵盖基础类功能测试和增强类功能测试两个方面，从卡证类、票据类、通用表格、通用图片等文字识别服务层面，综合评估OCR智能化产品的功能；性能维度涵盖多种常见业务场景的文字识别性能测试，例如卡证类文字识别、票据类文字识别等，针对字符准确率/召回率、字段准确率/召回率等指标客观评估OCR智能化服务的实际应用效果；服务成熟度包括安全性和可靠性两个能力项，主要评估OCR智能化产品是否具备服务可靠性和安全性保障策略。

本轮测试中，合合信息智能文字识别产品顺利通过全部7项基础类功能指标测试以及9项增强类功能指标测试，获得“增强级”评级，其智能文字识别产品展现出良好的性能和服务成熟度。以具有较大难度的证件类和票据类性能测试为例，面对旋转、阴影、反光、褶皱、形变、模糊、多语言、低像素、光照不均等复杂场景，合合信息智能文字识别产品均有较高的识别准确率，字符准确率分别为99.21%和99.59%，字段准确率分别为97.87%和98.42%。

此外，测试结果显示，合合信息智能文字识别产品支持超过50种复杂语言的识别，为全球化、多语言背景下的信息智能识别提供了技术支撑。现阶段，合合信息智能文字识别技术已落地于银行、保险、证券、制造、政务等近30个行业，服务全球超过200个国家和地区的个人及企业用户。

举报/反馈

新民晚报

4132万获赞 195.5万粉丝

阅读上海的第一选择，你在上海的生活助手

新民晚报官方账号

关注