(10分钟完成模型开发!合合信息智能文字识别服务平台亮相1024程序员节)

宝宝起名 0 52

(10分钟完成模型开发!合合信息智能文字识别服务平台亮相1024程序员节),第1张

1024是2的十次方,也是二进制计数的基本计量单位之一。因此成为每年10月24日中国程序员的盛会。近日,CSDN(中国开发者网)第三届“1024程序员节”(简称“大会”)成功举办。来自Linaro等开源组织的领导和来自微软、腾讯、华为、合和信息等公司的技术专家陆续登陆主论坛重磅活动《全体会议:2022技术英雄》,与观众共话技术。


如何从数据中发现更多的价值,找到更实用的开发工具,是程序员关注的话题。何信息智能创新事业部总经理唐琦受邀分享了智能文档处理的技术优化方法和开源渠道介绍,得到了众多开发者的认可。



(10分钟完成模型开发!合合信息智能文字识别服务平台亮相1024程序员节),第2张

“智能文档处理”越来越受开发者欢迎(来源:CSDN官网)


智能文档处理技术本质上是将文档中的信息从载体中分离出来,连接到其他系统,通过数据流转实现流程自动化的技术。一个典型的场景,比如文档自动审批,就是先检测文档图像,从中提取所需信息,输入系统。经过结构化处理后,会翻译成机器能理解的东西,然后自动判断,从而节省人力成本,提高工作效率。


唐琦在分享中指出,采集设备的不确定性和文档格式的多样性,往往会导致文档处理中出现“字迹模糊、不准确、不完整、难以理解”四种问题。在图像质量增强领域,如曲率校正、云纹去除(屏幕云纹)等方面有深入的研究,为后续的信息提取、存储、检索和管理工作创造了良好的环境。


“在各种场景的实践中,我们发现简单的字符识别不足以支持更细致的文档处理需求,版面元素分析是基础。”唐琦提到,在文档处理过程中,要注重对印章、logo、水印、页眉、二维码、公式等元素的检测,并根据检测结果采取相应的版面分析方法,得到更加准确的识别结果。


如何让经过市场检验的技术产品惠及更多开发者?服务共享是推动科技创新的重要渠道。合和信息将把其在制造、金融、物流等30个行业打磨的核心技术产品“智能字符识别服务平台”(简称“平台”)以SaaS的形式免费开放给个人开发者,帮助用户低成本、高效率地获取符合个性化需求的定制模型。



(10分钟完成模型开发!合合信息智能文字识别服务平台亮相1024程序员节),第2张

受远程办公趋势和“无纸化”环保倡导的影响,对智能文档处理技术的需求日益增加。据介绍,合和信息智能文档处理技术可以支持全球50多种主流语言的印刷体和手写体字符的高精度识别,以及增值税发票、出租车车票等20多种票据的识别。这些通用的识别和信息提取能力都承载在合和信息智能字符识别服务平台SaaS版上,并在大会上开放试用。


该平台提供了快速生成海量训练数据、自动生成模型、完整的模型训练和测试等功能。用户只需要10个样本,通过云端的简单操作就可以开始训练。


据悉,在实测中,应用人员最快可在10分钟内完成提取模型开发全过程,可视化界面设计让没有算法基础的业务人员也能流畅使用。


通讯员何贺