CSIG携手金山办公举办“企业行”专场 探讨AI时代文档识别前沿技术
5月7日,由中国图像图形学学会(CSIG)主办、金山办公承办的“CSIG企业行”系列活动在珠海金山软件园成功举
咸宁新闻网 2023-05-09 13:56:27
(资料图片仅供参考)
5月7日,由中国图像图形学学会(CSIG)主办、金山办公承办的“CSIG企业行”系列活动在珠海金山软件园成功举行。活动以“AI大模型时代文档识别和理解前沿技术探讨”为主题,特邀来自中科院、北京科技大学、华中科技大学、华南理工大学等院校的专家学者,与金山办公技术团队共同探讨文档识别领域的前沿技术研究及实践成果。
中国科学院自动化研究所副所长刘成林表示,大模型时代的开启为文档识别带来了新的机遇和挑战。从早期的单字识别到字符串整体识别,再到手写文档版面分析和自然场景、视频文本中的文本检测,文档识别目前已历经三个研究阶段。而近年来人工智能深度学习等技术的成熟,使大模型成为文档识别与理解的全新研究方向。
华中科技大学白翔教授针对视觉与语言模型的研究做了详细介绍,他认为这几年多模态和跨模态对各个领域都带来非常深远的影响,各行各业围绕大模型去做定制化方案,包括对大模型本身进行调整,都有重要意义。
华南理工大学金连文教授分享了面向文档图像的篡改文本检测的最新研究成果,金连文教授表示,SSL OCR 技术(使用SSL加密协议的OCR技术)、大模型与OCR结合、视觉大模型等是值得关注的技术方向。AI大模型技术无论是在垂直领域还是通用领域,均具备很大发展空间。
除前沿理论研究分享外,金山办公CV技术总监熊龙飞以扫描件PDF编辑为案例,分享了AI大模型时代文档识别技术的最新实践成果:扫描件PDF编辑新模态。扫描件PDF因变成了图片,其排版、内容、字体、段落等信息丢失,还可能存在污染、变形、对象层叠等问题,解决这些挑战对算法和服务架构有非常高的技术要求,金山办公经过多年研发已经将该领域做到了令人耳目一新的效果。据了解,该功能已于2023年3月逐步上线,在未来还将持续迭代。
针对大模型技术的实际应用,姚冬表示,大模型技术不仅可极大提高办公软件的工作效率,同时此类软件庞大的基础用户量,又为不断改进大模型提供了数据支撑。“金山办公在这个领域扮演的角色就是落地应用,金山办公具备大量的功能API接口,通过结合大模型可以调动这些能力,实现很多对用户很便利的功能。这些API能力背后是金山办公35年来在文档处理和排版领域的技术积累。”
据悉,金山办公基于大语言模型的人工智能应用“WPS AI”,第一站搭载在金山办公在线内容协作编辑产品轻文档上,未来WPS AI还将以用户体验为优先级,逐步嵌入金山办公全线产品。
5月7日,由中国图像图形学学会(CSIG)主办、金山办公承办的“CSIG企业行”系列活动在珠海金山软件园成功举
摘要:2023年05月09日永鼎股份(600105)股价大幅跳水7 13%,该股报5 85元 股,振幅10 62%。2023年05月09
中国网财经5月9日讯昨日,中国银行(601988)间市场交易商协会网站显示,江西银行股份有限公司(以下简称“江
大家上午好!昨天A股大涨,来一起关注今天上午的市场行情和最新资讯~5月9日上午,上证指数高开0 22%,直接
2023年宁波外籍学生怎么进行小学报名?报名时间5月18-22日(每天7:30—22:30)报名入口1、可以从浙江政务
西藏珠峰(600338)05月09日在投资者关系平台上答复了投资者关心的问题。
长沙都悦教育科技有限公司虚假骗钱投诉直通车是湖南日报、华声在线、新湖南主办的投诉维权类栏目,帮助解决
西安银行一字涨停,中国银行涨超5%创历史新高,厦门银行、建设银行、中信银行、光大银行、浙商银行等跟涨。
随时随地代替真人出镜,不愁“拖更”的出镜博主;不惧熬夜,能保证直播间24小时无休的带货主播;将人类从流
以下是果麦文化在北京时间5月9日09:59分盘口异动快照:5月9日,果麦文化盘中快速反弹,5分钟内涨幅超过2%,
5月8日,禾信仪器(688622)融资买入96 56万元,融资偿还60 82万元,融资净买入35 74万元,融资余额3952 5万元。
市面上有各种驱蚊产品,如蚊香、电蚊拍等,但此类驱蚊产品若使用不当,存在安全风险。近日,湖北鄂州一户居
1、橹字的拼音是lǔ,只有一个读音。2、橹字的基本释义:使船前进的工具,比桨长而大,安在船尾或船旁,用
想必现在有很多小伙伴对于高品质mp3下载无损MP3方面的知识都比较想要了解,那么今天小好小编就为大家收集了
长沙晚报全媒体记者周辉霞2023长沙国际工程机械展览会进入开幕倒计时。近2万平方米的工程机械再制造设备展