1月11日,由国家工业信息安全发展研究中心主办,科大讯飞股份有限公司、国家语音及图像识别产品质量检验检测中心、国家智能语音创新中心协办的中国智能语音产业发展高峰论坛暨2022年中国语音产业联盟年会成功举办。
会上,中国语音产业联盟发布了《中国智能语音产业发展报告(2021-2022)》(以下简称“报告”)。报告指出,我国智能语音产业整体发展环境积极向好,多项关键技术取得突破,已形成大中小企业融通创新、协同发展的健康生态。
工信部信息技术发展司副司长王威伟表示,智能语音产业作为新一代信息技术和人工智能产业的重要组成部分,必将迎来更大的发展机遇,在促进经济社会发展和数字化转型中发挥更加重要的引领和支撑作用。
市场规模高速增长 龙头企业占据主导份额
智能语音作为智能时代人机交互的关键接口,各行业爆发式的场景需求驱动行业发展进入黄金期,技术突破和应用落地不断深入。从全球范围来看,2022年全球智能语音产业规模将达351.2亿美元,保持33.1%的高速增长;从我国来看,根据德勤统计数据,2022年我国智能语音市场将达341亿元,同比增长13.4%。
报告指出,以科大讯飞为代表的语音龙头企业布局较广,是行业创新发展的支柱,占据较大市场份额。同时,科大讯飞、百度、阿里等龙头企业通过打造技术能力开放平台,构建开源生态,引领行业技术创新和应用开发。以讯飞开放平台为例,目前已开放545项AI产品及能力,聚集超过380.5万开发者团队,开发出超过159.5万个AI应用,并从AI龙头+开发者的“二维”生态,升级到AI龙头+行业龙头+开发者的“三维”生态,联合行业龙头搭建基线系统,让更多开发者参与到数字经济浪潮中。
关键技术实现突破 筑牢行业坚实底座
“2022年是智能语音技术突破的关键年。”报告指出,我国智能语音企业在多项难点技术上实现新的突破。纵向上从语音识别、合成、翻译向计算机视觉、认知智能、运动智能领域延伸,横向上从单点技术突破模式发展到机器认知、多模式复杂场景应用。
在语音识别方面,视听融合的多模态交互技术成为技术演进的主要方向。科大讯飞多模语音增强技术融合语音与视觉的多模感知,让高噪音场景下的语音交互跨过实用门槛,率先在车载、会议、地铁购票和医疗挂号等场景落地。此外,针对低资源语音识别难题,海天瑞声和科大讯飞分别从语音数据和算法层面推动技术进步。
在语音合成方面,随着电商直播等行业的繁荣,语音合成技术也表现出拟人化、口语化的发展趋势。科大讯飞多风格多情感语音合成系统可提供11种强度可调的情感合成能力。而火山语音的超自然对话语音合成和META的语音对语音翻译通过在模型训练中添加副语言数据,让语音交互更加自然和个性化。
对于如何促进智能语音技术持续突破,与会专家从两个方向提出了发展路径。中国科学院院士姚建铨指出,针对智能语音多学科交叉的学科特性,研究人员需要探索新原理、新机制、新材料、新工艺和新器件,集成创新推动核心技术进步。另一方面,语音技术需要进一步向深度理解延伸。“更先进的语音交互系统不仅要‘能听会说’,还要深度地去理解人的信息。”科大讯飞总裁吴晓如表示,自然语言理解和知识推理技术的进步,让机器可以在越来越多的领域帮助人类解决更专业和复杂的问题。
应用规模化落地 加速与实体经济融合
报告指出,受疫情和产业数字化、智能化转型影响,智能语音应用场景迅速铺开。据德勤统计数据,预计到2030年,智能语音消费级和企业级应用市场将分别超过700亿元和千亿元的规模。
在消费者产品领域,AI学习机、翻译笔等AI+学习产品帮助学生学习减负增效;智能录音笔、智能办公本、智能鼠标等AI+办公产品深受职场人士欢迎;AI翻译机、智能麦克风、智能语音键盘、智能耳机、智能助听器等AI+生活产品,让更多人享受AI科技的便利。
在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。以科大讯飞为代表的国内AI龙头已占据中国语音交互车端应用行业的领先地位。
在运营商领域,智能语音技术与健康养老、家庭教育、家庭娱乐等场景结合,带来更加智慧的家庭生活体验。融合5G与机器翻译技术的无障碍智能通信,让普通的5G手机用户,不用下载任何软件,就可以使用实时翻译和转写服务,实现跨语种的无障碍视频通话。
在教育领域,科大讯飞全球中文学习平台已覆盖全球183个国家,吸引300多万海外中文学习爱好者使用;利用智能语音和人工智能技术可实现英语听说教、学、考、评、管一站式服务,减少无效训练。
在医疗领域,2022年疫情期间,科大讯飞电话机器人助力全国31个省112个地市疫情排查,累计服务超1.1亿人次;智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。
在城市领域,智能语音技术已在安徽省一体化网上政务服务平台、聊城城市大脑、三亚市崖州湾科技城智慧产城园区、天津市AI银发智能服务平台等创新示范项目中应用。姚建铨院士指出,智能语音与建设智慧城市的要求完全吻合,可以实现各种语音高效转换和智能处理,为智慧城市进一步建设带来新的机遇。
在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新“国家队”, 开展工业声学、多语种、AI语音芯片等关键共性技术研究工作。科大讯飞联合国家智能语音创新中心打造的工业听诊器、声学成像仪、工业设备卫士、智能巡检机器人等“工业六感”产品,已广泛应用到生产、质检、巡检等多个工业环节。
在金融领域,声纹识别技术已经被应用在各类身份认证环节。北京得意音通技术有限责任公司董事长郑方表示,声纹是目前除DNA外最可靠的身份认证方式,相比传统方法具有明显优势。此外,科大讯飞智能客服机器人、智能联络中心AICC等AI+金融应用,可帮助金融机构提升客服和运营效率。
欲了解更多,点击进入 国家智能语音创新中心公共检测服务平台 >>
[ 来源:新华社客户端 ] 编辑:张圣斌
版权与免责声明:
① 凡本网注明"来源:我要测网"的所有作品,版权均属于我要测网,未经本网授权不得转载、摘编或利用其它方式使用。想要转载本网作品,请联系:cs@woyaoce.cn。已获本网授权的作品,应在授权范围内使用,并注明"来源:我要测网"。违者本网将追究相关法律责任。
② 本网凡注明"来源:xxx(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。
③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为默认我要测网有权进行转载。