发布时间:2024-11-15 14:38:03 来源: sp20241115
5月21日,深圳市跨模态认知计算重点实验室、香港中文大学(深圳)趣丸科技联合实验室揭牌仪式在港中大(深圳)校园举行。本次校企合作将依托实验室整合双方优势资源,针对人工智能音频大模型相关的前沿课题进行研究,旨在突破行业难题,促进产学研深度融合,打造技术领先的生成式音频大模型,填补业界空白。
汇聚科技精粹力量 抢占科创新高地
生成式AI技术和相关产品在近两年快速崛起,并逐步融入各个产业。当前AI音频生成技术虽能模仿与人声相似度极高的音色,但在情绪、情感、语调等方面表现不足。香港中文大学(深圳)趣丸科技联合实验室将围绕支持跨语种、多方言的语音克隆和翻译等技术,以低成本、高效率形式,生成具备高自然度音色、韵律、情绪的可编辑音频,打造业界领先的生成式音频大模型,推动具有国际影响力的创新成果转化。
港中大(深圳)汇聚了一支具备国际一流水平的师资队伍,在学术界和工业界相关领域具有显著影响力。趣丸科技作为国家高新技术企业,在音频处理技术领域深耕多年,基于旗下产品TT语音的属性特点积累了海量数据场景,将能发挥平台资源优势应用于AI音频模型的研究。双方团队成立委员会共同管理联合实验室,港中大(深圳)数据科学学院执行院长李海洲担任联合实验室管理委员会主任,学院副教授武执政、趣丸科技副总裁张顺四分别担任主任及联合主任,主要进行人工智能音频领域前沿技术的研究、成果发布等工作,并将定期组织技术、政策、人才交流,分享国内外最新研究动态和市场动态。“还会有博士生、本科生同学与企业工程师协同研究,这种深度合作的模式是非常少见的,也是一种新的探索,”武执政补充道,“学生们不出校园就能与企业工程师交流和工作,能了解科研应用场景和市场动态,这对学生以后创新创业是非常有帮助。”
“我们将合力突破行业难题,打造生成式音频大模型。逐步探索以企业资源、市场资源和高校人才构建起的AI+行业生态模式,为培育新质生产力按下“加速键”,激发粤港澳大湾区产业发展新动能。”张顺四介绍,研究将会稳步推进阶段性的成果落地,可实现视频翻译、语音播报、语言学习等功能,推进文化出海,助力高质量共建“一带一路”。
打造“双核驱动”格局 加快培育新质生产力
随着《广东省人民政府关于加快建设通用人工智能产业创新引领地的实施意见》出台,广东通用人工智能产业将迎来革新发展,《意见》重点提出22条政策举措,力争在算力、算法、数据、产业等方面取得重大突破,推进产业科技创新,发展新质生产力是广东战略之举、长远之策。
趣丸科技积极发挥企业科创主体作用,目前已构建全栈式AI交互技术产业生态,先后获得国家高新技术企业、广东省专精特新中小企业与广州市民营领军企业等资质和荣誉。聚焦生成式3D大模型、生成式音频大模型、生成式动作大模型与对话大模型开展技术自研和规模化落地,推动企业高质量发展与产业智能化升级。在AI技术领域已提供一站式的数智人应用解决方案,部分成果已在直播电商、政务服务、智能客服等领域实现商业化应用。去年,趣丸科技与香港科技大学(广州)开展战略合作,围绕多模态AIGC与智能三维生成技术进行研究,实现低成本生成高质量可编辑三维人体、物体、场景模型,未来可高效赋能医疗、智能制造、数字孪生、工业制造及智能家居等领域。
至此,趣丸科技与港中大(深圳)、港科大(广州)两所顶尖学府合力创新,形成“双核驱动”格局,为产业高质量发展提供全球化视野和动能源泉,促进了创新链、人才链与产业链融合,加快新质生产力的形成,推动产业向“新”而行、以“新”提质。
(责编:董童、李源)