“北有中关村,南有马栏山”。湖南省马栏山计算媒体研究院成立于2019年,致力于发展马栏山音视频产业,打造全球性的、集聚所有视频内容制作产业链关键要素的平台。经过四年的发展,研究院已在多个方面取得了显著成绩,在新的一年里,也将不忘初心,砥砺前行,作为新质生产力继续努力。践行文化和科技融合,催生更多新业态贡献自己的力量。
湖南省马栏山计算媒体研究院是马栏山视频文创园发文(长马园管函[2019]53号)、省工信厅为业务主管部门、省民政厅颁发执照的独立法人科研机构。
湖南省计算媒体研究院主要通过数字人SaaS平台提供数字人制作的全栈流程以及赋予AI驱动的能力,其中手语也属于计算媒体技术的典型分支应用领域。目前SaaS平台还在持续扩展应用,包括文生图、文生视频等。
研究院法人——高春鸣教授,从2007年主持国家863数字媒体项目起,提出并开始研究计算媒体,主持此方向国家及省级科技项目12项总投入达5000多万。2017年开始,以计算媒体技术赋能长沙千博信息技术有限公司开发人工智能手语的应用,2017年12月完成计算媒体平台架构,在2019年11月年完成手语计算云平台及系列智能终端。主持部、省、市三级科技项目14项。并获得2023年度湖南省科技创业领军人才(拔尖)的荣誉。
技术研发
围绕音视频处理、人工智能、大数据等领域开展了一系列技术研发工作,成功推出了多项具有国际竞争力的核心技术,为我国音视频产业的技术创新提供了有力支持。
产业协同
01.北京理工大学“多模态交互与媒体计算联合实验室”。
02.湖南大学“人工智能与计算媒体研究生创新基地”。
03.武汉理工大学“智能手语联合实验室”。
04.获得“长沙市音视频合成处理人工智能开放创新平台”。
05.获得湖南省科学技术厅认定的“湖南省新型研发机构”。
06.21年8 月牵头成立了湖南省人工智能协会智慧文创专委会。
07.2023年,获批长沙市科技局重大专项“岳麓·多模态图-文-音-语义手势大模型研究与示范应用”。
08.2024年3月14日,获批全省人工智能大模型技术应用项目建设计划“基于多模态大模型的数字人AI驱动平台”。
展会曝光2023
5月23日,湘江人工智能高峰论坛暨长沙昇腾人工智能创新中心启动仪式。
7月11日,中国新媒体大会上展示手语数字人的最新应用成果。
9月3日,长沙市科技重大专项“岳麓·多模态图-文-音-语义手势大模型研究与示范应用”项目科研会议。
9月20日,参加“虚实相生,产业赋能”为主题的WMC2023第二届世界元宇宙大会,并展示了语言大模型支持的文旅多模态数字人等产品与技术服务。
10月25日,高春鸣教授出席在合肥举办的讯飞星火大模型生态论坛暨昇腾AI开发者创享日活动,聚焦人工智能与计算媒体技术研发与产业化应用。
11月3日,高春鸣教授作为多模态人工智能产业联合体理事会常务理事参加中国光谷·多模态人工智能大会暨多模态人工智能产业联合体第三次全体会议,与武汉人工智能研究院签署战略合作协议。
下一步计划2024
3D数字人AI驱动
在服务总线层支撑下,按需动态组合基础模型与算法层的计算建模、行为驱动、语言智能、语音技术四个模块API功能,包括计算建模、手势生成、口形语音匹配、人脸表情、语言伴随肢体动作、行走、动作重定向、自然语言处理、情感分析、智能对话、自由聊天、语音合成等功能节点,并采用语义描述语言将多种模态、多种类型的深度学习模型算法进行整合,解决数字人多模态之间同步和协调。
提供影视级高逼真数字人多场景应用,实现人脸重建精度达到毫米级、拟人动作组合、人脸表情、口唇动画及协调准确性超过85%,可感知、识别、生成包括表情、歌舞、演唱、说话伴随行为等多模态行为。
多模态大模型研究
在多模态生成与交互领域,基于自研的岳麓•语言-视觉-语音-行为多模态大模型,对本单位及合作单位提供的语言文本1T、舞蹈数据50万条、人脸数据10万个等数据进行训练,结合模型集成、权重合并、模型融合三种多模型融合方式,形成新型多模态大模型网络架构,并在推理层采用SaaS组合形成数字人行为生成与交互工作流。