党建新闻
澳门永利最老登录入口天工智能联席CEO兼昆仑万维2050全球研究院院长颜水成受邀

日期:2024-05-10 03:03:25
来源:西南永利402大学建筑学院

  永利。学术交流,澳门永利最老登录入口网址原标题:天工智能联席CEO兼昆仑万维2050全球研究院院长颜水成受邀在ICIP 2023发表演讲   ICIP 2023是全球图像处理及计算机视觉领域的顶级盛会之一,吸引了来自全球40多个国家的超过1000名研究人员、工程师、行业先驱等专业观众参与。基础模型(Foundation Models)是当前通用人工智能研究领域的核心技术澳门永利最

  永利✿ღ◈✿。学术交流✿ღ◈✿,澳门永利最老登录入口网址原标题✿ღ◈✿:天工智能联席CEO兼昆仑万维2050全球研究院院长颜水成受邀在ICIP 2023发表演讲

  ICIP 2023是全球图像处理及计算机视觉领域的顶级盛会之一✿ღ◈✿,吸引了来自全球40多个国家的超过1000名研究人员✿ღ◈✿、工程师✿ღ◈✿、行业先驱等专业观众参与✿ღ◈✿。基础模型(Foundation Models)是当前通用人工智能研究领域的核心技术澳门永利最老登录入口✿ღ◈✿,被认为是通用人工智能成功的关键之一✿ღ◈✿。在演讲中✿ღ◈✿,颜水成教授讨论了基础模型的三个根基✿ღ◈✿,介绍了最新的深度学习参数优化器✿ღ◈✿,脑神经科学如何推动深度学习网络架构的发展✿ღ◈✿,以及天工智能的大模型和业务落地的最新工作进展✿ღ◈✿。

  颜教授首先分享了最新的深度学习优化器成果✿ღ◈✿,然后重点介绍了在新一代深度学习网络架构方面的工作✿ღ◈✿。早在2014年✿ღ◈✿,颜水成团队就提出了Network in Network(NiN网络)✿ღ◈✿,第一次提出了1x1卷积✿ღ◈✿,当前已成为几乎所有后续深度学习模型的标准组件✿ღ◈✿,极大地推动了深度神经网络架构的创新✿ღ◈✿。此后✿ღ◈✿,颜水成团队还陆续提出了Dual-path Networks (2017)✿ღ◈✿、Vision Outlooker (2021)✿ღ◈✿、以及MetaFormer/PoolFormer(2022)等新一代深度学习模型架构创新✿ღ◈✿。

  尤其是在MetaFormer/PoolFormer网络中✿ღ◈✿,颜水成团队提出✿ღ◈✿,大模型底层技术Transformer在实际应用中的惊人效果并非源自于其自注意力模块或特定的Token混合模块✿ღ◈✿,而是在于Transformer的架构本身✿ღ◈✿,即元架构——MetaFormer✿ღ◈✿。团队将大模型中的注意力模块替换为简单的空间池化操作✿ღ◈✿,并将其命名为PoolFormer房探007郑州✿ღ◈✿。这一极简的新型网络架构在多个计算机视觉任务上都取得了极为优秀的性能表现✿ღ◈✿。

  自深度神经网络方向创立以来澳门永利最老登录入口✿ღ◈✿,脑神经科学就在不断推动人工智能网络架构发展✿ღ◈✿。除了上述提到的众多新型网络架构外✿ღ◈✿,在本次演讲中✿ღ◈✿,颜水成教授进一步介绍了团队目前正在研发的坐标化记忆(Coordinated Memory)技术的最新进展✿ღ◈✿。基于脑神经科学界的最新学术突破澳门永利最老登录入口✿ღ◈✿,颜水成团队正在设计一款基于坐标化记忆的可持续基础模型网络架构(Continuable Foundation Model)✿ღ◈✿,瞄准大模型现有的灾难性遗忘✿ღ◈✿、持续学习✿ღ◈✿、多模态信息共享✿ღ◈✿、记忆访问开销等问题房探007郑州✿ღ◈✿,将神经网络分解成任务网络与记忆模块✿ღ◈✿,设计出新一代人工智能基础网络架构✿ღ◈✿,并已在多项测试中取得了良好效果✿ღ◈✿。

  而在大模型的落地应用方面✿ღ◈✿,颜水成教授在演讲中分享了天工智能在大模型落地上的最新进展✿ღ◈✿。比如✿ღ◈✿,大模型“幻觉”问题——模型生成的文本或回复与原文产生信息冲突(Faithfulness)或者不符合基础事实(Factualness)——困扰学术与产业界已久✿ღ◈✿。这是一个普遍存在于众多大模型产品中的问题✿ღ◈✿,尤其是在多模态技术领域✿ღ◈✿。天工智能团队观察到✿ღ◈✿,当前的多模态大模型不仅普遍存在“幻觉”问题✿ღ◈✿,而且用户在向大模型询问输入图像中的不可见对象或事实冲突的相关问题时房探007郑州✿ღ◈✿,现有大模型更倾向于给出“是”或产生“幻觉”✿ღ◈✿。

  举例而言✿ღ◈✿,当用户向大模型展示一张没有头发的男性的照片✿ღ◈✿,并向模型询问“图中男人的头发是什么颜色?”时房探007郑州✿ღ◈✿,LLaVA与MiniGPT-4都给出了“这个男人的头发是黑色的”这一回答房探007郑州✿ღ◈✿,产生大模型“幻觉”✿ღ◈✿。针对这一普遍存在的困扰学术与产业界的问题房探007郑州✿ღ◈✿,天工智能团队从多方面入手✿ღ◈✿,从特定SFT数据集训练✿ღ◈✿、知识定义与诱导✿ღ◈✿、模型结构澳门永利最老登录入口✿ღ◈✿、训练方式等领域进行针对性的技术攻关✿ღ◈✿、研发与优化房探007郑州✿ღ◈✿。截止至2023年9月4日✿ღ◈✿,天工智能的Skywork-MM在多模态大语言模型测评MME(含14个涵盖感知和认知子任务评估)中综合得分排名第一✿ღ◈✿。

  截止至2023年9月4日✿ღ◈✿,昆仑万维的Skywork-MM在多模态大语言模型测评MME中综合得分排名第一

  颜水成教授是计算机视觉和机器学习领域的国际顶级专家✿ღ◈✿。2023年9月1日✿ღ◈✿,颜水成教授宣布正式加盟昆仑万维✿ღ◈✿,与昆仑万维创始人周亚辉一起出任天工智能联席CEO✿ღ◈✿,并兼任昆仑万维2050全球研究院院长✿ღ◈✿,主要研究方向包括✿ღ◈✿:(1)下一代Foundation Model的基础研究和研发✿ღ◈✿;(2)Agent的研发和智能体进化的研究✿ღ◈✿;(3)生物智能等前沿技术领域的探索✿ღ◈✿。昆仑万维将持续打造业界领先的人工智能团队澳门永利最老登录入口✿ღ◈✿,推动天工大模型及AIGC业务迈向一个新高度✿ღ◈✿,加速AI产品的研发✿ღ◈✿、落地及商业化✿ღ◈✿,探索未知世界✿ღ◈✿、创造美好未来✿ღ◈✿。