新闻动态

 

实验室新闻

  • 智能工业视觉前沿讲堂:走向计算机视觉的通用人工智能

    报告题目:走向计算机视觉的通用人工智能-GPT和大语言模型带来的启发,报告人:谢凌曦,华为,报告摘要:通用人工智能(AGI)是AI领域的最高目标。近来,大语言模型驱动的对话系统,在NLP领域展现出了强大的能力,甚至被认为是AGI的雏形。然而,CV领域自然没有找到发展AGI的有效路径。我们希望分析其中的本质原因,并且借鉴NLP的经验以走出困境。在这次报告中,我们将从AGI的定义和NLP所达到的成就说起,揭示AGI的关键在于设计大一统模型。随后,我们简要回顾CV领域在大一统方面的努力,并指出CV的本质困难在于无法建立起有效的交互环境,长期以来只能依靠代理任务来推进研究,而这种范式已经走到尽头。在此基础上,我们设想未来CV的新范式,即从建立大规模交互环境,通过生成式预训练和指令微调的方式来学习,并展望几个重要的研究方向。

    92 2023-09-22
  • 智能工业视觉前沿讲堂:视觉基础模型及应用

    报告题目:视觉基础模型及应用,报告人:鲁继文,清华大学,报告摘要:基础模型是人工智能领域的研究热点,在计算机视觉和自然语言处理等领域中均取得了优异的性能,是视觉监控、自动驾驶、智能终端等重要应用的支撑性技术。报告将从模型架构和学习范式两个方面回顾视觉基础模型近年来的研究进展,同时介绍清华大学智能视觉实验室在视觉基础模型方面所开展的一些工作,主要包括高阶交互模型、动态稀疏模型、全局滤波模型、球面分形模型等,以及它们在目标检测与分割、物体分类与识别、图像与视频检索、三维重建与理解等视觉任务中的应用。

    162 2023-04-27