-
仿人机器人的进展:全面回顾与未来展望
本文全面回顾了仿人机器人的现状、进展和未来前景,强调其在推动下一代产业发展中的重要意义。通过整合多学科研究成果,全面分析各方面工作和关键技术,包括本体结构、控制、决策、感知和交互,为仿人机器人的研究现状提供了详尽概述。文章指出了该领域新兴挑战,特别强调了深入了解生物运动机制、改进结构设计、加强材料应用、先进的驱动和控制方法以及有效利用能源的必要性。技术创新使得人形机器人成为下一代产业的引领力量,重点强调仿生学、类脑启发智能、机械和控制的整合,认为这是开发先进仿人机器人系统的极具潜力的方向。论文提供了丰富的资料,为研究人员和从业者提供了有价值的资源,促进了仿人机器人在不同领域的潜力发展,推动了相关领域的跨学科融合。
넶0 2024-09-25 -
中国科学院工业视觉智能装备技术工程实验室在工业视觉检测方面取得新研究进展
在全球智能制造领域,智能检测装备的重要性日益凸显,成为推动产业升级的关键力量。2023年,工信部等七部委联合发布《智能检测装备产业发展行动计划》指出“智能检测装备作为智能制造的核心装备,是工业六基的重要组成和产业基础高级化的重要领域”。中国科学院工业视觉智能装备技术工程实验室,发挥我所在人工智能领域基础研究的优势,对标国家工程实验室标准,面向行业重大需求,聚焦工业视觉检测方面持续研究十余年,近期在工业缺陷小样本数据生成与扩增、工业缺陷的异常检测等理论研究和关键技术上,取得新的研究进展。相关成果发表或录用在国际顶会ECCV2024、国际顶级期刊IEEE TIM、IEEE/CAA J. Automatica Sinica上。
넶203 2024-07-19 -
基于几何和学习的场景三维结构化建模
基于图像或激光雷达重建的复杂室内外场景三维模型一般具有较高的数据冗余性,其模型表达通常采取稠密三维点云、稠密三角网格、稠密纹理网格等形式。这种表达方式一方面会给存储、传输、渲染等带来较大的计算压力,另一方面也缺乏三维场景的结构化信息。因此,将高度冗余的点云/网格模型转化为高度结构化和轻量化的三维表达,是降低三维模型冗余、提高模型结构化层级的重要手段,也是地理信息、工业孪生、逆向建模等领域的重要需求。针对这一问题,实验室三维视觉研究部开展了深入研究,分别从几何视角和学习视角提出了新的计算框架和解决方案,近期两项研究成果被计算机视觉领域权威国际会议ECCV 2024接收。
넶212 2024-07-19 -
基于几何和学习的全局式从运动恢复结构
作为大规模场景三维重建问题的基础能力,从运动恢复结构(Structure-from-Motion, SfM)旨在通过海量二维图像精准鲁棒的求解相机空间位姿和相机内参数,也就是带有位姿的归一化图像(Posed images)。Posed images不仅是后续三维几何重建的基本输入,也是包括NeRF、3DGS在内的各种渲染算法的基本输入。SfM问题同样也是传统多视图几何理论的集大成者,蕴含了最小配置解、最大似然估计、几何意义解等关键思想。虽然已历经几十年的研究,但是面对大规模复杂场景下的海量图像数据,SfM问题在鲁棒性、计算效率、精确性等方面仍然面临多重问题。实验室三维视觉研究部针对这一问题长期开展理论方法研究,近期两项研究成果被计算机视觉领域权威国际会议CVPR 2024接收。
넶225 2024-04-17 -
工业表面缺陷异常检测方法
在实际工业场景中,缺陷样本的稀缺性、标注成本的高昂以及缺陷先验知识的缺乏可能会导致基于有监督的深度学习方法失效。工业异常检测方法相比于依赖大量有标注的样本模型,它只利用无缺陷样本来解决表面缺陷检测问题。团队提出了基于双孪生网络的表面缺陷无监督异常检测方法。与现有从图像级(图像重构)或仅从正常样本的特征(判别性嵌入)学习表示的方法不同,该算法充分考虑了正常和异常信息,挖掘正常和异常区域在特征层面上的位置关系,创新性地将异常检测问题描述为双孪生网络框架下特征重构和修复的联合问题。
넶539 2023-02-13 -
面向隐私保护的无数据量化方法
模型量化是压缩和加速深度神经网络的关键技术,对推动深度学习算法落地起到至关重要的作用。然而,几乎所有现有的量化方法都严重依赖原始训练数据集进行微调,而由于隐私和安全问题,这些数据集在许多实际场景中无法获取。为了解决这个问题,基于模型中的先验信息生成样本的无数据量化方法成为新兴的研究领域。然而,现有的方法未能充分地利用先验信息,因此不能完全恢复真实数据的特征,也不能对量化后的模型提供有效的监督,导致性能不佳。为此,高速视觉研究部团队提出一种新型的具有对抗性学习风格的无数据量化框架,如图1所示,其中两个鉴别器分别促进BN层分布的匹配和最大化全精度模型和量化模型之间的差异,能够有效地生成样本并学习量化模型。
넶153 2023-02-07