原文:Monocular Human Pose Estimation: A Survey of Deep Learning-based Methods摘要:基于视觉的单目人体姿态估计是计算机视觉中最基本、最具挑战性的问题之一,其目的是从输入的图像或视频序列中获取人体的姿态。近年来,深度学习技术在人体姿态估计领域取得了重大进展和突破。本调查广泛回顾了自2014年以来发表的基于深度学习的2D和3D人体姿势估计方法。一、Introduction人体姿态估计(HPE)任务已经发展了几十年,其目标是从给定的传感器输入中获取人体的姿态。基于视觉的方法经常被用来通过使用摄像机来提供这样的解决方案。近年来,随着深度学习在图像分类、目标检测、语义分割等许多计算机版本任务中表现出良好的性能,人体姿态估计也通过采用深度学习技术获得了快速的发展。主要发展包括设计良好的网络,具有很强的估计能力,更丰富的数据集和更实际的身体模型探索。虽然已有一些关于人体姿态估计的综述,但是仍然缺乏一个综述来总结基于深度学习的最新成果。本文综述了基于深度学习的2D/三维人体姿态估计方法。依赖于其他传感器的算法,如深度、红外光源、射频信号和多视图输入不包括在本次调查中。作为计算机视觉的基础任务之一,人体姿态估计是一个非常重要的研究领域,可以应用于许多应用领域,如动作/活动识别、动作检测、人体跟踪、电影和动画、虚拟现实、人机交互、视频监控、医疗救护、自动驾驶、运动分析等。电影和动画:各种生动形象的数字人物的产生离不开对人类动作的捕捉。廉价准确的人体运动捕捉系统可以更好地促进数字娱乐产业的发展。虚拟现实:虚拟现实是一种非常有前途的技术,可以应用于教育和娱乐。通过对人体姿态的估计,可以进一步明确人与虚拟现实世界的关系,增强交互体验。人机交互:人体姿态估计对于计算机和机器人更好地理解人的身份、位置和行为是非常重要的。以人类的姿势(例如。手势),计算机和机器人可以以一种简单的方式执行指令,而且更加智能。视频监控:视频监控是早期采用人体姿态估计技术对特定范围内的人进行跟踪、动作识别、再识别的应用之一。医疗救助:在医疗救助的应用中,人体姿态估计可以为医生提供定量的人体运动信息,特别是康复训练和体能训练治疗。自动驾驶:先进的自动驾驶技术发展迅速。有了人体姿态估计,自动驾驶汽车可以对行人做出更恰当的反应,并与交通协调员进行更全面的互动。运动分析:通过对运动员在运动视频中的姿势进行估计,可以进一步得到运动员各项指标(如跑步距离、跳跃次数)的统计数据。在训练过程中,人体姿态估计可以提供动作细节的定量分析。