肌电手势数据集以前臂表面肌电信号(sEMG)为核心采集对象,目标是建立肌肉激活模式与手势类别之间的可重复映射关系。当前主流数据集可分为两类:以 Ninapro 系列为代表的标准稀疏电极数据集,以及以 CapgMyo 和 CSL-HDEMG 为代表的高密度 sEMG 数据集。
Ninapro 系列
Ninapro(Non-Invasive Adaptive Prosthetics)是目前规模最大、覆盖最系统的公开肌电手势数据库,由瑞士 HES-SO 等机构持续构建,自 2014 年起陆续发布 10 个子数据库(DB1–DB10),累计覆盖 180 余项数据采集,受试者兼含健全人与前臂截肢者。
DB1–DB7 的采集遵循统一范式:受试者观看屏幕上的手势示范视频,依次重复执行每类手势 10 次,分三个练习组完成——手指基本动作、等距/等张手部配置与基本腕部动作、握持与功能性动作。
| 数据库 | 年份 | 手势类 | 受试者 | 通道数 | 采样率 | 传感器模态 | 核心研究问题 |
|---|---|---|---|---|---|---|---|
| DB1 | 2014 | 52 | 27 | 10 | 100 Hz | sEMG + 运动学 | 分类基准建立 |
| DB2 | 2014 | 49 | 40 | 12 | 2000 Hz | sEMG + 运动学 + IMU + 力 | 多模态扩展 |
| DB3 | 2014 | 49 | 11(截肢) | 12 | 2000 Hz | sEMG + 运动学 + IMU + 力 | 截肢者适用性 |
| DB4 | 2017 | 52 | 10 | 12 | 2000 Hz | sEMG + 运动学 | 采集设备对比 |
| DB5 | 2017 | 52 | 10 | 16 | 200 Hz | sEMG + 运动学 | 低成本 Myo Armband |
| DB6 | 2017 | 7 | 10 | 14 | 2000 Hz | sEMG | 跨日重复性 |
| DB7 | 2017 | 40 | 22 | 12 | 2000 Hz | sEMG + IMU | IMU 辅助控制 |
| DB8 | 2019 | 9 | 12 | 8 | 2000 Hz | sEMG | 指关节连续解码 |
| DB9 | 2020 | 52 | 77 | — | 100 Hz | 仅运动学 | 运动学基准库 |
| DB10 | 2020 | 15 | 45 | 16 | 2000 Hz | sEMG + IMU + 眼动 | 假肢+眼手协调 |
三个关键节点
DB3(2014)——截肢者数据的引入。在 DB1/DB2 健全受试者基准建立后,DB3 立即纳入 11 名前臂截肢者,测试幻肢运动意图的 sEMG 可识别性。截肢者的残端肌肉激活模式与健全人存在显著差异,DB3 的加入使 Ninapro 具备了临床假肢控制研究的基础条件。
DB6(2017)——跨日稳定性的正视。DB6 专门针对 sEMG 的时间非平稳性问题设计,要求同一受试者在连续 5 天、每天 2 次的条件下重复采集相同的 7 类抓握手势。这是 Ninapro 系列中唯一以稳定性衰减而非分类准确率为核心研究目标的数据库。
DB8(2019)——从分类到回归的范式转变。DB8 放弃离散手势分类,转而采集连续手指动作的关节角度序列,任务目标变为从 8 通道 sEMG 连续预测指关节弯曲角度。这标志着肌电领域进入连续解码范式。
高密度 sEMG 数据集
标准稀疏电极(8–16 通道)仅能捕获局部肌肉的平均激活强度,而高密度 sEMG(HD-sEMG)通过密集电极阵列获取前臂肌肉的空间激活分布图,从根本上改变了特征提取的信息维度。
CapgMyo DB-a(2016)由浙江大学发布,采用 8×16 矩阵差分电极阵列,共 128 个通道。核心贡献在于将 sEMG 信号视为二维肌电图像处理:每个时刻的 128 通道信号构成一张空间激活热力图,单帧可达 89.3% 识别准确率,结合多数投票机制可提升至 99%。
CSL-HDEMG(2015)由不来梅大学发布,采用 7×24 双极电极阵列,共 192 个通道(业界通道密度最高),采样率 2048 Hz。其通道数消融实验可量化确定维持特定精度所需的最低电极密度,为可穿戴设备硬件设计提供直接依据。
EMGLAB 平台
EMGLAB 并非手势分类数据集,而是一个用于 EMG 信号分解与标注的软件平台与数据库站点,主要用于运动单位分解(Motor Unit Decomposition)、神经肌肉疾病研究和针极/表面 EMG 信号分析,最初面向 ALS 等神经退行性疾病研究。
以 EMGLAB 中常用的 N2001 数据库为例:包含正常对照组(10 名,21–37 岁)、肌病患者组(7 名)和 ALS 患者组(8 名)的 EMG 记录,采自针极/细针电极,每条信号有高采样率原始 EMG 波形,常被机器学习和医学信号分析研究引用。EMGLAB 的价值在于提供了高质量的临床 EMG 基准数据,为手势识别算法在医疗场景的适用性研究提供参照。
CapgMyo 与 CSL-HDEMG 代表了高密度 sEMG 数据集的两种设计哲学:前者以瞬时图像为核心,追求单帧识别率;后者以通道消融为核心,追求最低硬件成本下的精度下限。两者共同推动了 HD-sEMG 从实验室走向可穿戴设备的工程化路径。