近日,我校计算机科学与工程系副教授张进课题组三篇论文被国际顶级学术会议UbiComp2024录用为长文并在大会上做口头报告,另有一篇论文被UbiComp2024合办的WellComp Workshop录用,获WellComp最佳论文奖。
从左至右 徐驰、谢文涛、张进副教授、孙涛
工作一:EyeGesener: Eye Gesture Listener for Smart Glasses Interaction using Acoustic Sensing
目前的智能眼镜多依赖手势或语音进行交互,在双手被占用的场景下,体验并不理想。研究团队提出了EyeGesener,一种基于声学感知的眼动姿势识别系统。通过眼镜框架上的扬声器和麦克风捕捉眼睛周围的细微皮肤运动,利用正交频分复用技术估算通道脉冲响应,从而实现对眼动姿势的精准识别。该工作能够有效区分日常眼动与用户的交互意图,避免误触问题。该系统采用了对抗训练策略,通过提取与用户无关的眼动特征,避免了为每个新用户重新训练模型的繁琐过程。研究团队从16名参与者中收集了实验数据,结果表明,EyeGesener能够以0.93的F1得分准确识别眼动姿势,且误报率仅为0.03。这项研究为智能眼镜的交互开辟了新的方向,未来有望在增强现实、虚拟现实及智能辅助设备等领域广泛应用。
该工作的共同第一作者是南方科技大学2022级硕士生孙涛和南方科技大学2024级硕士生赵彦凯。张进副教授为唯一通讯作者。
工作二:RimSense: Enabling Touch-based Interaction on Eyeglass Rim Using Piezoelectric Sensors
商业智能眼镜设备常用镜腿前端的触摸面板交互,但存在触摸面板与显示屏不在同一平面的缺点。研究团队提出了RimSense,一种利用眼镜镜框触摸手势的概念验证设计,通过压电传感器将镜框变为触敏表面,根据信道频率响应识别触摸手势。该研究采用带缓冲的啁啾信号提高感知精度和抗噪声能力,并提出深度学习框架与有限状态机算法集成,实现事件级预测。团队实现了一个功能性眼镜原型,使用两个商用PZT传感器,可以识别眼镜镜框上的八种触摸手势,并同时估计手势持续时间,允许不同长度的手势作为不同的输入。对30名受试者的评估显示,RimSense识别手势的F1得分为0.95,相对持续时间估计误差为11%。用户研究表明RimSense具有良好的性能、高可用性、易学性和愉悦性。受试者的反馈为未来眼镜设计提供了宝贵见解。
该研究工作的第一作者是2019级南方科技大学-香港科技大学联培博士生谢文涛。张进副教授为共同通讯作者,南科大为第一单位。
会议现场
工作三:DeepBreath: Breathing Exercise Assessment with a Depth Camera
对于慢性阻塞性肺病(COPD)患者而言,进行呼吸运动对提升肺功能至关重要。监督呼吸练习时,呼吸模式(胸式或腹式)和肺容量是两个关键指标。研究团队提出了DeepBreath,一个基于深度相机的呼吸练习评估新系统。团队将呼吸模式和肺容量视为相关指标,通过多任务学习框架协同估计,提升了呼吸模式分类性能。为实现免校准肺容量测量,DeepBreath采用数据驱动方法,利用创新的UNet深度学习模型,实现通用肺容量估计。系统还设计了轻量级轮廓分割模型,从先进大型分割模型迁移知识,增强了估计性能。DeepBreath开发了时间感知的身体运动补偿算法,应对非自主运动干扰。研究团队与一个临床中心合作,对22名健康受试者和14名COPD患者进行了实验,实验结果表明,与之前的工作相比,DeepBreath能够在更加现实的设置下实现高精度的呼吸指标估计。
该研究工作的共同第一作者是2019级南方科技大学-香港科技大学联培博士生谢文涛和2023级香港科技大学博士生徐驰(2019级南科大计算机系本科生)。该工作在张进副教授和港科大张黔讲席教授共同指导下完成。
工作四:AcousAF: Acoustic Sensing-Based Atrial Fibrillation Detection System for Mobile Phones
该论文提出了一套基于智能手机的房颤检测系统,突破了传统心脏监测技术的局限,开辟了房颤监测的新途径。系统通过智能手机扬声器和麦克风从手腕采集脉搏波,并结合精心设计的脉搏波探测信号、脉搏波提取和房颤检测算法,确保了检测的准确性和可靠性。研究团队从20名参与者收集数据,并通过广泛的实验验证了该系统的高性能,实现了92.8%的检测准确率。该项工作荣获了WellComp的最佳论文奖。
该研究工作的第一作者是南方科技大学2021级本科生刘轩宇。张进副教授为唯一通讯作者。
获奖证书
据悉,UbiComp,是由ACM举办的国际人机交互与普适计算领域顶级学术会议,也是中国计算机学会(CCF)推荐的A类会议。会议内容涵盖了普适、泛在与可穿戴计算技术的设计、开发和部署,以及这些技术对人类体验和社会影响的理解。
文章链接:
https://doi.org/10.1145/3678541
https://doi.org/10.1145/3631456
https://doi.org/10.1145/3678519
https://dl.acm.org/doi/10.1145/3675094.3678488
供稿单位:计算机科学与工程系
通讯员:潘伟英
编辑:周易霖