南科大余剑峤团队在智慧交通领域取得多项研究成果

2020年09月15日科研新闻

近期，南方科技大学计算机科学与工程系助理教授余剑峤课题组在智慧交通领域取得一系列科研进展，在IEEE Internet of Things Journal，IEEE Transactions on Intelligent Transportation Systems，Transportation Research Part C: Emerging Technologies等期刊，以及2020年IEEE国际智能交通系统会议上共发表6篇论文。

余剑桥主图.jpg

交通信息预测是交通运输研究中的关键问题，现有的预测方法虽然基于深度学习以及大数据集表现出色，但是往往忽略了这些共享数据可能包含敏感的隐私信息，有隐私泄露的风险。

图片1.png

图1. 交通流预测中的隐私与安全问题

余剑峤课题组以“Privacy-preserving Traffic Flow Prediction: A Federated Learning Approach”为题，提出了基于联合学习的门控循环单元神经网络算法（FedGRU），在隐私保护的约束下准确预测交通流，相关研究内容发表在物联网领域顶级期刊IEEE Internet of Things Journal。

图片2.png

图2. 基于联邦学习的交通流预测架构

图片3.png

图3. 联邦学习联合声明协议（左)，安全参数聚合机制（右）

该算法将联邦学习与GRU结合，不会直接访问分布式组织数据，而是采用安全参数聚合机制在云中聚合分布式训练到的局部模型。此外，其采用联合平均算法（FedAVG）进行随机子采样以减少模型参数传输过程中的通信开销，同时引入一个联合公告协议（Joint-Announcement）来提高算法的可扩展性。与传统方法相比，此算法在同等的预测精度下，无需共享隐私数据集，可降低隐私泄露的危险。

该论文的第一作者为南科大访问学生刘毅，余剑峤为论文通讯作者，新加坡南洋理工大学教授Dusit Niyato，博士后Jiawen Kang以及南科大2017级本科生张舒昱为论文合作者。南科大为论文第一通讯单位。

图4. GCGA模型示意图

实时交通速度估计是实现现代运输控制和管理的基础。目前工业上主要通过采用固定速度传感器和车辆全球定位系统（GPS）记录来实现，但是这种方式存在速度数据不完整的问题。此外，现有的方法没有利用相邻道路实时交通速度之间的空间相关性，仅通过采集单条道路的数据执行估计算法来构建模型，计算效率低。

课题组在智能交通系统领域顶级期刊IEEE Transactions on Intelligent Transportation Systems上发表了题为“Real-Time Traffic Speed Estimation with Graph Convolutional Generative Autoencoder”的论文，提出了一种新的深度学习模型GCGA，该模型结合最新的深度学习技术，利用少数众包车辆提供GPS记录，实现大区域的实时速度估计。

与传统方法相比，该模型可以提取交通网络中与图有关的空间特征，一次绘制交通速度图，同时减少对固定速度传感器的依赖，充分利用动态、独立和不完整的车载GPS记录数据。余剑峤介绍，此方案可以取得目前已知最优的预测精度，另外，GCGA有望作为一个通用的图形特征生成方法，应用于蛋白质自动合成、分子结构预测等其他研究领域。

余剑峤为该论文的第一作者及通讯作者，香港大学电气与电子工程系研究员Jiatao Gu及国际知名企业研究员为合作作者，南科大为第一单位。

图5. 提出的出行模型识别机制的数据流

交通模式识别作为智能交通系统中的另一项基本任务，目前的研究主要基于可提供有关个人出行方式的详细且精确信息的GPS数据，但是其面临特征选择不足，数据维数高以及数据利用不足等问题。

图6. 提出的出行模型识别器示意图

余剑峤课题组提出了一种基于离散小波变换（DWT）和深度学习技术（DNN）的新型出行模式识别机制。该机制利用DWT获得隐藏的时频域特征，并使用DNN推断出行模式。与先前的工作不同，该机制充分利用了GPS轨迹中的时间相关性来训练用于识别的智能系统，且不需要固定轨迹的长度，同时，由于DWT和DNN的计算效率高，采用该机制可实时进行整个识别过程。实验结果表明，该机制显着优于相同数据集上现有的行驶模式识别方法，并且计算时间短。

该机制是在出行模式识别中使用小波变换和递归神经网络的开创性研究之一，相关研究以“Travel Mode Identification with GPS Trajectories using Wavelet Transform and Deep Learning ”为题，发表在IEEE Transactions on Intelligent Transportation Systems，余剑峤为论文唯一作者。

图7. 数据处理流程

此外，目前出行模式识别的研究严重依赖于具有准确行驶模式信息的GPS轨迹的手动注释，存在效率低下且易出错的问题。为此，余剑峤课题组提出了一种基于代理标签的半监督深度集成学习方法。该方法利用集成四种网络的神经网络，基于少量已知的带注释数据，生成未标注数据的代理标签，并将其与原始注释数据一起用作训练目标，实现出行模式识别。

基于GeoLife数据集的案例研究证实了该方法的有效性。余剑峤介绍，与目前最先进的出行模式识别方法相比，该方法在相同数据集配置下取得的结果明显优于其他方法。相关研究成果以“Semi-supervised Deep Ensemble Learning for Travel Mode Identification”为题，发表在交通工程领域顶级期刊Transportation Research Part C，余剑峤为论文唯一作者。

图片8.png

图8. MultiMix的结构

除上述研究成果外，余剑峤课题组在2020年度IEEE国际智能交通系统会议上发表了多篇交通模式识别领域的研究论文，开创性地提出通过半监督及无监督学习方法进行出行模式识别的学习模型。

课题组以“MultiMix: A Multi-Task Deep Learning Approach for Travel Mode Identification with Few GPS Data”为题的会议论文，提出了基于GPS数据的另一种基于多任务的半监督学习框架的交通模式识别方法。该方法使用标记、未标记和合成数据来训练一个深度自动编码器，通过同时优化三个相应的目标函数来进行训练。案例学习结果表明，与以前的方法（有监督和半监督）相比,基于数据混合的多任务学习方法表现出最佳的识别性能。

论文第一作者为南科大2019级硕士研究生宋晓壮，通讯作者为余剑峤，南科大与悉尼科技大学联培博士研究生Christos Markos为论文合作者。

同时，课题组还在2020年IEEE国际智能交通系统会议上发表了题为“Unsupervised Deep Learning for GPS-Based Transportation Mode Identification”的论文，首次利用无监督深度学习方法对运输模式下的GPS轨迹数据进行聚类以进行交通模式识别。

该方法通过利用固定大小的轨迹段作为输入数据对深度卷积自编码器网络（CAE）进行预训练，并在CAE中的嵌入层上附加一个聚类层，将聚类中心保持为可训练的权重。之后通过重训练复合聚类模型来取得模型重构和聚类损失之间的平衡。在真实数据集上的实验证实该方法在交通模式识别方面显著优于传统聚类算法和半监督技术，无需使用任何标签就可取得具有竞争力的识别精度。论文的第一作者为南科大与悉尼科技大学联培博士Christos Markos，通讯作者为余剑峤。

以上几项工作获得国家自然科学基金、广东省自然科学基金、广东省类脑智能计算重点实验室等项目和机构的资助。

供稿单位：计算机科学与工程系

通讯员：余安琪

编辑：吴一敏

主图设计：丘妍