南科大毕业生蓝桥、吕博杰在顶级期刊上发表学术论文
2020年07月02日 科研新闻 浏览量 :1030

近日,南方科技大学电子与电气工程系2019届本科毕业生蓝桥作为第一作者、2020届硕士毕业生吕博杰作为第二作者,在IEEE Transactions on Wireless Communications (IEEE TWC)上发表了题为“Adaptive Video Streaming for Massive MIMO Networks via Approximate MDP and Reinforcement Learning”的论文。该论文由电子系副教授王锐和教授贡毅指导。

f99cae6c506dbc49d984fa66364370a.jpg

随着高速无线网络和智能个人终端的普及,视频流内容在无线流量中占据的比例正在快速上升。该论文研究面对用户使用的大规模多天线网络,将视频和无线资源分配问题建模为一个无限阶段折扣马尔科夫决策过程。为解决此问题中的“维度灾难”,论文提出基线策略并推导此基线策略的值函数的渐进闭式表达。对上述表达式进行一步迭代可以获得更优的策略。当表达式中的部分统计参数(如用户的平均到达率)未知时,调度系统可以学习这些参数。与需要学习值函数或Q函数的传统强化学习和深度强化学习不同,此处调度系统利用已有的表达式,仅需学习少量统计参数,从而大大降低了复杂度。这一套方法可以被拓展到其它具有复杂动态过程的无线资源分配问题。

2.jpg

论文中提出的低复杂度算法框架

论文的部分研究发表于通信领域两大旗舰会议之一的IEEE ICC 2020。论文的第一作者蓝桥2019年本科毕业后附香港大学攻读博士学位,第二作者吕博杰2018年于南科大本科毕业后就读于南科大-哈工大联合培养硕士研究生项目,并将攻读南科大博士学位。王锐为论文第一通讯作者,南科大为论文第一通讯单位,合作单位包括鹏城实验室和香港大学。

 

论文链接:

https://ieeexplore.ieee.org/document/9103310

 

供稿:电子与电气工程系

通讯员:李佰英

编辑:苗雪宁