近日,计算机与网络安全学院(示范性软件学院)2020级人工智能系本科生张子宏同学以第一作者身份在人工智能领域国际知名期刊Knowledge-Based Systems(中科院一区,影响因子:7.2)上发表题为“Q-value-based experience replay in reinforcement learning”的研究论文。论文系张子宏同学在李瑞佳博士指导下,以其本科毕业论文为基础完善而成。目前该同学拟录取为电子科技大学硕士研究生。


论文相关图片
强化学习作为机器学习的重要范式,正引领着当前人工智能技术发展的新浪潮。本论文提出了一种基于Q值的经验回放方法和一个新的基于自我注意机制的critic网络,以实现多样性经验回放与策略优化的协同,缓解离线策略强化学习经验利用效率低下的问题。
我院人工智能专于2019年获批建设,并于2020年开启招生。自专业建立以来,学院高度重视人工智能创新人才的培养,人工智能系深入贯彻我校及我院的教育方针,实行“专业导师制”:为每位学生在配备专属指导教师,通过定期研讨、项目实践、学术指导等多元化形式,充分释放了学生的潜能,为学生提供了多元化的发展通道。截至目前,2020级60名学生已取得显著成果:发表学术论文10余篇,其中以第一作者身份在中科院一区期刊发表论文2篇;授权发明专利10余项;20余人在西安交通大学、电子科技大学、北京邮电大学等高校攻读研究生。