Xiong Jiechao

Born and raised in Yuyao, China. Devoted to Mathematical Olympiad in middle school and high school. Then I got B.S. in Mathematics and Applied Mathematics and PHD in Statistics at School of Mathematical Science, Peking University. Now, I am a senior researcher at Tencent AI Lab & Robotics X on reinforcement learning. My major interests include deep learning, reinforcement learning.

2008-2012 Peking University

School of Mathematical Science. Bachelor of Science in Mathematics and Applied Mathematics.

2009-2012 Peking University

National School of Development. Bachelor of Economics (Double-Major).

2012-2017 Peking University

School of Mathematical Science & Beijing International Center for Mathematical Research. PHD of Statistics.

2017 - Present

Tencent Inc. ShenZhen

Senior Researcher at Tencent AI Lab & Robotics X on reinforcement learning.

Silver Medal of 2008 Chinese Mathematical Olympiad

P.L. Hsu-C.C. Lin Bronze Medal of S. T. Yau College Student Mathematics Contests 2011.

National Scholarship and Merit Student of Peking University, in 2010, 2013 and 2015.

Haobo Fu, Ye Tian, Hongxiang Yu, Weiming Liu, Shuang Wu, Jiechao Xiong, Ying Wen, Kai Li, Junliang Xing, Qiang Fu, Wei Yang, "Greedy when Sure and Conservative when Uncertain about the Opponents", The Thirty-nineth International Conference on Machine Learning (ICML), 2022.

Lei Han, Jiechao Xiong, Peng Sun, Xinghai Sun, Meng Fang, Qingwei Guo, Qiaobo Chen, Tengfei Shi, Hongsheng Yu, Zhengyou Zhang, "TStarBot-X: An Open-Sourced and Comprehensive Study for Efficient League Training in StarCraft II Full Game", arXiv 2020.

Peng Sun, Jiechao Xiong, Lei Han, Xinhai Sun, Shuxing Li, Jiawei Xu, Meng Fang, Zhengyou Zhang, "TLeague: A Framework for Competitive Self-Play based Distributed Multi-Agent Reinforcement Learning", arXiv 2020.

Qianqian Xu, Jiechao Xiong, Zhiyong Yang, Xiaochun Cao, Qingming Huang, Yuan Yao, "Who Likes What? – SplitLBI in Exploring Preferential Diversity of Ratings", The Thirty-Fourth AAAI Conference on Artificial Intelligence (AAAI), 2020.

Qing Wang, Yingru Li, Jiechao Xiong, Tong Zhang, "Divergence-Augmented Policy Optimization", Thirty-third Conference on Neural Information Processing Systems, NeurIPS, 2019.

Qing Wang∗, Jiechao Xiong∗, Lei Han, Meng Fang, Xinghai Sun, Zhuobin Zheng, Peng Sun, Zhengyou Zhang, "Arena: a toolkit for Multi-Agent Reinforcement Learning", arXiv 2019 .

Lei Han*, Peng Sun*, Yali Du*, Jiechao Xiong, Qing Wang, Xinghai Sun, Han Liu, Tong Zhang, "Grid-Wise Control for Multi-Agent Reinforcement Learning in Video Game AI", The Thirty-sixth International Conference on Machine Learning (ICML), 2019.

Peng Sun, Xinghai Sun, Lei Han, Jiechao Xiong, Qing Wang, Bo Li, Yang Zheng, Ji Liu, Yongsheng Liu, Han Liu, Tong Zhang, "Tstarbots: Defeating the cheating level builtin ai in starcraft ii in the full game", arXiv 2018.

Jiechao Xiong, Qing Wang, Zhuoran Yang, Peng Sun, Lei Han, Yang Zheng, Haobo Fu, Tong Zhang, Ji Liu, Han Liu, "Parametrized deep q-networks learning: Reinforcement learning with discrete-continuous hybrid action space", arXiv 2018.

Qing Wang, Jiechao Xiong, Lei Han, Peng Sun, Han Liu, Tong Zhang, "Exponentially weighted imitation learning for batched historical data", Thirty-second Conference on Neural Information Processing Systems, NeurIPS, 2018.

Chendi Huang, Xinwei Sun, Jiechao Xiong, Yuan Yao, "Boosting with structural sparsity: A differential inclusion approach", Applied and Computational Harmonic Analysis, 2018.

Qianqian Xu, Jiechao Xiong, Xiaochun Cao, Qingming Huang, Yuan Yao, "From Social to Individuals: a Parsimonious Path of Multi-level Models for Crowdsourced Preference Aggregation", IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI, 2018.

Qianqian Xu, Jiechao Xiong, Xinwei Sun, Zhiyong Yang, Xiaochun Cao, Qingming Huang and Yuan Yao, "A Margin-based MLE for Crowdsourced Partial Ranking", ACM Conference on Multimedia, ACM MM 2018.

Qianqian Xu, Jiechao Xiong, Xi Chen, Qingming Huang, Yuan Yao, "HodgeRank with Information Maximization for Crowdsourced Pairwise Ranking Aggregation", The Thirty-Second AAAI Conference on Artificial Intelligence (AAAI-18), 2018.

Ke Ma, Jinshan Zeng, Jiechao Xiong, Qianqian Xu, Xiaochun Cao, Wei Liu, Yuan Yao, "Stochastic Non-Convex Ordinal Embedding with Stabilized Barzilai-Borwein Step Size", The Thirty-Second AAAI Conference on Artificial Intelligence (AAAI-18), 2018.

Qianqian Xu, Ming Yan, Chendi Huang, Jiechao Xiong, Qingming Huang, Yuan Yao, "Exploring Outliers in Crowdsourced Ranking for QoE", ACM Conference on Multimedia, ACM MM 2017.

Qianqian Xu, Jiechao Xiong, Xiaochun Cao, Yuan Yao, "Parsimonious Mixed-Effects HodgeRank for Crowdsourced Preference Aggregation", ACM Conference on Multimedia, ACM MM 2016.

Qianqian Xu , Jiechao Xiong , Xiaochun Cao, Yuan Yao, "False Discovery Rate Control and Statistical Quality Assessment of Annotator", International Conference on Machine Learning (ICML 2016), 2016.

Chendi Huang, Xinwei Sun, Jiechao Xiong, Yuan Yao, "Split LBI: An Iterative Regularization Path with Structural Sparsity", Neural Information Processing Systems (NIPS 2016), 2016.

Braxton Osting, Jiechao Xiong, Qianqian Xu, Yuan Yao, "Analysis of Crowdsourced Sampling Strategies for HodgeRank with Sparse Random Graphs", Applied and Computational Harmonic Analysis, 2016.

Stanley Osher, Feng Ruan, Jiechao Xiong, Yuan Yao, Wotao Yin, "Sparse Recovery via Differential Inclusions", Applied and Computational Harmonic Analysis, 2016.

Yanwei Fu, Timothy M.Hospedales, Tao Xiang, Jiechao Xiong, Shaogang Gong, Yizhou Wang, Yuan Yao, "Robust Subjective Visual Property Prediction from Crowdsourced Pairwise Labels", IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015.

Qianqian Xu, Jiechao Xiong, Qingming Huang, Yuan Yao, "Online HodgeRank on Random Graphs for Crowdsourceable QoE Evaluation", IEEE Transactions on Multimedia, 2014.

Qianqian Xu, Jiechao Xiong, Qingming Huang, Yuan Yao, "Robust Evaluation for Quality of Experience in Crowdsourcing", ACM Conference on Multimedia, ACM MM 2013.

PYTHON90%

C60%

R90%

MATLAB90%