Кафедра программирования механико-математического факультета Новосибирского государственного университета
Оптимизация долгосрочной награды в рекомендательных системах с применением обучения с подкреплением / Reinforcement learning for long-term reward optimization in recommender systems