Новости Центра

Научные семинары Центра ИИ МГУ

На очередном научном семинаре Центра И И учёные обсудили задачи последовательного принятия решений, так называемых «стохастических многоруких бандитов».

Этот метод машинного обучения используется в финансах, онлайн-торговле, рекомендательных системах, здравоохранении и других областях. «Бандиты» могут решать задачи адаптивно, потому что при их использовании не нужно ждать окончания A/B-теста.

Учёные обсудили 2 подхода к решению — сведение к онлайн-оптимизации и UCB-алгоритм. Одно из последних исследований Центра связано с переходом от «многоруких бандитов» к стохастической оптимизации. При таком подходе к каждой «руке» соотносят не случайную величику, а функцию.

Научные семинары Центра — еженедельное обсуждение главных результатов исследований.