Работы учёных Центра ИИ МГУ на ICCV 2025

Центр представил 2 работы на одном из самых авторитетных форумов мирового сообщества компьютерного зрения — конференции ICCV 2025. Обе статьи вошли в категорию highlight (топ‑9,7% принятых статей).

В первом исследовании учёные предложили способ интеграции оценки визуального качества непосредственно в архитектуру диффузионных моделей.

Современные Text‑to‑Image системы часто испытывают трудности при передаче абстрактных описаний в осмысленные визуальные характеристики. Новый метод от МГУ позволяет использовать модели оценки качества (IQA) как «руководство» для генератора, превращая такие сложные критерии, как эстетичность или техническая аккуратность, в понятный сигнал для управления процессом генерации.

Это делает поведение модели устойчивее и предсказуемее, позволяя пользователю задавать желаемый уровень качества напрямую — без «магических» текстовых подсказок вроде «high quality» или «ultra HD».

Ознакомиться с исследованием: Статья | Код | Видео

Вторая работа предлагает новый подход к решению одной из ключевых задач компьютерного зрения — построению оптического потока для видео. Разработчики Центра добились SOTA‑результатов на бенчмарках Spring, Sintel и KITTI‑2015, при этом существенно снизив требования к вычислительным ресурсам: всего 2 ГБ видеопамяти при инференсе на FullHD‑видео против 8+ ГБ у ближайших конкурентов.

Метод позволяет эффективно использовать многокадровую информацию без потерь в качестве, открывая путь к высокоточным и доступным решениям для анализа движений в видео.

Ознакомиться: Статья | Код | Страница | Colab | Демо | Модели