Центр представил 2 работы на одном из самых авторитетных форумов мирового сообщества компьютерного зрения — конференции ICCV 2025. Обе статьи вошли в категорию highlight (топ‑9,7% принятых статей).
В первом исследовании учёные предложили способ интеграции оценки визуального качества непосредственно в архитектуру диффузионных моделей.
Современные Text‑to‑Image системы часто испытывают трудности при передаче абстрактных описаний в осмысленные визуальные характеристики. Новый метод от МГУ позволяет использовать модели оценки качества (IQA) как «руководство» для генератора, превращая такие сложные критерии, как эстетичность или техническая аккуратность, в понятный сигнал для управления процессом генерации.
Это делает поведение модели устойчивее и предсказуемее, позволяя пользователю задавать желаемый уровень качества напрямую — без «магических» текстовых подсказок вроде «high quality» или «ultra HD».
Ознакомиться с исследованием: Статья | Код | Видео
Вторая работа предлагает новый подход к решению одной из ключевых задач компьютерного зрения — построению оптического потока для видео. Разработчики Центра добились SOTA‑результатов на бенчмарках Spring, Sintel и KITTI‑2015, при этом существенно снизив требования к вычислительным ресурсам: всего 2 ГБ видеопамяти при инференсе на FullHD‑видео против 8+ ГБ у ближайших конкурентов.
Метод позволяет эффективно использовать многокадровую информацию без потерь в качестве, открывая путь к высокоточным и доступным решениям для анализа движений в видео.
Ознакомиться: Статья | Код | Страница | Colab | Демо | Модели
В первом исследовании учёные предложили способ интеграции оценки визуального качества непосредственно в архитектуру диффузионных моделей.
Современные Text‑to‑Image системы часто испытывают трудности при передаче абстрактных описаний в осмысленные визуальные характеристики. Новый метод от МГУ позволяет использовать модели оценки качества (IQA) как «руководство» для генератора, превращая такие сложные критерии, как эстетичность или техническая аккуратность, в понятный сигнал для управления процессом генерации.
Это делает поведение модели устойчивее и предсказуемее, позволяя пользователю задавать желаемый уровень качества напрямую — без «магических» текстовых подсказок вроде «high quality» или «ultra HD».
Ознакомиться с исследованием: Статья | Код | Видео
Вторая работа предлагает новый подход к решению одной из ключевых задач компьютерного зрения — построению оптического потока для видео. Разработчики Центра добились SOTA‑результатов на бенчмарках Spring, Sintel и KITTI‑2015, при этом существенно снизив требования к вычислительным ресурсам: всего 2 ГБ видеопамяти при инференсе на FullHD‑видео против 8+ ГБ у ближайших конкурентов.
Метод позволяет эффективно использовать многокадровую информацию без потерь в качестве, открывая путь к высокоточным и доступным решениям для анализа движений в видео.
Ознакомиться: Статья | Код | Страница | Colab | Демо | Модели