Научное исследование направлено на исследование применения архитектуры «трансформер» к различным задачам обработки последовательностей данных. Адаптация существующих архитектур языковых моделей и разработка доменных текстовых представлений для отраслевых задач (в химии и материаловедении) позволят продвинуться в их решении, расширить область применимости передовых алгоритмов искусственного интеллекта, и, потенциально, обогатить базовый инструментарий: например, в области препроцессинга данных и предобучения. Также в рамках данной тематики планируется проведение исследования и создание фундаментальных моделей для различных классов мультимодальных задач, а именно расширение области применимости мультимодальных языковых моделей путем их использования для перехода между ранее не задействованными в подобном контексте модальностями (огрубленные представления кристаллической структуры и электронные свойства). Кроме того, также в рамках научного исследования по данной тематике планируется развитие метода переноса знания для малоресурсных задач. Предполагается, что дообучение моделей на данных, размеченных отраслевыми экспертами, будет способствовать более широкому использованию инструментов искусственного интеллекта в химии и материаловедении, упрощая обработку и интерпретацию данных. Создание фреймворка для цифрового дизайна функциональных материалов с использованием гибридных алгоритмов и квантовохимических методов позволит ускорить процесс разработки новых веществ и материалов.
Руководитель проекта: Королев Вадим Викторович