• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Ученые ВШЭ оптимизировали обучение генеративных потоковых нейросетей

Ученые ВШЭ оптимизировали обучение генеративных потоковых нейросетей

© iStock

Исследователи факультета компьютерных наук НИУ ВШЭ улучшили метод обучения генеративных потоковых нейросетей для работы с неструктурированными задачами. Это поможет искать новые лекарства эффективнее. Результаты работы были представлены на одной из ведущих конференций по машинному обучению — ICLR 2025. Текст работы доступен в репозитории Arxiv.org.

Генеративные потоковые сети (GFlowNets) — особый тип алгоритмов машинного обучения, который строит сложные объекты шаг за шагом. Ученые применяют их для поиска белков, лекарств и оптимизации транспортных систем. 

Чтобы GFlowNets находили такие сложные структуры, исследователи объясняют им  свойства объекта, который они хотели бы получить. Чем ближе решение нейросети по свойствам к заданным, тем более высокую награду она получит. Сеть стремится решить задачу так, чтобы получить максимальный приз. На данные она не обращает внимание, только на вознаграждение. Оно вычисляется через уравнение, которое называют функцией вознаграждения.

Процесс поиска сложного объекта можно сравнить со сборкой модели из блоков Lego. Вы последовательно добавляете детали, пока не получится что-то цельное, при этом у каждого объекта есть своя заданная ценность. Собранная модель растения, например, может оцениваться дороже модели животного. В отличие от других методов машинного обучения, которые будут стремиться любой ценой получить растение, GFlowNets будут собирать много разных объектов, но растения чаще, чем животных: так выгоднее.

При таком типе поиска GFlowNets используют две вероятностные модели, которые работают в паре: прямую и обратную. Прямая модель — прораб-строитель, который решает, куда идти дальше, и предсказывает вероятность последующего состояния, а обратная модель — эксперт-разборщик, который определяет, каким был предыдущий шаг. Важно, чтобы эти потоки были сбалансированы, но сделать это очень сложно. Во-первых, требуются большие вычислительные мощности, во-вторых, обратная модель не обладает достаточной гибкостью: обычно исследователи запрещают ей меняться в процессе поиска и подсматривать за действиями прямой.

Ученые НИУ ВШЭ нашли способ оптимизировать обратную модель с помощью метода Trajectory Likelihood Maximization (TLM). Они доработали алгоритмы обратной модели таким образом, чтобы она могла постоянно сверяться с действиями прямой модели.

Тимофей Грицаев

«Мы сделали так, что поиск оптимального решения стал похож на переговоры, в которых обе стороны готовы менять свою позицию. В  задачах с большой степенью неизвестности обратная модель — лишь вспомогательный инструмент, улучшающий результаты прямой модели. Мы искали способ сделать работу обратной модели гибкой и наконец смогли его получить», — поясняет один из авторов работы, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Тимофей Грицаев.

После внедрения TLM функция вознаграждения, описывающая успешность решения задачи для обратной модели, стала сложнее. Однако, несмотря на увеличение сложности, вся система поиска стала быстрее и эффективнее.

Никита Морозов

«Наш метод заметно быстрее просматривает пространство возможных решений и находит больше качественных вариантов. Этот подход в целом сближает генеративные модели с методами обучения с подкреплением», — говорит Никита Морозов, младший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.

Авторы исследования уверены, что их работа поможет специалистам, применяющим GFlowNets в различных областях, таких как поиск новых лекарственных соединений, разработка материалов с заданными свойствами, а также тонкая настройка крупных языковых моделей. Благодаря способности таких сетей эффективно исследовать огромное пространство решений и быстро находить наиболее оптимальные варианты можно заметно сократить нагрузку на вычислительные мощности.

Вам также может быть интересно:

«Fall into ML прочно утвердилась в календаре знаковых событий российской ИИ-сцены»

24–25 октября в Центре культур НИУ ВШЭ Институт искусственного интеллекта и цифровых наук факультета компьютерных наук организует четвертую ежегодную конференцию Fall into ML 2025. Мероприятие традиционно поддерживает генеральный партнер — Сбербанк. В фокусе — прорывные исследования и будущее фундаментального ИИ.

Исследователи НИУ ВШЭ ответят на вызовы развития городского транспорта

В НИУ ВШЭ стартовало масштабное исследование общественного транспорта российских городов в рамках стратегического технологического проекта «Национальный центр социально-экономического и научно-технологического прогнозирования». По итогам проекта будет сформирована динамическая база данных для четырех видов транспорта: метро, трамваев, троллейбусов и автобусов.

Стартует новый норматив технологической грамотности ТехноГТО «Искусственный интеллект»

Открыт новый норматив технологической грамотности ТехноГТО по направлению «Искусственный интеллект», разработанный совместно с Академией искусственного интеллекта для школьников Благотворительного фонда Сбербанка «Вклад в будущее». Проект ТехноГТО является частью Национальной технологической олимпиады (НТО) и реализуется Кружковым движением НТИ совместно с президентской платформой «Россия — страна возможностей» и Движением Первых при поддержке НИУ ВШЭ и Росмолодежи.

НИУ ВШЭ начал разработку отечественных технологий связи 6G на базе субтерагерцовой микрорадиоэлектроники

В Высшей школе экономики стартовали масштабные научно-инженерные работы по созданию отечественных технологий для перспективных систем связи шестого поколения (6G). Работы ведутся командой стратегического технологического проекта «Комплекс технологий доверенных систем связи 6G», реализуемого в рамках программы «Приоритет-2030».

Вышка исследует потребности глухих

В последнее воскресенье сентября в мире традиционно отмечается День глухих. В этом году факультет социальных наук (ФСН) Высшей школы экономики присоединился к празднику и совместно с Московской городской организацией Всероссийского общества глухих (МГО ВОГ) запустил исследование потребностей глухих и слабослышащих москвичей в социальных услугах и доступности среды.

НИУ ВШЭ и компании-партнеры скоординировали подходы к подготовке специалистов топ-уровня в сфере ИИ

В НИУ ВШЭ прошла встреча с представителями Сбера, Яндекса и VK для согласования подходов к подготовке специалистов топ-уровня в сфере искусственного интеллекта. В частности, договорились о регулярном обновлении образовательных программ с учетом новейших решений и разработок компаний-партнеров. Участники встречи обсудили текущий статус проекта, содержание образовательных программ и механизмы взаимодействия для обеспечения достижения показателей эффективности созданного в университете Центра организации обучения студентов для топ-специалистов в сфере искусственного интеллекта НИУ ВШЭ.

В Высшей школе экономики открылась межфакультетская Музейная лаборатория

Вышка запустила межфакультетскую Музейную лабораторию, которая станет устойчивым центром экспертной поддержки в сфере музейного дела. Ее миссия связана с изменением современных моделей восприятия культуры и трансформацией институциональной среды. Лаборатория специализируется на модернизации музейных практик и повышении престижа музеев, формируя пространство для профессионального диалога и внедрения инноваций.

Физики предложили новый механизм усиления сверхпроводимости с помощью «квантового клея»

Команда исследователей с участием сотрудников МИЭМ ВШЭ показала, что дефекты в материале могут не снижать, а, наоборот, усиливать сверхпроводимость. Это возможно благодаря взаимодействию дефектных и более чистых областей, которое образует «квантовый клей» — однородную компоненту, связывающую разрозненные сверхпроводящие участки в единую сеть. Расчеты подтвердили, что такой механизм может помочь в создании сверхпроводников, работающих при более высоких температурах. Исследование опубликовано в журнале Communications Physics.

30 студентов из 19 университетов приняли участие в исследовательской экспедиции НИУ ВШЭ в «Новом Херсонесе»

В рамках программы студенческих экспедиций «Открываем Россию заново» при поддержке программы Росмолодежи «Больше, чем путешествие», президентской платформы «Россия — страна возможностей», а также Симферопольской и Крымской епархии НИУ ВШЭ на базе Школы молодого гуманитария провела исследовательскую экспедицию на территории музейно-храмового комплекса «Новый Херсонес» в Севастополе. По ее итогам будут разработаны предложения по организации просветительских проектов в области формирования исторической памяти молодежи о роли Херсонеса, Крыма и византийского наследия в истории российской культуры и государственности.

Большие группы студентов эффективнее используют ИИ в обучении

Исследователи Института образования и факультета экономических наук НИУ ВШЭ узнали, от каких факторов зависит качество групповой работы студентов, когда они выполняют ее в сотрудничестве с ИИ. Оказалось, что, помимо уровня знаний команды, важен размер группы: чем она больше, тем эффективнее работа. Статья ученых опубликована в журнале Innovations in Education and Teaching International.