Новая архитектура AI «Дракон Яйцеклад» может приблизить нас к искусственному разуму
На фоне стремительного развития технологий искусственного интеллекта (ИИ) и появлении всё более сложных моделей, ученые создали новую архитектуру под названием «Дракон Яйцеклад». Эта инновационная разработка, по словам исследователей, может стать ключевым шагом на пути к созданию искусственного общего интеллекта (АГИ), способности которого превосходят узкоспециализированные системы, такие как GPT-4 и его аналоги. В чем же особенность этой модели и почему она вызывает такой интерес? Об этом — ниже.

Что такое «Дракон Яйцеклад» и чем он отличается от привычных моделей
Модель «Дракон Яйцеклад» — это крупная языковая модель (КЯМ), созданная специалистами из стартапа Pathway. Основная идея — заимствовать принципы работы человеческого мозга, в частности, динамическое соединение нейронов и их постоянное укрепление или ослабление, в процессе обучения. В отличие от традиционных трансформеров, которые «учатся» один раз при обучении и после этого используют зафиксированные параметры, «Дракон»» умеет адаптироваться в реальном времени, обновляя свои внутренние связи по мере получения новой информации.
В исследовании, опубликованном 30 сентября в базе препринтов arXiv, команда из Pathway обозначила свою модель как «преемника» существующих архитектур, лежащих в основе современных генеративных ИИ-инструментов — таких как ChatGPT и Google Gemini. В отличие от них, «Дракон» способен к автоматической генерализации — то есть, к расширению своих возможностей за счет постоянного перераспределения нейронных связей, что ранее считалось невозможным для ИИ.
Мラкеры человеческого мышления в архитектуре ИИ
Учёные отмечают, что одной из главных сложностей создания ИИ, обладающего человеко-подобным мышлением, является «хаотичность» человеческого сознания. Мозг человека — сложная сеть, в которой нейроны постоянно укрепляют или ослабевают связи, формируя новые пути обработки информации. Этот процесс обеспечивает гиперпластику и способность к постоянному обучению.
«Если сравнить с традиционными моделями, они — словно ориентированные только на машинное обучение системы, которые после обучения не меняют своих связей, — говорит Андрей Костюков, ведущий исследователь из Pathway. — «Дракон Яйцеклад» — это попытка сделать архитектуру более гибкой, чтобы она могла учиться и адаптироваться непрерывно, подобно мозгу человека».
Преимущества и новизна архитектуры
Основное отличие «Дракон Яйцеклад» от классических трансформеров — его способность к самоадаптации. В традиционных моделях обработка информации происходит по жесткой последовательности, и после обучения модель фиксирует параметры, запомненные за счет огромных объемов данных. В «Дракон Яйцеклад» нейроны — или, говоря языком модели, «частицы нейронов» — образуют сеть, которая постоянно реорганизуется, укрепляя наиболее полезные связи и ослабляя нерелевантные.
«В процессе обработки каждое новое входное сообщение вызывает у модели перераспределение путей внутри сети, — объясняет Ирина Волкова, специалист по нейросетевым технологиям. — Таким образом, модель не просто запоминает, а активно учится, обновляя свои внутренние связи на лету».
Результатом является система, которая не только запоминает, но и активно использует приобретенные знания для новых задач, что делает ее схожей с человеческим мозгом. Эксперименты показали, что «Дракон» успешно справляется с комплексными задачами, демонстрируя результаты, сравнимые с GPT-2 в бенчмарках языкового моделирования и перевода.
Возможности и перспективы развития
Исследователи предполагают, что архитектура «Дракон Яйцеклад» — это фундамент для создания систем ИИ, способных к самостоятельному обучению и развитию. Теоретически, такие модели смогут увеличивать свою «интеллектуальную» сложность с течением времени, становясь все умнее без необходимости постоянного переобучения или донастройки.
«Если данная архитектура подтвердит свои возможности в реальных условиях, — говорит Ксения Смирнова, профессор нейронаук, — мы можем приблизиться к созданию искусственного общего интеллекта, способного мыслить, reasoning и принимать решения, подобно человеку».
- Обучение без постоянной переобучаемости
- Реализация постоянной саморегуляции сети
- Обеспечение долговременной памяти за счет архитектурных изменений
- Поддержка динамической адаптации к новым задачам и ситуациям
Заключение и вызовы
Пока что «Дракон Яйцеклад» находится на стадии прототипа, и его научная репутация требует подтверждения через экспертное рецензирование. Однако очевидно, что идея — создания архитектуры, которая учится как человек, — имеет большое стратегическое значение. В будущем это может повлечь за собой революцию в разработке ИИ, превзойдя узкоспециализированные системы и приблизив нас к максимально универсальным моделям с интеллектом, сравнимым с человеческим.
Вызовы остаются серьезными — необходимо понять, как убедительно контролировать динамическое переустройство сети, как обеспечить ее безопасность и стабильность, а также как на практике реализовать принципы, имитирующие работу мозга. Но уже сейчас очевидно: «Дракон Яйцеклад» — один из самых перспективных шагов в сторону искусственного общего разума.