Просто о сложном

Scientists say they've eliminated a major AI bottleneck — now they can process calculations 'at the speed of light'

28 декабря, 11:47

Разработана новая архитектура оптических вычислений, которая способна кардинально изменить работу искусственного интеллекта (ИИ). Вместо привычных электронных схем, использующих электричество, для обработки данных теперь применяется свет. Эта инновация открывает путь к обработке вычислений «на скорости света» — до настоящего времени считавшейся фантастической задачей. Благодаря ей, потенциал современных ИИ-решений может быть расширен до недосягаемых ранее масштабов без существенного увеличения энергопотребления и затрат на оборудование.

Революция в основе — световые вычисления и их потенциал

Ключевым элементом современных больших языковых моделей (БЯМ) и систем глубокого обучения является структура, названная «тензор». Тензоры — это сложные организационные структуры данных, которые работают как виртуальные «шкафы с липкими заметками», определяющими, какие «ящики» наиболее востребованы при обработке информации. В процессе обучения модели тензоры используются для сортировки и выполнения математических операций с большими объемами данных — это именно та операция, которая занимает столько времени и ресурсов, что становится ограничением для масштабирования ИИ.

На сегодняшний день, большинство систем используют электронные вычислительные устройства — графические процессоры (GPU), — способные выполнять параллельные вычисления и значительно ускорять работу моделей. В то же время, оптические системы до сих пор рассматривались как менее масштабируемые: они работают линейно, что мешает их использованию для обработки огромных объемов данных в реальном времени. Это обусловило необходимость объединять тысячи GPU для обучения тяжеловесных моделей — затратное, энергозатратное и технически сложное решение.

Новая архитектура POMMM — прорыв в световых вычислениях

Однако, в рамках научных исследований, опубликованных 14 ноября в журнале Nature Photonics, представлена новая архитектура, которая способна кардинально изменить ситуацию. Название этого прорыва — Параллельное оптическое умножение матриц (POMMM) — она позволяет выполнять множество операций с тензорами одновременно, используя один лазерный импульс.

Для достижения этого ученые применили уникальные методы кодирования данных в амплитуду и фазу световых волн — создав физические свойства, способные переносить множественные математические операции в оптическом поле. Именно благодаря этому, необходимые вычисления выполняются пассивно, во время прохождения света через оптическую систему, без затрат энергии на переключения и управление. Этот подход значительно превосходит существующие системы по скорости и энергоэффективности.

«Данный метод можно реализовать практически на любой платформе, основанной на оптике», — говорит ведущий автор исследования, Зихэй Пень из Университета Аалто. — «В будущем мы планируем интегрировать эту вычислительную схему прямо в фотонные чипы, что позволит световым процессорам выполнять сложные задачи ИИ с минимальным потреблением электроэнергии».

Эксперимент и перспективы внедрения

В рамках эксперимента ученые создали прототип оптического вычислительного устройства, который успешно продемонстрировал возможность одновременного выполнения ряда операций с тензорами. В ходе испытаний было достигнуто превосходство по скорости и энергоэффективности по сравнению с классическими системами, используя при этом существенно меньшие ресурсы.

Использование специальной конфигурации оптических компонентов и новых методов кодирования позволило преобразовать цифровые данные в свойства световых волн, в частности, их амплитуду и фазу, что дало возможность выполнять сложные математические операции, такие как умножение матриц и тензоров, за минимальное время.

Главное — без необходимости дополнительных источников питания или активных переключателей, что избавляет от привычных узких мест в скорости и потребляемой энергии. Это делает новую архитектуру практически универсальной платформой для будущих решений в области ИИ.

Путь к искусственному общему интеллекту

Авторы исследования считают, что новая система — значительный шаг к созданию так называемого Искусственного Общего Интеллекта (ИОИ), системы, которая превосходит человеческий интеллект по многим параметрам и способна обучаться и функционировать в различных областях без предварительной настройки под конкретные задачи.

Заявление, сделанное одним из исследователей, также включает оптимистичные прогнозы: «Эта архитектура даст импульс развитию новых поколений оптических вычислительных устройств, способных решать самые сложные задачи в науке, медицине, инженерии и даже в области безопасности».

При этом, хотя в публикации прямо не говорится о достижении ИОИ, концепция масштабируемых вычислений и их потенциал позволяют предположить, что именно развитие таких технологий ускорит путь к созданию полноценных систем искусственного интеллекта нового уровня.

Контуры будущего и дискуссии экспертов

Обсуждение новых научных открытий разделилось: одни эксперты, например, инженеры и футурологи, видят в POMMM шанс радикально снизить энергозатраты и повысить производительность будущих ИИ-систем. Другие, такие как известный ученый по искусственному интеллекту Яан Лакун, полагают, что масштабируемое обучение — не единственная дорога к ИОИ и что определенные архитектурные особенности могут стать препятствием для достижения полной автономии систем.

Не смотря на разногласия, большинство ученых сходится во мнении, что новая оптическая архитектура — важнейшее технологическое достижение, способное снять один из крупнейших узких мест — скорость обработки данных — и открыть новые горизонты для разработки более мощных и энергоэффективных ИИ.

Готовимся к светлому будущему

Внедрение технологии POMMM в промышленные масштабы, по прогнозам экспертов, может произойти в течение трех-пяти лет. Это позволит создать новые платформы для обучения и внедрения ИИ, значительно снизить затраты на электроэнергию и упростить масштабирование систем. В результате, мы сможем наблюдать появление умных устройств, которые будут выполнять сложные задачи «на скорости света» — от анализа медицинских изображений до моделирования физических процессов, — без затрат ресурсов, ранее казавшихся невозможными для современных технологий.

Появление световых вычислений — это не только технологическая революция, но и начало новой эпохи в развитии искусственного интеллекта, которая сделает его более доступным, экологичным и мощным, чем когда-либо прежде.