DeepL AI Labs

NVIDIA: технология в основе DeepL AI Labs

Новые продукты и решения, которые мы разрабатываем в DeepL AI Labs, стали возможными благодаря нашему многолетнему сотрудничеству с NVIDIA. Последним важным событием в рамках этого партнерства стало установка DeepL первой NVIDIA DGX SuperPOD с системами DGX GB200 в Европе в начале этого года. Этот новый суперкомпьютер открывает новые возможности в области обучения и установки решений ИИ.

Мы назвали наш новый NVIDIA SuperPOD DeepL Arion. В нем используется архитектура NVIDIA Grace Blackwell, которая объединяет «острова» из 72 мощных графических процессоров Blackwell, позволяя им работать как единое целое. Чем больше графических процессоров SuperPOD подключает таким образом, тем более мощным он становится, и Arion значительно превосходит по мощности даже наш предыдущий суперкомпьютер NVIDIA, Mercury. Для перевода всего Интернета понадобилось бы 193 дня. Если бы мы поставили перед Arion эту гипотетическую задачу, он смог бы выполнить ее более чем в 10 раз быстрее, всего за 18 дней.

Более быстрые машины обучают более крупные модели

Перевод всемирной паутины звучит впечатляюще, однако значение Arion для нашей способности обучать большие языковые модели (LLM) еще более значимо. Проще говоря, чем быстрее графические процессоры могут обмениваться данными, тем более крупные модели мы можем создавать с их помощью. С помощью Arion мы можем использовать простые, масштабируемые архитектуры для создания значительно более крупных LLM. создавать гораздо более крупные LLM.

Мы имеем возможность обучать эти более крупные LLM с помощью масштабированных тренировочных данных, используя сложные методы, которые мы разработали для обучения наших языковых моделей ИИ. Это проверенный подход к генерации синтетических данных, который позволил нам со временем постоянно улучшать качество DeepL LLM и поможет нам в полной мере использовать потенциал более крупных моделей, которые мы создаем.

Инновации с использованием новых возможностей

Исследования в области ИИ показывают, что при создании более крупных моделей и их обучении на больших объемах высококачественных данных эти модели могут продемонстрировать ранее непредсказуемые возможности.

Часто это проявляется в виде модели, которая очень быстро эволюционирует от восприятия задачи как чрезвычайно сложной до восприятия ее как относительно легкой. Такие возникающие возможности вознаграждают исследователей за расширение границ возможностей ИИ, выявление новых проблем, которые можно решить, и экспериментирование с новыми способами их решения. Мы создали DeepL ИИ Labs для организации цепочки таких экспериментов. При этом мы делаем смелые, но продуманные прогнозы относительно будущих возможностей моделей DeepL.

Мы достигаем этого путем постановки амбициозных целей, которые, как мы понимаем, существенно повлияют на то, как люди работают и насколько они будут продуктивны. Затем мы проводим интенсивные эксперименты, тестируя идеи для новых функций, которые могут помочь нам достичь этих целей. Появляющиеся возможности означают, что даже очень амбициозные эксперименты могут оказаться удивительно успешными. Расширение спектра задач и решений, к которым мы применяем наши модели, способствует более быстрому появлению новых возможностей.

Создание более интерактивных и ценных возможностей ИИ

Влияние увеличения вычислительной мощности и появления новых возможностей уже оказывает влияние на функции DeepL и опыт пользователей наших инструментов.

Clarify, эксперт в области перевода по запросу, который знает, когда задать умные вопросы для уточнения смысла, является одним из первых примеров этого. Когда модели могут понимать неоднозначность и распознавать предположения так же, как Clarify, они способны взаимодействовать с пользователями более ценным, человекоподобным образом. Это способствует получению опыт работы с ИИ, который более отзывчиви дает гораздо более релевантные и впечатляющие результаты, чем модель, которая пытается рассуждать самостоятельно.

Мы сначала разработали эти интерактивные возможности для задач перевода, однако они одинаково ценны практически для любого приложения ИИ. Разрабатывая модели, которые могут более естественно, интеллектуально и продуктивно взаимодействовать с людьми, мы способны помочь предприятиям и другим организациям значительно расширить возможности ИИ.

Портфель проектов в области ИИ

Проекты, реализуемые в DeepL ИИ Labs, исследуют инновационные новые способы реализации этого потенциала. При этом они получают выгоду от другого результата нашего тесного сотрудничества с NVIDIA по максимальному использованию потенциала вычислительной мощности: повышение скорости вывода.

Как правило, более крупные модели ИИ имеют большую задержку, что означает, что пользователям приходится дольше ожидать результатов при запросе на выполнение задачи ИИ. Увеличенная вычислительная мощность Arion в сочетании с поддержкой NVIDIA обучения FP8 и инференса FP4 способствует изменению этой ситуации. Это означает, что наши более крупные и мощные модели по-прежнему могут выполнять задачи с высокой скоростью.

Arion способствует выполнению ИИ сложных задач со скоростью, необходимой пользователям. Это также позволяет реализовывать амбициозные проекты, такие как наш революционный подход к голосовому переводу, который основан на способности интеллектуально предсказывать, что говорят люди, и переводить их речь в режиме реального времени.

В DeepL мы никогда не стремились к инновациям ради инноваций. Мы стремимся реализовывать инновационные идеи, которые оказывают реальное влияние, особенно в том, что касается опыта людей в сфере работы и жизни. Возможности DeepL Arion, а также наше сотрудничество с NVIDIA и EcoDataCenter, которые их поддерживают, позволяют нам тестировать гораздо более широкий спектр идей для такого рода реального воздействия. Именно эти быстро расширяющиеся возможности делают DeepL ИИ Labs столь интересным пространством.