Essent.press
Дмитрий Тимонин

Как из-за китайской нейросети DeepSeek богатейшие люди планеты обеднели на $108 млрд

Педер Северин Крёйер. Рыбаки тянут сети на северном пляже Скагена. 1883
Педер Северин Крёйер. Рыбаки тянут сети на северном пляже Скагена. 1883

По информации агентства Bloomberg, 27 января в результате биржевых торгов состояния 500 богатейших людей планеты уменьшились в общей сложности на $108 млрд (10,5 трлн руб.). В этот день резко снизились акции крупнейших американских технологических корпораций. В результате индекс NASDAQ Composite упал на 3,1%, а S&P 500 — на 1,5%, производитель чипов Nvidia потерял статус самой дорогой компании мира.

Весь этот обвал обеспечил скромный китайский стартап DeepSeek. Несколько дней назад он представил новую версию своей нейросети, на которую были потрачены крайне скромные по меркам отрасли $6 млн (590 млн руб.): DeepSeek-R1. При этом в тестах она показала результат, сравнимый с лидерами рынка.

Как создаются современные нейросети

Чтобы разобраться в особенностях продукта китайской компании, нужно сначала понять, как создаются современные популярные нейросети. Стандарт для них задала в ноябре 2022 года компания OpenAI, выпустив свой чат-бот ChatGPT, использовавший нейросеть GPT-3.5.

Сама концепция нейросетей была изобретена еще в 1980-х годах, однако широкого распространения она не имела. В 2017 году команда исследователей Google изобрела «трансформеры» — вид нейронных сетей, «понимающих» контекст слова или фразы с помощью анализа соседних морфем.

Взяв за основу эти алгоритмы, OpenAI прогнала через них большие объемы данных, «обучая» таким образом нейросети, в результате получая большие языковые модели. Процесс такого обучения, кроме самих данных, также требовал все больше вычислительных мощностей. Серьезные мощности нужны и после создания моделей — для обработки с их помощью запросов пользователей.

Искусственный интеллект?

Созданные OpenAI модели показывали настолько впечатляющие успехи во многих видах задач, что фактически нейросети стали синонимом искусственного интеллекта (ИИ). Отметим, что это преувеличение: настоящим, так называемым сильным ИИ, нейросети на данный момент не являются.

Большинство экспертов считают, что в принципе настоящий ИИ создать на основе нейросетей невозможно, для него нужны принципиально другие алгоритмы, однако эта подмена понятий закрепилась в массовом сознании, так что в современном информационном пространстве ИИ и нейросети стали фактически синонимами.

Развитие больших языковых моделей

Остальные компании, создающие свои нейросети, пошли тем же путем, что и OpenAI. Создание каждой следующей нейросети требовало все больше ресурсов и, следовательно, денег. Так, GPT-4 обошлась OpenAI в $78,4 млн (7,7 млрд руб.), превосходящая ее по ряду параметров нейросеть Gemini Ultra стоила корпорации Google $191 млн (18,5 млрд руб.). По оценкам экспертов, последняя версия модели от OpenAI — GPT o1 обошлась в несколько раз дороже.

Доходы от предоставления доступа к этим моделям пока очень уступают расходам на их создание, и на текущий момент главным выгодополучателем «ИИ-лихорадки» оказалась компания Nvidia, которая разрабатывает и поставляет ускорители для проведения вычислений для нейросетей.

Начиная с выпуска первой версии ChatGPT, капитализация Nvidia начала резко расти. С примерно $400 млрд (39 трлн руб.) в ноябре 2022 года она утроилась к началу 2024 год, а за следующий год выросла еще в три раза. В итоге к началу 2025 года Nvidia имела самую высокую капитализацию в мире. Акции компании стоили около $3,4 трлн (335 трлн руб.).

Маленький китайский стартап

В рамках подобной схемы у небольших стартапов нет никакого шанса навязать конкуренцию технологическим гигантам. Для китайских компаний ситуация усложняется санкциями со стороны США. Вашингтон запретил Nvidia поставлять в КНР свои лучшие ускорители, разработанные специально для нейросетей, такие как A100 или H100.

DeepSeek утверждает, что она смогла обойти эти ограничения, создав более «умную» нейросеть, для которой не нужны ошеломительные вычислительные мощности. Вместо того, чтобы сделать единую огромную нейросеть, которая пытается знать все, DeepSeek создала набор специализированных нейросетей, которые отвечают за разные области знаний.

Если в последних традиционных моделях около 2 трлн параметров и они задействованы всегда, то в DeepSeek-R1 их «всего» 672 млрд, из которых в каждый момент времени активны только 37 млрд. В модели есть и другие усовершенствования, которые, по словам создателей, позволили резко снизить требования к вычислительной мощности.

Еще одним важнейшим фактором является полностью открытый исходный код. Компания выложила свою разработку в открытый доступ, и специалисты могут ознакомиться с устройством модели, а энтузиасты могут запустить ее на своих компьютерах, и благодаря относительно невысоким требованиям она должна там неплохо работать.

Реакция на выпуск модели

Выпуск модели DeepSeek-R1 20 января произвел настоящий фурор. Через несколько дней приложения нейросети заняли первые места в магазинах приложений Google и Apple. При этом сама компания 27 января заявила, что стала жертвой кибератак и приостановила регистрацию новых пользователей.

В этот же день о модели высказался один из основателей и глава OpenAI Сэм Альтман. Он назвал DeepSeek-R1 «впечатляющей моделью, особенно с точки зрения соотношения результата и стоимости». Успех компании признал и президент США Дональд Трамп.

Политик, недавно анонсировавший проект развития ИИ стоимостью в $600 млрд (59 трлн руб.) заявил, что выпуск новой нейросети от DeepSeek пойдет США на пользу, так как «мы сможем сделать то же самое, при этом не затрачивая так много средств и получая такой же результат, как хотелось бы надеяться».

В то же время в США слышны голоса скептиков. Так, гендиректор Curai Нил Хосла назвал DeepSeek «государственной пропагандой», которая «притворяется, что затраты были низкими, чтобы оправдать низкую цену, и надеется, что все перейдут на нее, чтобы подорвать конкурентоспособность ИИ в США».

Однако его оценке противоречат слова бывшего генерального директора Intel Патрика Гелсингера, который отметил, что специфика работы китайских компаний не позволяет точно оценивать их затраты, но имеющиеся доказательства показывают, что затраты на R1 оказались в 10 или даже 50 раз ниже, чем на новейшую нейросеть o1 от компании OpenAI. Гелсингер рассказал, что инженеры его стартапа Gloo, создающего своего чат-бота, используют языковую модель DeepSeek-R1, хотя у них была возможность применять и о1.

Уверенность в революционности подхода китайского стартапа и привела к резкому падению акций американских IT-гигантов, которые последние месяцы серьезно выросли на ожидании от них новых прорывов в искусственном интеллекте.

Больше других пострадала Nvidia, чья капитализация снизилась почти на 20%. Стоит заметить, что ничего катастрофического для компании пока не произошло. Капитализация компании составляет около $2,9 трлн (285 трлн руб.), что примерно в 7 раз больше, чем она была до ИИ-бума. Однако, если подтвердится, что создавать новые сложные нейросети можно без десятков тысяч ускорителей от Nvidia, то падение стоимости компании продолжится.

Изменение реальности

Отметим, открытый исходный код DeepSeek-R1, несомненно, будет изучен экспертами, и через какое-то время они смогут на фактологическом материале подтвердить или опровергнуть утверждения компании о революционности ее нейросети.

Если эти утверждения окажутся правдой, то получится, что, действительно, можно создавать продвинутые нейронные сети без гигантских вычислительных средств. А запускать их получится буквально на домашних компьютерах. Это кардинально изменит правила игры во всем, что связано с нейронными сетями.

Во-первых, будет разрушена складывающаяся монополия США на продвинутые нейросети. Программа Трампа по превращению американских компаний в недосягаемых лидеров ИИ-технологий с треском провалится.

А во-вторых, развитие больших языковых моделей резко ускорится и в ближайшее время мы увидим множество новых разработок от различных компаний. Удешевление создания и эксплуатации нейросетей позволит также расширить и спектр их применения, что еще сильнее изменит окружающий мир.

Однако в современной капиталистической системе нет никаких гарантий, что эти изменения будут в лучшую сторону.

Дмитрий Тимонин
Свежие статьи