вторник, 28 января 2025 г.

4 веские причины беспокоиться о DeepSeek. Китайцы уронили $NVDA на 17%.

В понедельник Nasdaq упал на 3,1%, поскольку инвесторы размышляли о том, что высокопроизводительные, дешёвые в обучении, топовые в App Store новые модели китайской компании означают для будущего искусственного интеллекта и технологической отрасли в целом. Ведущий производитель специализированных чипов ИИ, Nvidia, пострадал больше всех; цена акций $NVDA упала на 17%, что уничтожило $600 млрд. рыночной стоимости компании.



Поскольку новость о достижениях DeepSeek распространилась в течение выходных, это стало своего рода тестом Роршаха. Хотя все впечатлены тем, что DeepSeek построила лучшую модель с открытыми весами, доступную за малую часть денег, которые потратили её конкуренты, мнения о её долгосрочной значимости разнятся.

Для многих видных голосов в области ИИ DeepSeek, похоже, подтвердил то, во что они уже верили. Для скептиков ИИ, которые считают, что затраты на ИИ настолько высоки, что никогда не окупятся, успех DeepSeek является свидетельством расточительства и высокомерия Кремниевой долины. Для сторонников ИИ, которые считают, что Америке нужно создать AI общего назначения раньше всех остальных в целях национальной безопасности, DeepSeek является страшным предупреждением о необходимости двигаться быстрее. Для исследователей безопасности ИИ, которые давно опасались, что представление ИИ как гонки увеличит риск того, что неконтролируемые системы ИИ нанесут катастрофический вред, DeepSeek — это кошмар, которого они ждали.



Какова бы ни была правда, мы узнаём её нескоро. Читая статьи за последние несколько дней и общаясь с людьми, уже работающими с этой моделью, я убедился, что DeepSeek — это огромная история, заслуживающая нашего постоянного внимания. В то же время я не уверен, что появление мощной и недорогой китайской модели ИИ изменит динамику конкуренции так сильно, как говорят некоторые наблюдатели.

Учитывая всё это, вот несколько причин, по которым стоит беспокоиться о DeepSeek, и несколько причин, по которым стоит успокоиться.

Причины для беспокойства.

Никто на самом деле не знает, какова долгосрочная игра DeepSeek. Как вы, возможно, уже знаете, DeepSeek был создан 10-летним китайским количественным хедж-фондом High-Flyer. Лян Вэньфэн, генеральный директор DeepSeek, также является соучредителем этого фонда. До этого High-Flyer разрабатывал алгоритмы ИИ для использования в торговле, а в 2023 г. он открыл лабораторию для создания инструментов ИИ, не связанных с его основным бизнесом.

В течение следующего года или около того компания сделала ряд технических инноваций в построении больших языковых моделей. Её заявленная миссия, как указано в её профиле в соцсетях, заключается в том, чтобы «разгадать тайну AGI с любопытством». Компания взяла на себя обязательство сделать свои модели открытыми и предложила их разработчикам по очень низким ценам.

На данный момент DeepSeek, похоже, не имеет бизнес-модели, которая соответствовала бы его амбициям. Для большинства крупных американских лабораторий ИИ (пока не реализованная) бизнес-модель заключается в разработке лучшего сервиса и его продаже с прибылью. На сегодняшний день DeepSeek позиционирует себя как своего рода альтруистическую раздачу.

Это может измениться в любой момент, и DeepSeek может ввести подписки или наложить новые ограничения на свои API-интерфейсы разработчиков. Цви Моушовиц предполагает, что компания может взять пользовательские данные и передать их хедж-фонду для получения торговых стратегий.

В какой-то момент китайскому правительству будет что сказать по поводу одной из его компаний, пытающейся раздать мощный ИИ всем желающим, включая противников Китая, но пока мы можем только догадываться, каковы амбиции DeepSeek.

Крупные лаборатории ИИ, похоже, не имеют особого защитного рва. Пока что в разговорах о DeepSeek несколько упущено то, что впечатляющие модели v3 и r1 компании были построены на основе американских инноваций. Именно лаборатории ИИ США разработали базовую архитектуру для больших языковых моделей; то, что сделала DeepSeek, — это умело оптимизировала эту архитектуру, используя старое оборудование и намного меньшую вычислительную мощность.

В старые времена, под которыми я подразумеваю время GPT-3, конкурентам OpenAI требовались месяцы или даже больше, чтобы провести обратную разработку его процесса и усвоить его инновации. Мог потребоваться год, чтобы эти методы просочились в модели с открытым исходным кодом, которые предоставляются бесплатно.

DeepSeek показывает, что лаборатории с открытым исходным кодом стали намного лучше в обратном проектировании, и что любые наводки, которые выдают лаборатории ИИ США, можно быстро стереть. Это проблема, если ваш основной бизнес — продажа моделей разработчикам, ведь затраты на переключение низкие, а экономия средств, которую они могут получить с помощью DeepSeek, огромна.

Для лабораторий ИИ это проблема бизнеса, но это может стать и проблемой геополитики. Инновации DeepSeek показывают, что ИИ не будет никому недоступен, ни к лучшему, ни к худшему. Как сказал вчера соучредитель Anthropic Джек Кларк: «DeepSeek означает, что распространение ИИ гарантировано».

Для некоторых венчурных инвесторов, в частности, уже давно стало целью представить прогресс ИИ как соревнование с Китаем. Эта идея была центральной в «Situational Awareness», вирусном эссе Леопольда Ашенбреннера от прошлого года о прогрессе ИИ, публикация которого совпала с объявлением бывшего исследователя AI о том, что он основал новую венчурную компанию.

Венчурные инвесторы любят эту повестку по многим причинам. Она строится на рациональном страхе, что авторитарное правительство создаст сверхчеловеческий интеллект раньше, чем это сделают демократии, и использует его против них. Этот тезис также призван служить боеприпасом против регулирования, которое замедлит как прогресс ИИ, так и возврат инвестиций в портфели венчурных инвесторов. Также это подогревает интерес к военным технологиям, что генерирует дальнейшие прибыли в те же портфели.

Чем больше люди верят, что ИИ — это экзистенциальная гонка с Китаем, тем менее безопасным будет его создание. Что бы мы ни говорили о неудачах американских лабораторий ИИ (а их много), но они хотя бы попытались наметить методы безопасного создания мощного AI. DeepSeek, напротив, не сказал ни слова о безопасности, и вряд ли у них есть хоть исследователь безопасности.

По мнению сторонников ускорения, это может стать причиной для американских компаний отказаться от мер по обеспечению безопасности или, по крайней мере, сократить будущие инвестиции в них.

Важно помнить, что все самые важные проблемы безопасности ИИ остаются нерешёнными. Если одна из корпоративных лабораторий ИИ внезапно изобретёт и выпустит сверхчеловеческий интеллект, нет никакого способа гарантировать, что он будет соответствовать человеческим ценностям или желаниям, и нет плана, что делать дальше. Администрация Байдена ввела некоторые мягкие ограничения на американские лаборатории с помощью указа, но Трамп отменил его в первый же день.

Как пишет Моушовиц: «Эти люди действительно думают, что лучшее, что может сделать человечество, — это создать вещи, которые умнее нас, с максимально возможным количеством возможностей, сделать их доступными всем желающим, посмотреть, что из этого получится, и предполагают, что это, очевидно, закончится хорошо. Любой, кто выступает против этого плана, является подлым злодеем».

Причины для спокойствия.

Все в принципе уже предполагали, что всё это скоро произойдёт. Под «всем этим» я подразумеваю, что (1) компании с открытым исходным кодом будут заниматься обратным проектированием всего, что делают крупные лаборатории, и (2) что затраты на обучение и вывод ИИ со временем значительно снизятся.

Итан Моллик, профессор Школы бизнеса Уортона Пенсильванского университета, отметил на выходных, что «за последние 18 месяцев стоимость интеллекта уровня GPT-4 снизилась в 1000 раз». По этой причине он пишет: «Снижение цен на языковые модели на 95% не похоже на то, что разорит лаборатории».

Как ни странно, всего 5 дней назад Google выпустила собственную супердешёвую модель, построенную на похожих методах, и никого это вообще не волновало. Она не является ни открытой, ни бесплатной, ни китайской. Но всё же...

Любой, кто отправлял тот же запрос в ChatGPT, Claude и Gemini в один и тот же день, знает уже больше года, что можно получить в принципе такой же хороший ответ от любого из них. Любой, кто использовал Llama, знает уже больше года, что их версия open-weights лишь немного хуже.

Сейчас многие инвесторы одновременно догоняют эти основные факты, и цены на акции соответственно падают, но мне не ясно, было ли многое из этого действительно новостью для лабораторий ИИ и технологических платформ.

Американские технологические компании планируют потратить десятки миллиардов долларов на строительство центров обработки данных для удовлетворения своих потребностей в ИИ в этом году. Один из вопросов, который задавали себе многие в понедельник: сделает ли DeepSeek все эти инвестиции бессмысленными? Если можно построить лучшую в своем классе модель с помощью старого оборудования, какой в них смысл?

Суть в том, чтобы (1) обучить более мощные модели и изучить методы, которые разработчики с открытым исходным кодом ещё не скопировали; и (2) удовлетворить спрос, который генерируют эти более мощные и способные модели. Хотя большая часть обсуждений ИИ за последние 6 месяцев вращалась вокруг проблемы, которую создала нехватка чипов для обучения новых моделей, настоящее узкое место заключается в том, что ни у кого нет столько вычислительной мощности, сколько им нужно.

По большей части, те же серверы и чипы, которые используются для обучения моделей, могут использоваться для конечного вывода. Инновации DeepSeek означают, что день, когда вы сможете запустить современную модель на своём ноутбуке, намного ближе, но мы пока не достигли этого.

Некоторые наблюдатели говорят, что прогресс DeepSeek показывает, что ограничения администрации Байдена на экспорт чипов провалились. Как пишет Джордан Шнайдер в ChinaTalk, все эти меры экспортного контроля относительно новы и им просто нужно больше времени, чтобы действительно оказать эффект.

Основным эффектом экспортного контроля является то, что в течение некоторого времени у Китая будет меньше вычислительной мощности, чем у США в целом. Это означает, что даже если китайские компании, такие как DeepSeek, выпустят более мощные модели, Китай, возможно, не сможет развернуть их так широко, как ему хотелось бы.

Та же вычислительная мощность также необходима для изобретения более мощных систем ИИ. Как недавно сказал Майлз Брандейдж, бывший исследователь политики в OpenAI, в подкасте со Шнайдером: «Существует множество способов превратить вычисления в лучшую производительность, и американские компании в настоящее время находятся в лучшем положении для этого из-за большего объёма и количества чипов».

Инновации DeepSeek реальны, и они во многом способствуют тому, чтобы сделать системы ИИ, которые у нас есть сегодня, более дешёвыми и доступными. С другой стороны, на прошлой неделе OpenAI предоставила пользователям плана Pro компьютер, который может использовать сам себя. Вся индустрия искусственного интеллекта в США переключила свое внимание на создание агентов и полноценных виртуальных коллег. Возможно, DeepSeek или другая китайская компания могли бы обогнать США в плане агентов, но кажется более вероятным, что они просто подождут, пока американская компания выпустит хорошего агента, и тупо попытаются скопировать его.

Я понимаю, почему некоторые люди смотрят на прогресс DeepSeek и предполагают, что он вот-вот обгонит все лаборатории США. Если компания так небрежна в вопросах безопасности, как кажется, то когда-нибудь может появиться реальная причина для паники, но сейчас, я думаю, всем будет полезно сделать несколько глубоких вдохов. Удачи!!!

_______________________________________________________________________________________________________________________

Помогая проектам ТТ, где есть Большое Спасибо:

Для РФ: МИР: 2200700155277048

Донаты для ТТ в крипте:

BTC: bc1qtr4c0v8uh95eppzcz93az7plvhcewv4hmqwcav

ETH: 0xDdf2a1fC12bf01493979A9e5179bAD7702F9c6A3

USDT: 0xDdf2a1fC12bf01493979A9e5179bAD7702F9c6A3

LTC: LhPwsfm1YhNcdF5fTobXsMYjuEsdpvgT46

SOL: C4hpFMHQFzCVX4BdXzTyHDDo7gk3XHzXGFXWndesR4

Комментариев нет:

Отправить комментарий

Является ли 200000$ реалистичной целевой ценой биткоина для этого цикла? Связь между долгосрочными запасами держателей и капитализацией.

$BTC произвёл фурор в финансовом мире, и многие обыватели теперь рассуждают о его потенциале достичь новых высот. Поскольку мы исследуем, мо...