Пару слов про историю с AI-моделями DeepSeek — раз уж все начали про это писать

Немного контекста: китайская компания DeepSeek представила бесплатно несколько моделей AI, которые могут конкурировать по качеству с моделями американской компании OpenAI, на создание которых были потрачены миллиарды. Основной нюанс в том, что по заявлениям китайской компании тренировка этих моделей обошлась в пределах $6 млн. Конечно же на рынках началась паника и акции ведущих технологических компаний, сделавших ставку на AI, стали терять в цене: раз похожего результата можно добиться сравнительно небольшими бюджетами, то все эти миллиардные инвестиции и компании, с ними связанные, могут скоро потерять в цене.

Где «собака зарыта»?

Однако, интереснее всего посмотреть на весь контекст и мотивацию участников процесса. С учетом, что создатель компании DeepSeek имеет математическое образование и профессионально специализируется на торговле акциями — для чего в принципе занялся машинным обучением — и того, что вся информация про AI модели и наработки DeepSeek были «вывалены» в открытый доступ как раз перед объявлением результатов работы западных компании, совершенно не удивлюсь, что одной из ключевых задач создания моделей DeepSeek была манипуляция с акциями американских технологических компаний, которые естественно существенно просели из-за страха инвесторов, что все их лютые инвестиции в AI дата-центры могут оказаться обесцененными. Только компания Nvidia потеряла в цене порядка $600 млрд.

В результате этой ситуации все, кто делали ставку на то, что акции технологических компаний упадут в цене — то есть шортили акции — заработали миллиарды. Не сомневаюсь, что люди, связанные с DeepSeek, существенно пополнили свои банковские счета, сделав правильные ставки до релиза моделей DeepSeek и всей информации про гениальные решения и про дешевизну создания моделей.

Интереснее всего, что вся эта паника инвесторов опирается исключительно на слова китайской компании про свою гениальность и минимальные затраты на тренировку моделей эквивалентных тем, на чье создание потрачены миллиарды. Никаких реальных подтверждений этому нет. Более того, после первой паники аналитики начали присматриваться к ситуации и оказывается, что задолго то этого момента китайская компания могла потратить около $500 млн на покупку десятков тысяч AI серверов Nvidia, а сама «тренировка» моделей была не столько тренировкой, сколько дистилляцией существующих реально натренированных моделей компании OpenAI — то есть, похоже, что компания DeepSeek не столько собирала данные по всему интернету и тренировала свои модели с нуля, сколько делала выжимку из существующих моделей компании OpenAI. А всю основную дорогостоящую работу проделала компания OpenAI.

В сухом остатке

Конечно, китайцы проделали очень сложную и гениальную работу, найдя новые интересные технические решения по оптимизации работы AI оборудования. И это должно хорошо сказаться в будущем на стоимость AI моделей.

Однако, хотя реальное положение вещей и затраты никому не известны и это все может оказаться очень красивой игрой с прессой, очевидно, что вся эта ситуация принесла огромные барыши тем, кто заранее подготовился в расчете на сложившуюся ситуацию и на то, что акции компании, которые делают ставку на AI, слегка переоценены.

Если честно, интереснее в этом всем факт возможности недорогой дистилляции дорогих моделей. Ведь тогда большим компаниям будет очень сложно защитить свои AI модели и инвестиции в них. Как только компания открывает доступ к своей новой передовой модели для заработка на ней, на тренировку которой потрачены огромные ресурсы, другие компании за намного более умеренные деньги могут дистиллировать их, получив из них выжимку в виде собственной версии модели — и в результате коммодитизировав (превратив продукт в сравнительно дешевый товар массового потребления) и обесценив в процессе исходную модель.

Все отзывы (1)

Оставить отзыв

Денис

04.02.2025 20:55

Отзыв:

крута стаття! хммм, цікаво, що якраз після цього openai викатила нову модель та додали її навіть до фрішної версії

Оставьте Ваш отзыв

Имя

Ваш отзыв

Оценка

Оставить отзыв

Спасибо, ваш отзыв отправлен