Немного контекста: китайская компания DeepSeek представила бесплатно несколько моделей AI, которые могут конкурировать по качеству с моделями американской компании OpenAI, на создание которых были потрачены миллиарды. Основной нюанс в том, что по заявлениям китайской компании тренировка этих моделей обошлась в пределах $6 млн. Конечно же на рынках началась паника и акции ведущих технологических компаний, сделавших ставку на AI, стали терять в цене: раз похожего результата можно добиться сравнительно небольшими бюджетами, то все эти миллиардные инвестиции и компании, с ними связанные, могут скоро потерять в цене.
Где «собака зарыта»?
Однако, интереснее всего посмотреть на весь контекст и мотивацию участников процесса. С учетом, что создатель компании DeepSeek имеет математическое образование и профессионально специализируется на торговле акциями — для чего в принципе занялся машинным обучением — и того, что вся информация про AI модели и наработки DeepSeek были «вывалены» в открытый доступ как раз перед объявлением результатов работы западных компании, совершенно не удивлюсь, что одной из ключевых задач создания моделей DeepSeek была манипуляция с акциями американских технологических компаний, которые естественно существенно просели из-за страха инвесторов, что все их лютые инвестиции в AI дата-центры могут оказаться обесцененными. Только компания Nvidia потеряла в цене порядка $600 млрд.
В результате этой ситуации все, кто делали ставку на то, что акции технологических компаний упадут в цене — то есть шортили акции — заработали миллиарды. Не сомневаюсь, что люди, связанные с DeepSeek, существенно пополнили свои банковские счета, сделав правильные ставки до релиза моделей DeepSeek и всей информации про гениальные решения и про дешевизну создания моделей.
Интереснее всего, что вся эта паника инвесторов опирается исключительно на слова китайской компании про свою гениальность и минимальные затраты на тренировку моделей эквивалентных тем, на чье создание потрачены миллиарды. Никаких реальных подтверждений этому нет. Более того, после первой паники аналитики начали присматриваться к ситуации и оказывается, что задолго то этого момента китайская компания могла потратить около $500 млн на покупку десятков тысяч AI серверов Nvidia, а сама «тренировка» моделей была не столько тренировкой, сколько дистилляцией существующих реально натренированных моделей компании OpenAI — то есть, похоже, что компания DeepSeek не столько собирала данные по всему интернету и тренировала свои модели с нуля, сколько делала выжимку из существующих моделей компании OpenAI. А всю основную дорогостоящую работу проделала компания OpenAI.
В сухом остатке
Конечно, китайцы проделали очень сложную и гениальную работу, найдя новые интересные технические решения по оптимизации работы AI оборудования. И это должно хорошо сказаться в будущем на стоимость AI моделей.
Однако, хотя реальное положение вещей и затраты никому не известны и это все может оказаться очень красивой игрой с прессой, очевидно, что вся эта ситуация принесла огромные барыши тем, кто заранее подготовился в расчете на сложившуюся ситуацию и на то, что акции компании, которые делают ставку на AI, слегка переоценены.
Если честно, интереснее в этом всем факт возможности недорогой дистилляции дорогих моделей. Ведь тогда большим компаниям будет очень сложно защитить свои AI модели и инвестиции в них. Как только компания открывает доступ к своей новой передовой модели для заработка на ней, на тренировку которой потрачены огромные ресурсы, другие компании за намного более умеренные деньги могут дистиллировать их, получив из них выжимку в виде собственной версии модели — и в результате коммодитизировав (превратив продукт в сравнительно дешевый товар массового потребления) и обесценив в процессе исходную модель.