Механическая рука выставлена в торговом центре Robot Mall, первом в мире магазине интеллектуальных роботов 4S, 13 августа 2025 года в Пекине, Китай.
ВКГ | Группа Визуального Китая | Гетти Изображения
ПЕКИН — Алибаба Cloud инвестирует в новый тип искусственного интеллекта, призванный лучше воспроизводить реальный мир, используя подход, отличный от чат-ботов, таких как ChatGPT от OpenAI.
Этот сдвиг признает ограничения «больших языковых моделей», обученных в основном на тексте. Вместо этого разработчики начинают больше сосредотачиваться на «моделях мира», построенных на видео и реальных физических сценариях.
Чтобы следовать этой тенденции, Alibaba инвестировала 2 миллиарда юаней (290 миллионов долларов) в ShengShu, стартап, стоящий за инструментом для создания искусственного видео Vidu, о чем компания объявила в пятницу. TAL Education и Baidu Ventures также приняли участие в раунде финансирования серии B.
Инвестиции поступили примерно через два месяца после того, как ShengShu привлекла 600 миллионов юаней от Qiming Venture Partners и других спонсоров. Стартап отказался раскрыть свою оценку.
ШэнШу заявил, что последнее финансирование будет направлено на поддержку разработки «общей модели мира», которая использует ИИ для соединения двух в настоящее время отдельных областей: цифрового мира игр и видео, созданного ИИ, и физического мира автономного вождения и роботов.
«ШэнШу считает, что общая модель мира, построенная на мультимодальных данных, таких как зрение, звук и осязание, более естественно отражает то, как работает физический мир, чем большие языковые модели», — говорится в заявлении трехлетнего стартапа.

«Мы стремимся соединить восприятие и действие», — добавил в своем заявлении Чжу Цзюнь, основатель ShengShu, что позволит системам искусственного интеллекта лучше моделировать и последовательно прогнозировать поведение в реальном мире.
По данным Artificial Analysis, последняя модель Vidu Q3 Pro от ShengShu, выпущенная в январе, входит в десятку лучших моделей искусственного интеллекта для создания видео из текста и изображений.
Компания запустила Vidu по всему миру за несколько месяцев до того, как OpenAI сделала широко доступным свой ныне закрытый инструмент Sora для генерации видео с помощью искусственного интеллекта. Китайские компании по производству короткометражных видеороликов Куайшоу и ByteDance также выпустили аналогичные конкурирующие инструменты искусственного интеллекта для создания видео.
Мировой конкурс моделей
Alibaba увеличила свои инвестиции в смежные стартапы.
Китайский технологический гигант и Baidu Ventures в прошлом месяце инвестировали 50 миллионов долларов в Tripo AI, платформу, которая использует искусственный интеллект для быстрого создания цифровых 3D-моделей из фотографий. Tripo заявила, что также отходит от методов, используемых языковыми моделями, к инструментам искусственного интеллекта, основанным на физическом пространстве, и разрабатывает собственную модель мира.
В сентябре Alibaba также инвестировала 60 миллионов долларов в PixVerse, которая ранее в этом году выпустила модель мира искусственного интеллекта, которая позволяет пользователям управлять тем, как разворачивается видео во время его создания.
Alibaba, которая начала свою деятельность в сфере электронной коммерции, также выпустила бесплатные модели искусственного интеллекта с открытым исходным кодом для генерации видео, а в феврале запустила модель для питания роботов.
В пятницу компания Shengshu заявила, что у нее есть стратегическое партнерство с компаниями, разрабатывающими воплощенный искусственный интеллект — такие системы, как роботы-гуманоиды, которые взаимодействуют с физическим миром — для использования в промышленных, коммерческих и домашних условиях.
Мировые модели имеют решающее значение для робототехники, потому что для работы технологии требуется нечто большее, чем просто степень магистра права, написал в прошлом месяце в своем Substack Кевин Келли, соучредитель американского технического журнала Wired.
В конечном итоге, чтобы воспроизвести человеческий интеллект, ИИ понадобятся три вещи: рассуждение, понимание физического мира и постоянное обучение, сказал Келли. По его словам, хотя ИИ для категории обучения еще не разработан, чат-боты на базе LLM создали элемент знаний, что делает модели мира ключевой областью, требующей прорыва.




