by Elijah Feb 19,2025
Удивительно недорогие модели ИИ Deepseek бросают вызов гигантам отрасли. Китайский стартап утверждает, что обучил свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов, используя только 2048 графических процессоров, что значительно подорвало конкурентов. Это, казалось бы, низкая стоимость, однако, противоречит гораздо более существенным инвестициям.
Изображение: Ensigame.com
Инновационная архитектура DeepSeek V3 способствует его эффективности. Ключевые технологии включают многократный прогноз (MTP), который прогнозирует несколько слов одновременно; Смесь экспертов (MOE), используя 256 нейронных сетей для ускоренного обучения; и мультиголовое скрытое внимание (MLA), сосредоточенное на важных элементах предложения для повышения точности.
Изображение: Ensigame.com
Тем не менее, отчет о полуализации выявляет гораздо большую инфраструктуру: приблизительно 50 000 графических процессоров NVIDIA, оцениваемых примерно в 1,6 млрд. Долл. США, при этом эксплуатационные расходы примерно в 944 миллиона долларов. Это противоречит первоначальной претензии DeepSeek о стоимости, которая учитывает только предварительное обучение использования графического процессора, пропущение исследований, уточнения, обработки данных и общих расходов на инфраструктуру.
Независимость и бережливая структура Deepseek, дочерняя компания Hedge Fund Fund, обеспечивает быстрое инновации и эффективное распределение ресурсов. В отличие от конкурентов, зависящих от облачных сервисов, DeedSeek владеет своими центрами обработки данных, максимизируя контроль и скорость. Его самофинансируемая природа еще больше повышает ловкость. Высокая заработная плата, превышающая 1,3 миллиона долларов в год для некоторых исследователей, привлекает лучших талантов из китайских университетов.
Изображение: Ensigame.com
Хотя показатель затрат на обучение DeepSeek 6 миллионов долларов вводит в заблуждение, общие инвестиции компании превышают 500 миллионов долларов. Его успех связан с существенными инвестициями, технологическими достижениями и квалифицированной рабочей силой, не только из -за эффективности бюджета. Несмотря на это, его затраты остаются значительно ниже, чем конкуренты; Модель DeepSeek R1 стоила 5 миллионов долларов по сравнению с CHATGPT4 на 100 миллионов долларов.
Изображение: Ensigame.com
Пример DeepSeek демонстрирует успешную, хорошо финансируемую независимую компанию по искусственному искусству, которая эффективно конкурирует с известными игроками. Тем не менее, повествование о революционной экономической эффективности требует более детального понимания его истинной инвестиционной шкалы.
«Клер мсайк: Экспедиция 33 достигает 1 миллиона продаж за 3 дня»
Roblox Deep Descent: январь 2025 г.
Как кормить жителей деревни в необходимости
Рагнарок V: возвращает руководство для начинающих - классы, элементы управления, квесты, геймплей, объясненный
Bitlife: как завершить вызов эпохи Возрождения
«Ōkami 2: Capcom, Kamiya и Head Head обсуждают продолжение эксклюзивного интервью»
Руководство по героям Бахити: овладение эпическим стрелком в выживании белой
10 лучших фильмов Лиама Нисона ранжированы
Wingspan Asia выходит с поддержкой кроссплатформенной игры
Dec 16,2025
Новое событие Love and Deepspace: Свидетели из дальнего космоса
Dec 14,2025
Minecraft: Визуальное обновление уже здесь
Dec 14,2025
Shadow Duelist в Yu-Gi-Oh! Master Duel оказался Диланом Спроусом
Dec 13,2025
Pokémon Go представляет гипертренинг и Древний пропуск.
Dec 13,2025