創(chuàng)澤機(jī)器人 |
CHUANGZE ROBOT |
DeepSeek-V3 和 DeepSeek-R1 陸續(xù)發(fā)布,國產(chǎn)大模型能力已可比肩海 外領(lǐng)軍大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式發(fā)布 DeepSeek-V3 大模型首個(gè)版本并同步開源。根據(jù) DeepSeek 網(wǎng) 站信息,DeepSeek-V3 為自研 MoE 模型,671B 參數(shù),激活 37B,在 14.8T tokens 上進(jìn)行了預(yù)訓(xùn)練。DeepSeek-V3 多項(xiàng)評(píng)測(cè)成績(jī)超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型,并在性能上和世界 頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 相當(dāng)。在訓(xùn)練成本方 面,根據(jù) DeepSeek 發(fā)布的技術(shù)文檔論文信息,DeepSeek-V3 的訓(xùn)練時(shí) 長(zhǎng)為 2788K 個(gè) H800 GPU 小時(shí),訓(xùn)練花費(fèi)約為 557.6 萬美元。2025 年 1 月 20 日,DeepSeek 正式發(fā)布復(fù)雜推理類大模型 DeepSeek-R1,性能對(duì) 齊 OpenAI o1 正式版。以 DeepSeek 系列大模型為代表的國產(chǎn)大模型性 能已可比肩海外領(lǐng)軍大模型,且成本更低。
DeepSeek 系列大模型引發(fā)全球廣泛關(guān)注,海內(nèi)外巨頭科技公司及云服務(wù) 平臺(tái)廠商已相繼接入。2025 年 1 月 15 日,DeepSeek 推出 AI 助手 DeepSeek App。2025 年春節(jié)期間,DeepSeek 系列大模型火爆出圈,引 發(fā)全球廣泛關(guān)注。根據(jù)新浪財(cái)經(jīng) 2 月 1 日引用彭博社信息,DeepSeek 的 AI 助手在 140 個(gè)市場(chǎng)中成為下載量最多的移動(dòng)應(yīng)用。根據(jù) Appfigures 的 數(shù)據(jù),DeepSeek 的推理人工智能聊天機(jī)器人在 1 月 26 日登上蘋果公司 App Store 的榜首,并自那時(shí)以來一直保持全球第一的位置。同時(shí),全球 也開始了對(duì) DeepSeek 大模型的復(fù)刻。以港科大團(tuán)隊(duì)為例,港科大助理教 授 何 俊 賢的 團(tuán) 隊(duì), 只 用了 8K 個(gè) 樣 本, 就 在 7B 模型 上 復(fù)刻 出 了 DeepSeek-R1-Zero 和 DeepSeek-R1 的訓(xùn)練。當(dāng)前,海內(nèi)外巨頭科技公 司及云服務(wù)平臺(tái)廠商已相繼接入了 DeepSeek 大模型,部分 AI 應(yīng)用領(lǐng)域 相關(guān)企業(yè)也已開始了 DeepSeek 大模型的部署和應(yīng)用。DeepSeek 大模型 獲得了全球的廣泛關(guān)注,認(rèn)可度持續(xù)提升。我們認(rèn)為,DeepSeek大模型的開源、低成本和高性能將大幅降低大模型的獲得、部署和應(yīng)用成本,將加快大模型在 B 端和 C 端應(yīng)用場(chǎng)景的落地。另外,DeepSeek 大模型的出 圈將對(duì)全球大模型產(chǎn)業(yè)的競(jìng)爭(zhēng)格局產(chǎn)生重要影響,將對(duì)海外領(lǐng)軍大模型廠 商的領(lǐng)先性產(chǎn)生沖擊,并同時(shí)將對(duì)算力的未來發(fā)展產(chǎn)生重要影響。
DeepSeek 大模型的出圈預(yù)計(jì)不改算力整體需求向上的態(tài)勢(shì),但推理和端 側(cè)算力有望增長(zhǎng)更快。DeepSeek 在算法效率和計(jì)算成本方面有著較大的 優(yōu)勢(shì),短期內(nèi)可能對(duì)訓(xùn)練算力的增長(zhǎng)有一定的平抑效應(yīng),但是不改 AI 算 力整體需求長(zhǎng)期上升的態(tài)勢(shì)。AI 作為全球智能化發(fā)展的主要抓手,大模型 當(dāng)前已應(yīng)用于端側(cè)、教育、金融、辦公、傳媒、醫(yī)療、智能汽車、企業(yè)服務(wù)等多個(gè)應(yīng)用場(chǎng)景,應(yīng)用領(lǐng)域廣闊。DeepSeek 低成本而且開源的解決方 案,大幅降低了 AI 在各行各業(yè)應(yīng)用的技術(shù)和成本門檻,為 AI 的產(chǎn)業(yè)化落地提供了更快的路徑。推理和端側(cè)的算力需求增長(zhǎng)潛力非常大。同時(shí),較低訓(xùn)練成本以及開源的 DeepSeek,有望帶來更低 的大模型開發(fā)和使用門檻,基于該大模型開發(fā)的主體可能更多,也一定程度上為訓(xùn)練算力需求提供了支撐。DeepSeek 并不 是壓縮了算力市場(chǎng),反而為算力市場(chǎng)增加了更多的想象空間。DeepSeek 也在積極與國產(chǎn) AI 算力平臺(tái)合作。DeepSeek 大模 型與國產(chǎn) AI 芯片適配的逐步成熟,將加快推動(dòng)國產(chǎn) AI 芯片在國內(nèi)大模型訓(xùn)練端和推理端的應(yīng)用,加快國產(chǎn) AI 芯片產(chǎn)業(yè)鏈的 成熟,為國產(chǎn) AI 芯片產(chǎn)業(yè)帶來發(fā)展機(jī)遇,同時(shí)加快我國大模型產(chǎn)業(yè)的發(fā)展。
![]() |
機(jī)器人底盤 Disinfection Robot 消毒機(jī)器人 講解機(jī)器人 迎賓機(jī)器人 移動(dòng)機(jī)器人底盤 商用機(jī)器人 智能垃圾站 智能服務(wù)機(jī)器人 大屏機(jī)器人 霧化消毒機(jī)器人 紫外線消毒機(jī)器人 消毒機(jī)器人價(jià)格 展廳機(jī)器人 服務(wù)機(jī)器人底盤 核酸采樣機(jī)器人 智能配送機(jī)器人 導(dǎo)覽機(jī)器人 |