DeepSeek AI的突破到底是真是假?分析師與專家意見分歧
中國人工智慧(AI)公司DeepSeek近日聲稱,其新款AI模型不僅超越OpenAI,且訓練成本僅560萬美元,遠低於業界標準。這一消息引發市場震盪,促使投資者擔憂AI訓練成本過高的問題。
儘管DeepSeek的成果看似令人驚艷,但業界專家對其真實性存疑。中國人工智慧(AI)公司DeepSeek近日聲稱,其新款AI模型不僅超越OpenAI,且訓練成本僅560萬美元,遠低於業界標準。這一消息引發市場震盪,促使投資者擔憂AI訓練成本過高的問題。此消息一出,輝達股價暴跌,市值單日蒸發近6000億美元,創下美股史上最大單日市值損失紀錄。
[caption id="attachment_161485" align="alignnone" width="1200"]
DeepSeek目前的AI產品主要由兩大系統支撐,包括V3語言模型與R1推理模型。(圖/取自 Google Store)[/caption]
專家質疑DeepSeek的真實性
據報導,部分分析師質疑DeepSeek訓練成本過低,可能未完全計入研發支出。科技顧問公司DGA Group高級副總裁Paul Triolio指出,DeepSeek所公布的560萬美元僅為一次訓練成本,整體研發費用可能遠高於此數字。
更多新聞:中國DeepSeek橫空出世震撼業界 OpenAI:已掌握盜用模型證據
此外,DeepSeek在美國嚴格的AI晶片出口管制下,如何實現高效訓練也是關注焦點。該公司聲稱使用輝達H800和A100晶片,而非遭禁運的H100。然而,AI基礎設施公司ScaleAI執行長Alexandr Wang質疑DeepSeek可能暗中使用受限晶片,DeepSeek則堅決否認此說法。
DeepSeek是否涉及技術抄襲?
除成本爭議,DeepSeek也面臨技術來源的質疑。矽谷知名投資人Vinod Khosla在X上表示,DeepSeek的模型與OpenAI o1存在相同錯誤,可能是透過技術竊取開發而來。OpenAI亦對此展開調查,懷疑DeepSeek可能透過「蒸餾學習」方式,利用OpenAI產品的輸出數據來訓練自身模型。
OpenAI發言人表示:「我們正在審查DeepSeek是否不當使用了我們的數據,將積極採取行動保護技術,並與美國政府密切合作。」
DeepSeek是誰?技術有何特別?
DeepSeek成立於2023年,由AI量化對沖基金High-Flyer聯合創辦人梁文峰領導,致力於開發大型語言模型,並最終實現通用人工智慧(AGI)。其最新發布的R1屬於推理模型,能將輸入訊息拆解為更小的單元,並採取多種方法進行分析,以模仿人類思考方式解決複雜問題。
雖然DeepSeek的技術概念並非全新突破,但該公司強調R1是首個成功應用此技術且具高效能的AI模型,且其運算資源需求遠低於目前主流AI模型。
DeepSeek與OpenAI之間的差異
DeepSeek目前的AI產品主要由兩大系統支撐,包括V3語言模型與R1推理模型。與OpenAI不同,DeepSeek採用開源策略,允許開發者自由使用和修改其底層程式碼,而OpenAI的GPT-4o仍為封閉模型。
DeepSeek V3擁有6710億個參數,遠低於外界估計的OpenAI GPT-4o可能超過1兆個參數。然而,DeepSeek表示其R1在推理任務上的表現可媲美OpenAI o1,並在AIME 2024、MATH-500、GPQA Diamond等基準測試中取得優異成績。
此外,DeepSeek在AI運算成本上展現出極大優勢。據其官方數據,R1的計算費用為每100萬個輸入字元為0.55美元,輸出字元則為2.19美元,而OpenAI的o1分別為15美元和60美元。若數據屬實,DeepSeek的成本大幅低於OpenAI。
AI開源化趨勢加速
無論DeepSeek的爭議如何發展,業界普遍認為其技術突破對AI領域具有重要意義。Meta首席AI科學家Yann LeCun就表示,DeepSeek的成功是開源AI的勝利,而非中國AI超越美國的象徵。他指出,「DeepSeek的成就建立在PyTorch、Llama等開源技術基礎上,這正是開放研究的力量。」
隨著AI競爭升溫,越來越多企業轉向開源模式,以降低開發成本並加速創新。DeepSeek的崛起無疑將進一步推動AI技術的普及化,但其真實實力仍有待市場和業界驗證。
參考資料:CNBC
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
這篇文章 DeepSeek AI的突破到底是真是假?分析師與專家意見分歧 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
- 記者:李佩璇
- 更多科技新聞 »