平價AI大爆發2/美股上演DeepSeek雲霄飛車 台灣科技人蛇年春節狂加班

平價AI大爆發2/美股上演DeepSeek雲霄飛車 台灣科技人蛇年春節狂加班
MeetAndy AI創辦人薛良斌與同伴打造「台灣製造」的大型語言模型FreeSEED。(圖/翻攝自Liang-Bin Hsueh臉書)

[周刊王CTWANT] 蛇年農曆春節期間,大陸新創公司DeepSeek號稱以低價完成的AI模型,引發市場轟動,美股那斯達克指數瞬間蒸發近1兆美元市值,不少台灣科技人也忙了起來,找資訊、讀論文,探討DeepSeek能否用在自家產品線上,畢竟原本在大語言模型領域最強的OpenAI,已被笑稱是CloseAI,不但封閉、且以英文思考為主。

「自DeepSeek R1發佈以來,很快的AWS、Azure等都開始主持R1變體」 Google大腦之父、AI科學家吳恩達在臉書上說,「什麼是『最好的模型』定義,正在頻繁變化,開發者經常想嘗試新的模型。」

「這對台灣來說就是一顆原子彈,是台灣幾十年難得一見的戰略機會,這不只是技術專案,更是文化與價值工程。」MeetAndy AI共同創辦人薛良斌說,台灣目前幾款繁中版大型語言模型,主要以Meta釋出的Llama模型為基礎訓練,但Llama相對來說不夠聰明,DeepSeek R1開源模型可下載後開發,論文也有記錄訓練過程,讓其他人了解其運作方式。


平價AI大爆發2/美股上演DeepSeek雲霄飛車 台灣科技人蛇年春節狂加班
耐能Kneron執行長劉峻誠說,AI的黃金時代要來了。(圖/陳曼儂攝)

整個春節假期都因DeepSeek,而在辦公室加班的耐能執行長劉峻誠告訴CTWANT記者,「這是一個黃金時代的來臨。」自家的模型已透過DeepSeek R1論文中提到的前沿訓練技巧,升級而有了「思維鏈推理」和「自我反思」的能力。

劉峻誠表示,在DeepSeek的方法論支持下,未來大、中、小企業推出的大語言模型能力差異將變得很小,技術開源後,專精型的模型將會百花齊放,「可能幾天就多四、五百個」,特別是台灣有龐大的製造業,可以按照模式,用很低的成本去做專屬自己公司的AI,「在台灣的產業界絕對是一個很好的加分項」。

像是在醫療行業,耐能的AI助手可在問卷填寫中進行推理,根據患者的回答動態調整問題,分析可能的健康風險,提高診斷效率。也可做金融衍生品定價,涉及複雜數學計算和市場分析,傳統的AI只能提供簡單的報表分析,這次進化後,可直接找出資料中的異常。


平價AI大爆發2/美股上演DeepSeek雲霄飛車 台灣科技人蛇年春節狂加班
比亞迪用DeepSeek來提升車輛的AI能力。(圖/新華社)

特別是在中國大陸,在官方的支持下,已從地方政府、國有企業、醫院等,都有採用DeepSeek模型的案例,像是長春市吉林大學醫院已推出一套診斷工具,以DeepSeek產生醫療計畫;武漢、成都、杭州等許多醫院都提到,會用DeepSeek作醫療參考,或是向病人解釋複雜的醫療報告。在汽車行業,比亞迪等20多家企業已宣佈在車載系統中加入DeepSeek產品。

MeetAndy AI創辦人薛良斌、Taiwan LLM開發者林彥廷與Ubitus執行長郭榮昌,也在2月7日發起「台灣製造」的大型語言模型計畫FreeSEED,打算以DeepSeek R1為基礎,重新訓練、打造一個符合台灣需求的大型語言模型,並以開源授權釋出模型權重,預計在3月底釋出第一版預覽的推理模型,不到一周已募得1千萬元,

APMIC創辦人吳柏翰表示,大型推理模型將會是今年主流,目前在數學領域最佳的Thinking Tokens是4000到8000 Tokens,而簡單推理確認是在4096 Tokens就可以,做單一垂直的微調能縮小到1K的資料,所以訓練時間可從700小時變成7小時,今年會是地端市場爆發準備期,雲端廠商可以跟地端廠商合作。

延伸閱讀

Google新聞-PChome Online新聞


最新財經新聞
人氣財經新聞
行動版 電腦版