對於DeepSeek有三派看法,負面派認為DeepSeek抄襲ChatGPT,根本不是什麼創新; 正面派認為DeepSeek將顛覆現有的AI生態;中立派則認為DeepSeek的出現帶給AI生態一些省思。
到底哪個才是客觀的看法? 以下是近期的相關新聞 :
2025-01-29 OpenAI:已掌握DeepSeek盜用模型證據
2025-01-29 彭博:微軟調查DeepSeek相關組織是否不當獲取資訊
2025-01-31 DeepSeek 被微軟納入 Copilot+ PC、Azure 和 Github
2025-01-31 DeepSeek涉資安疑慮 數發部:公務機關不得使用
2025-01-30 DeepSeek-R1 Now Live With NVIDIA NIM
2025-02-01 川普與黃仁勳會晤內容曝光!討論DeepSeek、緊縮AI晶片出口政策
以上根據時間軸的發展,對於微軟來說,DeepSeek的Open Source、Open Weight,反而讓他不需過度依賴OpenAI,因此他的立場反而是傾向正面的,誰能讓他賺錢比較重要。對於美國政府來說,這是對美國地位的挑戰,肯定會加強限制相關資源外流。
人工智慧專家吳恩達在Deeplearning.ai發表了他的看法,他指出DeepSeek的出現有三個重點 :
(1) 中國在生成式人工智慧(Generative AI)方面正在趕上美國,這對 AI 供應鏈具有重要影響。
(2) 開源權重模型(Open Weight Models)正在使基礎模型層(Foundation Model Layer)商品化,這為應用程式開發者創造了機會。
(3) 擴展規模(Scaling Up)並不是推動 AI 進步的唯一途徑。 儘管外界過度關注運算能力,但演算法創新正在迅速降低訓練成本。
中國雖然在人工智慧發展上仍落後於美國,但過去兩年間,這個差距已迅速縮小。例如 Qwen、Kimi、InternVL 和 DeepSeek 等模型的崛起,清楚展現中國正在迎頭趕上。 川普與黃仁勳的會面,顯然是在討論因應對策。
DeepSeek 的出現,使得開源/開放權重模型(Open Weight Models)成為 AI 供應鏈的重要一環,並讓許多企業開始採用這類模型。如果美國持續對開源進行限制,中國將可能在這一領域取得領先地位,進而影響企業選擇模型的標準,更多公司可能轉向符合中國價值觀的 AI 模型,而非美國的模型。
因此 DeepSeek 是否會迫使 OpenAI 逐步向開放權重的方向發展,值得關注。 目前大型語言模型(LLM)的處理成本正在快速下降,開放權重模型正加速這一趨勢,為開發者提供更多選擇。這一變化也可能使輝達(Nvidia)的 GPU 市場回歸理性,減少大企業瘋狂搶購高價 GPU 的現象,使得硬體資源分配更加均衡。
當前 AI 領域普遍存在「只要擴大規模,就能推動 AI 進步」的論述。雖然這種觀點有其依據,但實際上,AI 的發展不僅僅依賴於模型的規模擴張,演算法優化、計算資源效率提升等因素同樣能夠驅動 AI 的進步。
DeepSeek 的出現是否會減少市場對 AI 運算資源的需求? 這仍需進一步觀察。從歷史經驗來看,當某項技術變得更便宜時,市場需求往往會增加,最終導致總體支出不降反升。長期而言,AI 計算需求幾乎沒有上限,即使成本下降,人類對於智慧運算的需求仍將持續增長。
在社群媒體上,DeepSeek 的發展被賦予了不同的解讀,猶如一場羅夏墨跡測驗(Rorschach test),讓各界投射出自己的觀點。儘管 DeepSeek-R1 的地緣政治影響尚待釐清,但對 AI 應用開發者而言,這無疑是一個令人振奮的機會。
台灣很多人對於中國的DeepSeek會抱持質疑的態度是很正常的,但是應該以比較健康的態度去看「DeepSeek模型」而非「中國DeepSeek」,因為人工智慧模型可以代管在任何地方,例如You.com、Perplexity、FelloAI 等等,這樣就可以擺脫言論審查及資料安全性的問題。
那麼台灣在這波生成式人工智慧發展上,有何特別的計畫嗎?
(1) TAIDE : 由國科會提供約三億元經費所補助發展的計劃,目前開發出 TAIDE-7B (可商用版本) 和 TAIDE-13B (學術研究用版本) 模型,具備多輪對話和阻絕產生不恰當回應的能力。 TAIDE 在寫文章、寫信、摘要、英翻中、中翻英五大任務表現與背後採用 GPT 3.5 模型的 ChatGPT 相當,尤其寫文章、寫信、摘要的測試得分比 ChatGPT 更好。
(2) TAME : 由長春集團、和碩聯合科技、長庚醫院、欣興電子、科技報橘聯聯合發起的一個大型語言模型開發計畫,由台大資工系的陳醞儂教授以及她指導的博士班學生林彥廷主導開發。
TAME 計畫的規模相對較小,屬於產學合作型專案;而國家級的 TAIDE 計畫則是基於 Meta Llama-2-7B 開發,並非完全自主開發的模型。期盼台灣在這波人工智慧發展浪潮中,不僅在硬體領域發揮優勢,更能在模型研發上取得突破,打造具有國際競爭力的 AI 技術。
[後記]
這篇"International regulators probe how DeepSeek is using data. Is the app safe to use?"探討了外界對 DeepSeek 的疑慮,包括資料隱私與安全性,以及中國政府是否可能將這些數據用於其他用途。
根據 DeepSeek 的隱私權政策,該服務會收集大量使用者數據,包括聊天與搜尋查詢記錄、使用者所使用的裝置、鍵擊模式、IP 位址、網際網路連線資訊,以及來自其他應用程式的活動數據。其他人工智慧(AI)服務,例如 OpenAI 的 ChatGPT、Anthropic 的 Claude 和 Perplexity,也會收集類似數量的使用者數據,而社群媒體平台如 Facebook、Instagram 和 X 亦然。
然而,當數據收集涉及來自中國的服務時,監管機構的關切程度往往更高。 DeepSeek 會將其收集的所有美國使用者數據傳送至中國的伺服器,這正是安全專家擔憂的核心問題。
這種擔憂與美國對 TikTok 的疑慮類似——由於可能涉及國家安全風險,美國國會已立法禁止該應用程式在美國境內運行。人們擔心,美國人的敏感數據可能會因此落入一個對立國家的手中。
這也顯示,AI 已經成為國際競爭力的一環,甚至是現代國力的體現。台灣若要在這場科技競賽中占有一席之地,必須加緊腳步迎頭趕上。
[再記]
由民間發起的台灣開源版主權AI,自由鋼普拉R1即將誕生了。這是一個以DeepSeek R1模型為基礎,打造出更貼近實用需求,也具備更好繁體中文與台灣文化內涵的台版AI推理模型。
0 留言