廣告

ChatGPT-4、Claude 3、Gemini 1.5,哪個是最強的AI模型?

ChatGPT-4、Claude 3 和 Gemini 1.5 都屬於當前人工智慧領域裡的先進語言模型,它們分別由不同的技術組織開發與推出。

雖然這三者都旨在理解和生成人類語言,使能夠進行多樣化的對話、回答問題以及創造性的寫作等,但它們在架構設計、學習方式、以及應用範圍上各有特色。

ChatGPT-4 是由 OpenAI 研發,以其強大的語言理解和生成能力著稱,廣泛應用於客服、教育和創意寫作等領域。Claude 3 則是由 Anthropic 推出,特別注重於使用者互動的安全性和模型的可解釋性。Gemini 1.5 則由Google Bard的技術團隊開發,旨在探索語言模型在特定專業領域內的應用潛力。 

儘管它們由不同組織開發,這些模型都在推動人工智慧技術的發展,並為用戶提供了豐富多樣的應用場景。

ChatGPT-4 (發布於2023年3月12日) 

ChatGPT-4 是由 OpenAI 開發的語言模型,是 ChatGPT 系列中的第四代。這一代模型在理解和生成自然語言方面相比前一代有了顯著改進,能夠更加準確地理解用戶查詢的意圖並提供更加豐富和有用的回答。ChatGPT-4 能處理更廣泛的話題,且在處理複雜問題時表現更加出色。它也被訓練來更好地理解和遵循使用者的指示,提供更個性化的互動體驗。 

我們將用一些實際應用,來看看這三個人工智慧工具如何處理資料。

為了測試ChatGPT-4的理解能力,給他一段新聞文字,其中一段加入不相干的文字,看看這些AI模型的反應。 

問題如下 : 請順一下這篇文章 翻譯成中文 (紅色部分跟前後文完全沒有關係)

Protesters were chanting “Never again is now” and “Ceasefire now” at a square close to the museum, while holding Palestinian flags and signs that said “Jews against genocide” and “The grandchild of a holocaust survivor says: Stop Gaza Holocaust.” Health officials in Gaza say over 31,000 Palestinians have been killed since Israel launched its offensive there in response to an Oct. 7 attack by Hamas fighters on southern Israel, in which some 1,200 people were killed and 253 taken hostage, according to Israeli tallies. Google has announced that it will discontinue its “people cards” feature in Google Search on April 7. The decision comes after Google realized the feature was not as helpful for users as initially hoped. People cards were introduced in 2020 to make it easier for individuals to highlight information about themselves on Google Search, such as websites and social profiles. The feature was initially launched in India, Kenya, Nigeria, and South Africa, but individuals in other countries could access it using a VPN. Human rights group Amnesty International put up detour signs around the museum to direct Herzog to the International Court of Justice (ICJ) in The Hague. A spokesperson for the president declined comment.

結果ChatGPT-4的反應如下 ....... 他竟然沒有發現有任何問題。 



Claude 3 (發布於2024年3月5日) 

Claude 3 是由 Anthropic 公司開發的語言模型,它是 Claude 系列中的最新版本。Claude 3 著重於理解和生成人類語言,旨在提供一個友好、有用且安全的人工智慧互動體驗。這個模型在設計上強調了對道德準則的遵循和促進正面的使用者體驗。它被訓練來識別和避免產生有害或不當的內容,同時也能夠根據用戶的需求提供資訊和協助。 Claude 3有3個子模型,各是Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。

同樣的問題詢問 Claude-3-Sonnet,反應如下 ....... 

Claude-3 他說了,文中提到谷歌跟抗議活動沒有關聯,他不清楚為何會在同一篇文章中。 

Gemini 1.5 (發布於2024年2月16日) 

Gemini 1.5 是由 Google 開發的。這是一款相對較新的語言模型,旨在提升對話質量,增進用戶互動體驗。Gemini 1.5 旨在提供深度學習和人工智慧的最新進展,以更好地理解和生成人類語言。雖然 Gemini 的具體細節和其前身相比較少被公開討論,但它的目標是透過提高交談的自然性和相關性,來增強與用戶的互動。 

最後也給了Gemini同樣的問題,Gemini表示如下 ... 

Gemini雖然也沒有發現文章有問題,但是他很盡職的推廣Google Search,哈哈 ^^ 



綜合以上的結果

ChatGPT-4只是很盡職的把文章翻譯完成,沒有太多自己的想法;Claude-3也是很盡職的把文章翻譯完成,但是問他有沒有疑問的時候,竟然提出四個疑問 : 

(1) 抗議者集會的地點是靠近哪個博物館?文中提到了「博物館」但沒有具體說明是哪一個博物館。 

Claude-3 竟然會想知道文章提到的是哪個博物館? 

(2) 文中提到以色列發動進攻是因為哈瑪斯武裝分子的襲擊,但對這次襲擊的細節描述得很簡略,或許可以補充一些背景資訊。 

Claude-3 竟然會想知道襲擊的背景資訊? 

(3) 谷歌停止「人物卡片」功能的決定,跟抗議活動和以巴衝突似乎沒有直接關聯,不太清楚為什麼會在同一篇文章中提及。 

Claude-3 果然看出來這段文章很莫名其妙的插在文章中了 !!

(4) 最後一段提到國際特赦組織為誰設置了引導標誌?是為了引導赫爾佐格還是引導抗議者? 

Claude-3 懷疑這些引導標誌的目的,因為大家都看得到這些標誌,目的是在引導誰呢?

這四個問題,可能已經超越國高中生的思考範圍,也可能連大學生都未必能夠問出這樣的問題。 而Gemini 1.5則是非常技巧的閃躲,對於他不知道的事情,要大家自己去Google。 

結論 : Claude-3已經具備自己的思維模式,雖然未必會反抗指令,但已經不是一味的接受指令,顯然ChatGPT-4需要更多努力才能打敗Claude-3的智商了。而Google的Gemini要走了路還很長,也許乾脆跟Anthropic合作會比較快。

[後記] 

ChatGPT-4、Claude 3、Gemini 1.5,哪個是最強的AI模型? 我們突發奇想,把這個問題去問ChatGPT-4、Claude 3、Gemini 1.5,看他們怎麼回答?

ChatGPT-4的回答如下 : 



Claude-3-sonnet 的回答如下 : 




Gemini 1.5 的回答如下 : 









以上,你覺得誰回答得最好呢? 

基本上,如果你想使用人工智慧工具協助你撰寫內容,可以先使用Google Gemini、ChatGPT、Claude 三個工具給你一些概念,然後再混合三者的意見,請ChatGPT總結並提供更多意見,最後在完成彙總之後,再讓Claude完成彙總或是擴寫。

因為這三個工具確實各有優缺點,因此我會先匯集三者所有的資料,再利用ChatGPT的創意完成大多的工作,再利用Claude對於文字理解的優點,進行文章最後的修飾。

張貼留言

0 留言