在今日的OpenAI開發者日新加坡站活動中,ChatGPT再次展現了其強大的競爭力。最新版本的ChatGPT-4o(以下簡稱4o)在更新後,成功擊敗了先前排名第一的Google Gemini,重新奪回了大模型競技場的冠軍寶座。
這次4o的更新主要集中在「創意寫作能力」。根據OpenAI官方介紹,新版模型能夠完成更自然、更有吸引力、更具針對性的寫作,文本相關性和可讀性也得到了顯著提升。此外,4o還能更好地處理上傳的文件,提供更深入的見解和更全面的回應。
作為Canvas功能的一部分,OpenAI希望透過改進寫作來推動人機協作方式的變革,更具創意地完成寫作任務。 o1核心貢獻者Karina Nguyen表示,儘管寫作這一研究領域非常主觀且開放,但4o在寫作方面的進展是AGI(通用人工智慧)創造性智能的關鍵。
在大模型競技場的創意寫作分榜上,新版4o(ChatGPT-4o-1120)的分數從上個版本的1365提升到了1402,確實展現出了明顯的提升。而在其他能力分榜上,4o也取得了不俗的成績。在代碼能力方面,從第2位升至第1位;在數學能力方面,從第4位升至第3位;在困難任務方面,同樣從第2位升至第1位。此外,在風格控制分榜上,4o依然位居首位。
在與其他模型的比較中,新版4o也展現了強大的競爭力。在對上先前登頂的Gemini-Exp-1114時,勝率為59%;對上Claude 3.5 Sonnet時,勝率為69%;而對上5月版本的4o時,更是在72%的情況下都能取勝。
然而,儘管4o取得如此優異的成績,但不少網友仍對OpenAI未能推出傳聞中的o1滿血版表示不滿。有人認為,OpenAI這次更新4o只是為了奪回競技場的第一名,而並非真正滿足用戶的期待。不過,也有網友對4o的更新進行了認真研究,並發現了其在系統提示詞方面的改進,如新增了一道護欄,確保ChatGPT不在敏感話題上胡說八道。
總的來說,ChatGPT-4o的更新無疑為OpenAI重奪大模型競技場的第一寶座增添了新的動力。儘管仍有一些用戶對其未能推出o1滿血版表示不滿,但4o在創意寫作能力等方面的提升仍然值得肯定。未來,隨著技術的不斷進步和用戶需求的不斷變化,ChatGPT將繼續努力提升自己的能力,為用戶提供更優質、更方便的服務。
現在,如果你對新版4o的創意寫作能力感興趣,可以前往大模型競技場進行免費試用。相信你會被它的強大功能所折服。
本內容來自創作者:AI 上傳發布,不代表本網站觀點與立場。转载,请注明出处:https://news.kejixun.com/30437.html