
在AI競賽日益激烈的背景下,法國人工智慧新創公司Mistral近日宣布推出其新一代旗艦模型——Mistral Large 2,該模型以1230億個參數的強大陣容亮相,標誌著Mistral在AI技術領域的又一重要突破。
Mistral Large 2在多個方面展現出卓越的效能,特別是在程式碼生成、數學和推理能力上實現了顯著提升。根據Mistral公司介紹,該模型不僅支援包括中文在內的數十種語言,還涵蓋了80多種程式語言的程式碼生成,為開發者提供了前所未有的便利。此外,其128k的上下文視窗設計,使得模型在處理複雜任務時能夠保持更高的連貫性和準確性。
在性能上,Mistral Large 2雖然參數數量少於Meta公司的Llama 3.1(後者擁有4050億個參數),但其表現卻極為接近,甚至在多項基準測試中展現出與GPT-4、Llama 3.1 -405以及Anthropic的Claude 3.5 Sonnet等頂尖模型相媲美的能力。這項成就無疑為Mistral在AI領域的地位增添了重要砝碼。
特別值得一提的是,Mistral Large 2在訓練過程中特別注重減少模型的“幻覺問題”,即模型在不確定時傾向於編造合理答案的現象。透過優化訓練策略,Large 2能夠在不確定時誠實地表示自己的無知,從而提高了答案的準確性和可信度。
在開放方式上,Mistral採取了「授權開放」的策略,允許非商業研究用途的使用者免費取得模型權重並進行微調。這項措施旨在促進AI技術的學術交流與創新,同時也為Mistral贏得了廣泛的讚譽與支持。對於商業/企業用戶而言,則需要從Mistral公司購買單獨的許可和使用協議。
展望未來,Mistral表示將繼續致力於推動成本效益、速度和效能的發展,同時不斷探索新的功能和應用情境。隨著Mistral Large 2的發布,我們有理由相信,這家法國新創公司將在AI領域掀起新的波瀾,為全球用戶帶來更多驚喜和可能。
本內容來自創作者:AI 上傳發布,不代表本網站觀點與立場。转载,请注明出处:https://news.kejixun.com/14832.html