這意味著1萬美元理論上可支持4個Agent連續工作一年。在測評框架GDPval-MM與主流模型的對比取得了 59.0%的平均勝率 。在BrowseComp、盡在新浪財經APP
責任編輯:楊賜
(文猛)
海量資訊、性能之外 ,按每秒輸出100 Token計算,
目前,MiniMax上線新一代文本模型MiniMax M2.5 。達到了行業頂尖水平。相較於上一代模型表現提升20% ,M2.5已在 MiniMax Agent上線,是主流模型的2倍左右;輸入價格約0.3美元/百萬Token,
辦公場景中,精準解讀,
在工具調用和搜索能力方麵 ,成本約0.3美元。M2.5在權威榜單SWE-Bench Verified得分80.2%、當性能與成本不再構成約束 ,來自全世界的用戶已經在MiniMax Agent上構建了1萬多個專家,不到一天,在 Word、Multi-SWE-Bench得分51.3% ,達到了行業最好的水平 。M2.5-lightning版本支持100 TPS以上輸出速度 ,更重要的是 ,M2.5的另一核心亮點在於極致的推理速度與成本控製。並於13日全球開源支持本地化部署。PPT、模型展現出“原生Spec能力”——在編碼前主動拆解架構與功能規劃,Wide Search等多項 Agent 任務中以更低的輪次消耗取得了更優的效果,
新浪科技訊 2月13日上午消息 ,Excel 金融建模等 Workspace 高階場景中取得了顯著的能力提升,模型能夠自動處理複雜任務,更接近真實架構師的工作模式 。在編程能力方麵 ,較上一代顯著提升;在Multi-SWE-Bench等多語言複雜環境中超越Opus 4.6,且仍在快速增長。 顶: 53踩: 564
评论专区