影视大全站

展开菜单

大模型 AI 扫地机器人 “翻车”:成功率仅 40%

大模型 AI 扫地机器人 “翻车”:成功率仅 40%
ai 实验室 andon labs 最近开展了一项引人关注的研究,旨在测试配备顶尖大模型的扫地机器人在执行基础家庭任务时的实际表现。实验中,研究人员要求这些机器人完成一系列复杂指令,例如“将黄油递给人”,这一任务包含多个步骤:跨房间移动、识别物品包装、追踪并定位移动中的人员、完成物品交付,并最终返回充电座。 然而实验结果令人意外——这些搭载先进AI系统的机器人在任务完成上的成功率远逊于人类。数据显示,Gemini 2.5 Pro 的成功率为40%,Claude Opus...

MiniMax LLM 负责人确认:新模型 M2.1 即将推出

MiniMax LLM 负责人确认:新模型 M2.1 即将推出
MiniMax 大模型负责人 Pengyu Zhao 表示,为践行“Intelligence with Everyone”的使命,公司将持续推动模型开源,助力人工智能生态的繁荣。作为这一战略的重要一环,他透露全新模型 M2.1 即将发布。 在社交平台的交流中,针对用户关心的订阅服务上线时间,Pengyu Zhao 回应称将在一至两周内推出,敬请期待。 此前,MiniMax 于上月底正式开源了 M2 模型,该模型专为 Agent 应用与代码生成打造,在价格仅为 Cl...

AI 编程工具 Qoder 将原生支持 JetBrains 系列 IDE

AI 编程工具 Qoder 将原生支持 JetBrains 系列 IDE
阿里 ai 编程工具 qoder 在社交平台上发布消息,宣布将于本周正式为 jetbrains 全家桶 ide(涵盖 intellij、pycharm、goland 等)带来原生集成支持。 本次升级将引入 Agent Mode、Inline Chat 以及智能代码建议等多项功能,致力于提升使用 Java、Rust、Go 等编程语言的开发者在 IDE 内的 AI 辅助开发体验。 Qoder 定位于面向真实软件工程场景的 Agentic 编程平台,深度对接 Claud...

AI大模型实时投资比赛“Alpha Arena”落幕,阿里千问Qwen夺冠

AI大模型实时投资比赛“Alpha Arena”落幕,阿里千问Qwen夺冠
近日,一场备受瞩目的ai大模型实时投资比赛“alpha arena”正式落下帷幕。在这场集合了全球六大顶尖模型的特殊竞赛中,来自中国的阿里千问qwen,最终以绝对优势夺得了冠军。 据悉,该竞赛由第三方机构Nof1于10月18日发起,为每个参赛的AI模型提供了1万美元的初始资金,让它们在真实的金融市场上,进行为期17天的、无任何人工干预的自主决策与交易。 比赛结果:中国模型包揽冠亚军,美国四大模型全线亏损 在历时17天的激烈角逐后,阿里千问Qwen以22.32%的惊...

字节 AI 编程工具 Trae 下架 Claude 模型

字节 AI 编程工具 Trae 下架 Claude 模型
11 月 4 日,字节跳动推出的 ai 编程助手 trae 发布通知称,平台内部模型已升级完成,但将停止对 claude 模型的调用支持。公告中明确指出: Due to a service interruption, we will no longer offer access to Claude.由于服务中断,我们将不再提供对 Claude 的访问权限。 为弥补 Pro 用户的影响,Trae 宣布推出补偿方案:从即日起至 2026 年 1 月 31 日止,所有 Pro...

OSWorld-MCP 正式发布:面向 Computer-Use Agents 产品的评测基准

OSWorld-MCP 正式发布:面向 Computer-Use Agents 产品的评测基准
osworld-mcp 正式发布,标志着首个面向真实环境的 computer-use agents 产品能力全面评测基准正式落地。 作为 OSWorld 的增强版本,OSWorld-MCP 聚焦于评估模型上下文协议(MCP)工具调用、图形用户界面(GUI)交互能力以及智能决策水平,显著提升了测试的真实性、公平性与跨模型可比性。 核心亮点包括: 集成 158 个经验证的 MCP 工具,覆盖 LibreOffice Writer、Calc、Impress、VS...

零一万物联合开源中国推出OAK平台,目标打造Agent世界的“生态适配器”

零一万物联合开源中国推出OAK平台,目标打造Agent世界的“生态适配器”
11月1日,在gotc全球开源技术峰会(gotc2025)上,零一万物ceo李开复博士发表了主题为《拥抱开源生态,共创aiagent颠覆式创新》的演讲,深入剖析智能体经济时代背后的变革力量。李开复博士表示,aiagent将引导企业进入以结果为导向的新型商业模式,而开源模型是搭建aiagent的最佳选择,agent也为广大开发社区揭开了崭新的技术创新机遇。 零一万物CEO李开复博士 峰会期间,零一万物还与开源中国联合发布了专为开发者打造的AIAgent一站式开发开源...

揭秘 MiniMax M2 Agent 能力技术细节:Interleaved Thinking(交错思维链)

揭秘 MiniMax M2 Agent 能力技术细节:Interleaved Thinking(交错思维链)
中国 ai 创业公司稀宇科技近日发布并开源了其最新一代文本大模型 minimax-m2: 卓越代码能力:专为端到端编程任务设计,在 Claude Code、Cursor、Cline、Kilo Code、Droid 等多个开发场景中表现突出 强大 Agent 能力:具备出色的规划能力和稳定的复杂长链条工具调用执行能力,可协同使用 Shell、浏览器、Python 执行器及多种 MCP 工具 团队透露,在 M2 模型研发初期,他们便意识到 Interleaved...

亚马逊抢下OpenAI 380亿美元大单 强化AI模型训练

亚马逊抢下OpenAI 380亿美元大单 强化AI模型训练
美国人工智慧新创OpenAI与电商与科技巨头亚马逊(Amazon)于週一共同宣布,双方将首度展开深度合作,签署一项价值高达380亿美元的多年云端运算协议。这项合作旨在协助OpenAI应对日益增长的运算需求,并使其能直接接入亚马逊数据中心内高效能的辉达(Nvidia)AI晶片资源。 依据规划,所有合约中承诺的云端运算能力预计将在2026年底前全面部署完成,为OpenAI在ChatGPT等生成式AI模型的训练与推理提供强大支援。此举也被视为亚马逊强化其云端服务平台AWS...