今日 AI 情报

题图：伊丽莎白女王工程奖获奖的 AI 界群星

通过多种场景测试评估Kimi K2 Thinking的表现，包括编程、3D模拟、创意写作、复杂推理和架构对比分析

打败GPT5的Kimi K2 Thinking，真就只会写代码吗？2. Artificial Analysis评测新鲜出炉：Kimi K2 thinking位居世界第二，开源第一

Artificial Analysis评测显示Kimi K2 Thinking模型在智能体任务中表现突出，以67分位居世界第二、开源第一，但存在生成冗长和延迟问题

全面详细介绍大模型ScalingLaw的概念、数学推导、实际应用场景及反ScalingLaw现象，为大模型训练提供理论指导

研究表明OpenAI o1模型在处理语言递归结构、识别句法歧义和音韵推理等方面表现出接近人类语言学专家的能力

介绍SimKO算法如何通过非对称梯度调节解决RLVR训练中的概率过度集中问题，优化大语言模型在数学推理任务上的pass@K性能

详细介绍了OpenHands V1智能体框架的架构重构，包括四项设计原则和技术特性，以及与OpenAI和Google产品的比较和性能评估

介绍ElevenLabs与乌克兰政府合作建设首个代理型政府的伙伴关系，将AI应用于公共服务

文章深入分析理想汽车在ICCV上展示的统一世界模型VLA，介绍了自动驾驶从数据闭环到训练闭环的技术进化，以及理想在AI领域的技术布局

北京通用人工智能研究院研究团队开发了COLA方法，实现了人形机器人仅依靠本体感知而无需外部传感器就能与人类协作搬运物体的技术突破

研究者提出通用多智能体强化学习框架PettingLLMs，通过树状采样与角色化奖励机制，显著提升LLM工具调用能力和多智能体协作效果