题图:伊丽莎白女王工程奖获奖的 AI 界群星
- 打败GPT5的Kimi K2 Thinking,真就只会写代码吗?
通过多种场景测试评估Kimi K2 Thinking的表现,包括编程、3D模拟、创意写作、复杂推理和架构对比分析
打败GPT5的Kimi K2 Thinking,真就只会写代码吗?2. Artificial Analysis评测新鲜出炉:Kimi K2 thinking位居世界第二,开源第一
Artificial Analysis评测显示Kimi K2 Thinking模型在智能体任务中表现突出,以67分位居世界第二、开源第一,但存在生成冗长和延迟问题
Artificial Analysis评测新鲜出炉:Kimi K2 thinking位居世界第二,开源第一
- 解析!大模型中的ScalingLaw的概念、推导以及反ScalingLaw的场景
全面详细介绍大模型ScalingLaw的概念、数学推导、实际应用场景及反ScalingLaw现象,为大模型训练提供理论指导
解析!大模型中的ScalingLaw的概念、推导以及反ScalingLaw的场景
- LLM首次达到人类语言专家水平!OpenAI o1拿下拆解句法、识别歧义、推理音律
研究表明OpenAI o1模型在处理语言递归结构、识别句法歧义和音韵推理等方面表现出接近人类语言学专家的能力
LLM首次达到人类语言专家水平!OpenAI o1拿下拆解句法、识别歧义、推理音律
- SimKO:缓解RLVR训练中的概率过度集中,优化pass@K性能
介绍SimKO算法如何通过非对称梯度调节解决RLVR训练中的概率过度集中问题,优化大语言模型在数学推理任务上的pass@K性能
SimKO:缓解RLVR训练中的概率过度集中,优化pass@K性能
- 6.4万star的开源智能体框架全面重构!OpenHands重大升级,叫板OpenAI和谷歌
详细介绍了OpenHands V1智能体框架的架构重构,包括四项设计原则和技术特性,以及与OpenAI和Google产品的比较和性能评估
6.4万star的开源智能体框架全面重构!OpenHands重大升级,叫板OpenAI和谷歌
- Building the First Agentic Government with Ukraine
介绍ElevenLabs与乌克兰政府合作建设首个代理型政府的伙伴关系,将AI应用于公共服务
https://elevenlabs.io/blog/building-the-first-agentic-government-with-ukraine
- ICCV涌现自动驾驶新范式:统一世界模型VLA,用训练闭环迈向L4
文章深入分析理想汽车在ICCV上展示的统一世界模型VLA,介绍了自动驾驶从数据闭环到训练闭环的技术进化,以及理想在AI领域的技术布局
https://www.qbitai.com/2025/11/350282.html
- 机器人训练,北京男大有了技能玩法
北京通用人工智能研究院研究团队开发了COLA方法,实现了人形机器人仅依靠本体感知而无需外部传感器就能与人类协作搬运物体的技术突破
https://www.qbitai.com/2025/11/350301.html
- LLM强化学习新框架!UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍
研究者提出通用多智能体强化学习框架PettingLLMs,通过树状采样与角色化奖励机制,显著提升LLM工具调用能力和多智能体协作效果
