2026-07-03

谷歌为什么做不好「AI 编程」?

谷歌,去年凭借大模型能力反超逆袭,出尽了风头,甚至一度被投资人喊出“市值能到10万亿”。但奇怪的是,谷歌在AI编程这一关键领域一直籍籍无名。 强大如谷歌,为何在AI coding(AI 编程)上瘸了腿? 更令人惊讶的是,不止谷歌。纵观中美互联网巨头,在AI编程上都表现平平。Cursor、Claude Code、Codex、智谱、MiniMax……这些程序员圈子里耳熟能详的产品中,来自互联网大厂的寥

大模型 AI 摘要 · 单一来源
雷锋网 阅读 →

生数科技发布 Vidu S1,推动视频生成迈向“实时交互”新时代

7月3日,在2026全球数字经济大会人工智能融合应用发展论坛,生数科技创始人朱军发表题为《通用世界模型,推动数字世界与物理世界统一的新范式》的主题演讲,并正式发布面向实时交互场景的新一代模型——Vidu S1 实时交互模型。大会期间,北京软件和信息服务业协会(BSIA)正式发布《2025年北京市数字经济标杆企业评价报告》,生数科技凭借在技术创新与产业应用方面的突出表现,成功入选“新模式新应用标杆企

大模型 AI 摘要 · 单一来源
雷锋网 阅读 →

场景至上,实效为王:NAVIAI 人形机器人多领域应用场景领跑!

2026年被业界广泛称为人形机器人“商业化落地元年”,而我们认为,真正跑通的应用场景才是打破“伪落地”质疑的唯一标尺。 浙江人形凭借全栈自主可控的产品体系,已让领航者NAVIAI人形机器人在工业、服务、教育、数采等多领域真正“上手干活”,率先实现了从实验室技术验证到多领域规模化商用的关键跨越。 应用领域 01——工业制造中的“精工巧匠” 浙江人形深耕真实场景,以多源、高质数据体系筑基,自研可泛化、

机器人 AI 摘要 · 单一来源
雷锋网 阅读 →

算力之外的博弈:ICML 2026 透露了哪些学术硬通货?

告别盲目刷榜,28页 PPT 带你摸透 ICML 新风向。 作者丨陈淑瑜 编辑丨岑峰 ICML 2026 的投稿量从去年的 12107 篇直接飙升至 23,918 篇,几近翻倍。 然而,最终的接收率却牢牢钉在 26.56%,与去年几乎持平。 这一数据传递出一个明确的信号:并非竞争变得盲目激烈,而是学术评审标准经历了一次深刻的“重新校准”。 为了拆解这一趋势,我们制作了一份 28 页的深度分析 PP

大模型 AI 摘要 · 单一来源
雷锋网 阅读 →

AI基础设施的下一个千亿市场,为何藏在网络里?

过去六年,国产GPU公司一路站上AI风口,估值不断刷新,DPU却被忽略了。 这并不符合产业现实。 2020年英伟达完成收购Mellanox后,就已经明确了“GPU+CPU+DPU”的三芯战略。过去几年,英伟达也持续强化网络能力,黄仁勋在2026年CES展示“六芯组合”时,其中四款都与网络相关。 一个越来越清晰的趋势开始浮出水面:AI基础设施的瓶颈,正在从算力本身转向网络与调度。 尤其Agent时代

芯片 AI 摘要 · 单一来源
雷锋网 阅读 →

EvoPolicyGym:交互环境中的自主策略演化评估

自主智能体在固定预算内通过迭代编辑评估策略改进,研究表明成功的策略演化需要任务特定机制与反馈约束的协同优化。

研究 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →

AgenticSTS:面向长周期 LLM Agent 的有限内存测试平台

该研究提出一种有限契约方法用于长周期 LLM Agent,通过类型化检索组装新鲜提示词,可隔离分析记忆组件,在复杂决策任务中展现更优性能。

大模型 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →

多分辨率流匹配:分阶段采样实现免训练扩散加速

MrFlow结合低分辨率生成与像素空间超分辨率及噪声注入,加速文生图扩散模型,实现最高25倍加速,且无需训练或运行时修改。

研究 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →

向混合注意力模型演进

FlashMorph将混合层选择形式化为预算约束优化问题,通过可变形模型和线性化正则化提升Transformer的长上下文效率。

研究 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →

AnyGroundBench:视觉-语言模型视频定位专用领域基准

视觉-语言模型在专业时空视频定位任务中面临领域适应挑战,暴露出零样本泛化和上下文学习能力的局限性。

大模型 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →
2026-07-02

Talos 网络 GPU 工作节点客户端,通过 WebSocket 提供开源模型推理服务并上报运行时间以获取收益

连接 Talos 账户的 GPU 工作节点客户端,通过 WebSocket 提供开源模型推理服务,并上报在线运行时间以获取收益分成。

芯片 AI 摘要 · 单一来源
GitHub Trending 阅读 →

NVIDIA 提交 8-K(2026-07-02)

NVIDIA(NVDA)向 SEC 提交 8-K 文件:8-K。Accession 0001045810-26-000060。

企业动态 AI 摘要 · 单一来源
SEC EDGAR 阅读 →

Claude Sonnet 5 上线一日差评刷屏:打不过千问和 Minimax,性价比全面翻车

一张中文测评图把Claude Sonnet 5送上风口浪尖。 作者丨高允毅 编辑丨马晓宁 Claude Sonnet 5才发布了一天,网上已经吵翻天——几乎全是差评。 Anthropic把它定位为“迄今最具 Agent 能力的 Sonnet”,甚至直接说它在大量智能体任务上已经接近旗舰 Opus 4.8,价格只有Opus 的四折。 听起来,这就是来给开发者送温暖的:更强的Agent、更便宜的API

大模型 AI 摘要 · 单一来源
雷锋网 阅读 →

自变量发布跨模态具身动作分词器 X-Tokenizer,多模态对齐能力提升 13.5%,长程任务性能提升 8.25%

自变量机器人发布跨模态具身动作分词器 X-Tokenizer,将 VLA 中的动作离散化从单一的“压缩-重建”问题,重新定义为“多模态推理与动作之间的语义接口学习”问题。 动作分词器决定了拆分出的动作 Token 是否具有语义,是否能加速预训练模型的收敛,从而最终影响了 VLA 模型输出连续动作的性能。这是自变量机器人的最新发现。 具身智能的 VLA 模型(视觉-语言-动作模型)是将预训练的 VL

机器人 AI 摘要 · 单一来源
雷锋网 阅读 →

影智XBOT发布通用餐饮服务机器人矩阵与“一脑多形”具身智能体系

雷峰网获悉,6月30日,影智XBOT“2026 XBOT通用餐饮具身机器人发布会”在北京举行,以产品、平台、商业闭环、生态开放为关键节点,正式发布自研具身操作系统XOS 3.0、AI Agent产品“爱宝店长”,以及三款覆盖咖啡、冰淇淋、全场景服务的通用餐饮具身机器人新品。 三者共同构成“一脑多形”的完整智能体系。 XOS 3.0:为“一脑多形”而生的具身操作系统 作为爱宝店长背后的技术底座,XO

机器人 AI 摘要 · 单一来源
雷锋网 阅读 →

轻量级入侵检测模型在 IIoT 网络中的跨域泛化失效

由于依赖粗粒度的端口类别特征和类别分布不平衡,用于 IIoT 入侵检测的轻量级机器学习模型在不同网络间泛化能力有限,且对抗鲁棒性与跨网络性能无相关性。

研究 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →

十年榜单首迎中国双料冠军:这次赢的不只是性能

6月,在德国汉堡ISC高性能计算大会的展台上,GPU、液冷、量子计算的声浪依旧汹涌,但今年,会场的主角悄悄换了人。 IO500榜单——全球高性能计算存储领域最权威的评测体系——公布了最新一期结果:中科曙光ParaStor F9000分布式全闪存储系统,同时拿下生产型全节点和10节点两大榜单的第一名。 在这一榜单近十年的历史中,能够同时统领这两个维度的,此前只有少数几家美国厂商,中科曙光成为首家达成

芯片 AI 摘要 · 单一来源
雷锋网 阅读 →

Claude 和 Manus 还要人工搭框架?小米直接让 Agent 自我进化

连 AI 的 “外壳” 都学会自我迭代了 作者丨高允毅 编辑丨马晓宁 连Harness都能自我迭代了! 在AI圈,有一个基本共识,即Agent = Model + Harness。 决定智能体表现的,从来不只是底层模型这颗 “脑子”,还有包裹在外的整套 “外壳”——Harness,它包含提示词模板、工具调用规则、记忆管理、控制流、安全护栏等。 过去半年,Claude Code、Manus 这类全自

大模型 AI 摘要 · 单一来源
雷锋网 阅读 →

PerceptionRubrics:多模态评估的人类感知校准

PerceptionRubrics提出基于评分标准的评估框架,通过原子审计和门控评分机制识别基准性能与实际表现的差距。

大模型 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →

十年ICML,十次思想浪潮,当AI开始问“为谁而算”|ICML2026

作者|吴思梦 编辑|岑峰 引言: 2016年6月,纽约。David Silver站到了ICML的讲台上,用66页幻灯片,从Q-Learning一路推到AlphaGo。他传递出一种信念:把深度网络嫁接到强化学习上,通用智能的涌现就只是算力和工程问题。彼时距AlphaGo在首尔4∶1击败李世石仅三个月。 十年后的2025年7月,温哥华。Anca Dragan——Google DeepMind Gemi

机器人 AI 摘要 · 单一来源
雷锋网 阅读 →

从生成到交付,音视频 Agent 要有生产级开发套件

过去足球赛场上的高光瞬间回顾,往往需要剪辑师回看素材,找到进球、庆祝、慢动作回放和观众反应,再切片、包装、加字幕,最后分发到不同平台。链路长,人工重,能不能接到热点爆发的流量,考验的是人的经验和手速。 现在这条链路被拆开重组,开始由模型和工具链来接管赛事高光视频的完整生产流程。在新的链路中,AI 已经可以实时理解直播流,识别镜头切换、音频变化、球员庆祝、裁判哨音等信号,在关键事件发生后快速返回高光

产品发布 AI 摘要 · 单一来源
雷锋网 阅读 →

MemSyco-Bench:智能体记忆阿谀奉承问题基准测试

LLM智能体的记忆检索会引发阿谀奉承问题,即过度迎合用户而牺牲事实准确性,需要新的评估基准来评估记忆对推理和决策的影响,而非仅关注存储和检索。

大模型 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →

Anthropic、OpenAI同一天落子AI4S赛道,巨头混战从「拼模型」转向「卡生态」

6月30日,Anthropic和OpenAI同时在AI4S赛道投下了各自的筹码。 Anthropic发布了科研智能体工作台Claude Science,明确表态“不依赖新模型”,通过工作流整合现有能力来承包科学家的日常研究流程。 OpenAI推出了GeneBench-Pro,一套覆盖基因组学、定量生物学等10个领域的评测基准,其测试数据显示,在129个真实科研workflow题目中,即便是最强的G

大模型 AI 摘要 · 单一来源
雷锋网 阅读 →

状态预测分离假说

在Transformer中将状态预测与token预测分离,可在不同规模下提升语言建模性能和效率。

研究 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →

ICML 2026前瞻:投稿翻倍背后,机器学习正在换挡

首尔见,ICML见,新方向见。 作者丨吴思梦 编辑丨岑 峰 7月6日–11日,第43届国际机器学习大会(ICML 2026)将首次落地韩国首尔COEX会展中心举行,会议主题为“Machine Learning for the Real World”,强调机器学习在真实场景中的落地。 (图源: CS Conf Stats) 根据计算机科学会议统计看板 CS Conf Stats的最新数据显示,今年共

机器人 AI 摘要 · 单一来源
雷锋网 阅读 →

曝美国最强AI公司暗藏针对中国的「监视代码」,已持续3个月;优必选CEO:珍惜做牛马的时光,20年后全是机器人干活;iPhone17价格将迎调整

要闻提示 1.美国最强AI公司被曝暗藏针对中国的“监视代码”,官方回应:将在更新中删除 2.优必选CEO:珍惜做牛马的时光吧,20年后全是机器人干活 3.小米人事调整:中国区总裁王晓雁不再兼任销售运营一部总经理,陈幕楠接任 4.山姆砍单多个苹果涨价前已付款订单,转头加价600元新上架遭质疑 5.百度持续加码AI技术投入:再次引入年轻技术人才 6.消息称iPhone17价格即将迎来调整 7.“家电不

机器人 AI 摘要 · 单一来源
雷锋网 阅读 →

BioInsight:面向交互式生物医学知识发现的多智能体编排

BioInsight是多智能体系统,通过结构化制品组织疾病特异性证据并采用确定性引用归一化,将静态生物医学报告转化为交互式、以证据为中心的界面。

产品发布 AI 摘要 · 单一来源
HuggingFace Daily Papers 阅读 →