来自 Twitter · Hacker News · GitHub 的 AI 行业动态
谷歌,去年凭借大模型能力反超逆袭,出尽了风头,甚至一度被投资人喊出“市值能到10万亿”。但奇怪的是,谷歌在AI编程这一关键领域一直籍籍无名。 强大如谷歌,为何在AI coding(AI 编程)上瘸了腿? 更令人惊讶的是,不止谷歌。纵观中美互联网巨头,在AI编程上都表现平平。Cursor、Claude Code、Codex、智谱、MiniMax……这些程序员圈子里耳熟能详的产品中,来自互联网大厂的寥
7月3日,在2026全球数字经济大会人工智能融合应用发展论坛,生数科技创始人朱军发表题为《通用世界模型,推动数字世界与物理世界统一的新范式》的主题演讲,并正式发布面向实时交互场景的新一代模型——Vidu S1 实时交互模型。大会期间,北京软件和信息服务业协会(BSIA)正式发布《2025年北京市数字经济标杆企业评价报告》,生数科技凭借在技术创新与产业应用方面的突出表现,成功入选“新模式新应用标杆企
2026年被业界广泛称为人形机器人“商业化落地元年”,而我们认为,真正跑通的应用场景才是打破“伪落地”质疑的唯一标尺。 浙江人形凭借全栈自主可控的产品体系,已让领航者NAVIAI人形机器人在工业、服务、教育、数采等多领域真正“上手干活”,率先实现了从实验室技术验证到多领域规模化商用的关键跨越。 应用领域 01——工业制造中的“精工巧匠” 浙江人形深耕真实场景,以多源、高质数据体系筑基,自研可泛化、
告别盲目刷榜,28页 PPT 带你摸透 ICML 新风向。 作者丨陈淑瑜 编辑丨岑峰 ICML 2026 的投稿量从去年的 12107 篇直接飙升至 23,918 篇,几近翻倍。 然而,最终的接收率却牢牢钉在 26.56%,与去年几乎持平。 这一数据传递出一个明确的信号:并非竞争变得盲目激烈,而是学术评审标准经历了一次深刻的“重新校准”。 为了拆解这一趋势,我们制作了一份 28 页的深度分析 PP
过去六年,国产GPU公司一路站上AI风口,估值不断刷新,DPU却被忽略了。 这并不符合产业现实。 2020年英伟达完成收购Mellanox后,就已经明确了“GPU+CPU+DPU”的三芯战略。过去几年,英伟达也持续强化网络能力,黄仁勋在2026年CES展示“六芯组合”时,其中四款都与网络相关。 一个越来越清晰的趋势开始浮出水面:AI基础设施的瓶颈,正在从算力本身转向网络与调度。 尤其Agent时代
自主智能体在固定预算内通过迭代编辑评估策略改进,研究表明成功的策略演化需要任务特定机制与反馈约束的协同优化。
该研究提出一种有限契约方法用于长周期 LLM Agent,通过类型化检索组装新鲜提示词,可隔离分析记忆组件,在复杂决策任务中展现更优性能。
MrFlow结合低分辨率生成与像素空间超分辨率及噪声注入,加速文生图扩散模型,实现最高25倍加速,且无需训练或运行时修改。
FlashMorph将混合层选择形式化为预算约束优化问题,通过可变形模型和线性化正则化提升Transformer的长上下文效率。
视觉-语言模型在专业时空视频定位任务中面临领域适应挑战,暴露出零样本泛化和上下文学习能力的局限性。
连接 Talos 账户的 GPU 工作节点客户端,通过 WebSocket 提供开源模型推理服务,并上报在线运行时间以获取收益分成。
NVIDIA(NVDA)向 SEC 提交 8-K 文件:8-K。Accession 0001045810-26-000060。
一张中文测评图把Claude Sonnet 5送上风口浪尖。 作者丨高允毅 编辑丨马晓宁 Claude Sonnet 5才发布了一天,网上已经吵翻天——几乎全是差评。 Anthropic把它定位为“迄今最具 Agent 能力的 Sonnet”,甚至直接说它在大量智能体任务上已经接近旗舰 Opus 4.8,价格只有Opus 的四折。 听起来,这就是来给开发者送温暖的:更强的Agent、更便宜的API
自变量机器人发布跨模态具身动作分词器 X-Tokenizer,将 VLA 中的动作离散化从单一的“压缩-重建”问题,重新定义为“多模态推理与动作之间的语义接口学习”问题。 动作分词器决定了拆分出的动作 Token 是否具有语义,是否能加速预训练模型的收敛,从而最终影响了 VLA 模型输出连续动作的性能。这是自变量机器人的最新发现。 具身智能的 VLA 模型(视觉-语言-动作模型)是将预训练的 VL
雷峰网获悉,6月30日,影智XBOT“2026 XBOT通用餐饮具身机器人发布会”在北京举行,以产品、平台、商业闭环、生态开放为关键节点,正式发布自研具身操作系统XOS 3.0、AI Agent产品“爱宝店长”,以及三款覆盖咖啡、冰淇淋、全场景服务的通用餐饮具身机器人新品。 三者共同构成“一脑多形”的完整智能体系。 XOS 3.0:为“一脑多形”而生的具身操作系统 作为爱宝店长背后的技术底座,XO
由于依赖粗粒度的端口类别特征和类别分布不平衡,用于 IIoT 入侵检测的轻量级机器学习模型在不同网络间泛化能力有限,且对抗鲁棒性与跨网络性能无相关性。
6月,在德国汉堡ISC高性能计算大会的展台上,GPU、液冷、量子计算的声浪依旧汹涌,但今年,会场的主角悄悄换了人。 IO500榜单——全球高性能计算存储领域最权威的评测体系——公布了最新一期结果:中科曙光ParaStor F9000分布式全闪存储系统,同时拿下生产型全节点和10节点两大榜单的第一名。 在这一榜单近十年的历史中,能够同时统领这两个维度的,此前只有少数几家美国厂商,中科曙光成为首家达成
连 AI 的 “外壳” 都学会自我迭代了 作者丨高允毅 编辑丨马晓宁 连Harness都能自我迭代了! 在AI圈,有一个基本共识,即Agent = Model + Harness。 决定智能体表现的,从来不只是底层模型这颗 “脑子”,还有包裹在外的整套 “外壳”——Harness,它包含提示词模板、工具调用规则、记忆管理、控制流、安全护栏等。 过去半年,Claude Code、Manus 这类全自
PerceptionRubrics提出基于评分标准的评估框架,通过原子审计和门控评分机制识别基准性能与实际表现的差距。
作者|吴思梦 编辑|岑峰 引言: 2016年6月,纽约。David Silver站到了ICML的讲台上,用66页幻灯片,从Q-Learning一路推到AlphaGo。他传递出一种信念:把深度网络嫁接到强化学习上,通用智能的涌现就只是算力和工程问题。彼时距AlphaGo在首尔4∶1击败李世石仅三个月。 十年后的2025年7月,温哥华。Anca Dragan——Google DeepMind Gemi
过去足球赛场上的高光瞬间回顾,往往需要剪辑师回看素材,找到进球、庆祝、慢动作回放和观众反应,再切片、包装、加字幕,最后分发到不同平台。链路长,人工重,能不能接到热点爆发的流量,考验的是人的经验和手速。 现在这条链路被拆开重组,开始由模型和工具链来接管赛事高光视频的完整生产流程。在新的链路中,AI 已经可以实时理解直播流,识别镜头切换、音频变化、球员庆祝、裁判哨音等信号,在关键事件发生后快速返回高光
LLM智能体的记忆检索会引发阿谀奉承问题,即过度迎合用户而牺牲事实准确性,需要新的评估基准来评估记忆对推理和决策的影响,而非仅关注存储和检索。
6月30日,Anthropic和OpenAI同时在AI4S赛道投下了各自的筹码。 Anthropic发布了科研智能体工作台Claude Science,明确表态“不依赖新模型”,通过工作流整合现有能力来承包科学家的日常研究流程。 OpenAI推出了GeneBench-Pro,一套覆盖基因组学、定量生物学等10个领域的评测基准,其测试数据显示,在129个真实科研workflow题目中,即便是最强的G
在Transformer中将状态预测与token预测分离,可在不同规模下提升语言建模性能和效率。
首尔见,ICML见,新方向见。 作者丨吴思梦 编辑丨岑 峰 7月6日–11日,第43届国际机器学习大会(ICML 2026)将首次落地韩国首尔COEX会展中心举行,会议主题为“Machine Learning for the Real World”,强调机器学习在真实场景中的落地。 (图源: CS Conf Stats) 根据计算机科学会议统计看板 CS Conf Stats的最新数据显示,今年共
要闻提示 1.美国最强AI公司被曝暗藏针对中国的“监视代码”,官方回应:将在更新中删除 2.优必选CEO:珍惜做牛马的时光吧,20年后全是机器人干活 3.小米人事调整:中国区总裁王晓雁不再兼任销售运营一部总经理,陈幕楠接任 4.山姆砍单多个苹果涨价前已付款订单,转头加价600元新上架遭质疑 5.百度持续加码AI技术投入:再次引入年轻技术人才 6.消息称iPhone17价格即将迎来调整 7.“家电不
BioInsight是多智能体系统,通过结构化制品组织疾病特异性证据并采用确定性引用归一化,将静态生物医学报告转化为交互式、以证据为中心的界面。
VideoSearch-R1是一个智能体框架,通过连续潜空间细化与策略优化迭代检索视频并细化查询,以提升视频时刻定位和时间锚定能力。
近年来,模型能力和训练数据规模呈指数级增长。过去一年左右,新前沿模型的发布间隔从数月缩短至数周。可靠且快速的存储访问对AI创新的速度和计算成本都至关重要。
AVTok 是音视频生成的统一分词器,采用双流 Transformer 架构结合共享编码器-解码器和模态特定查询,生成紧凑的一维潜在表示。