← 返回主题

Topics

AI Infra

追踪支撑智能体时代的算力、芯片、数据中心与开发基础设施。

17 篇 最新 2026-05-19 订阅该主题 RSS

相关标签

#AI-Infrastructure#Hardware#Infrastructure#TPU#Deep-Learning#GPU#Supply-Chain#Data-Center#Tinygrad

主要来源

Anthropic (1)arXiv (1)avkcode (1)Bloomberg (1)Daring Fireball (1)Google (1)

文章

AI 是基础设施,不是产品

约翰·格鲁伯撰文反驳「苹果需要杀手级 AI 产品」的观点,认为 AI 更像无线网络——是渗透一切的技术基础设施,而非独立的产品品类。

Apple Silicon 本地推理成本高于云端 API 三倍

数据分析显示,在 Apple M5 Max 上运行本地 LLM 推理,每百万 token 成本约为云端推理的 3 倍,速度慢 3-7 倍——对开发者而言,租比买更划算。

本地 AI 应当成为常态

开发者过度依赖云端 AI API 正在制造脆弱、侵犯隐私且成本高昂的应用。本地 AI 不仅可行,更是构建可信软件的更优路径。

计算机视觉操控比结构化 API 贵 45 倍

Reflex 的基准测试显示,基于屏幕截图的任务操控比直接调用 API 贵 45 倍,执行时间长 50 倍且结果不稳定,为智能体架构的经济学选择提供了硬数据。

OpenAI 详解低延迟语音 AI 规模化架构

OpenAI 工程师团队发表深度技术文章,详解如何重构 WebRTC 协议栈,以 Relay + Transceiver 分层架构支撑 9 亿用户的实时语音 AI 交互。

Google 追加押注 Anthropic 抢占模型与算力双重入口

Google 计划向 Anthropic 投资最高 400 亿美元,其中 100 亿美元立即到账,其余部分与业绩里程碑挂钩。真正值得关注的是这笔交易把股权、云分发和 TPU 需求进一步绑定成了一条基础设施价值链。

深度学习正在逼近一套真正的科学理论

一篇新的 arXiv 综述提出,深度学习正在形成一套可检验、可量化、以训练动力学为核心的科学理论框架,作者将其称为 learning mechanics。对 AI 产业来说,这意味着模型开发可能逐步从经验主义转向更强的可预测工程。

AI 需求推动 RAM 短缺或持续数年

据《日经亚洲》报道,即使供应商增加 DRAM 生产,到 2027 年底制造商预计只能满足 60% 的需求。SK 集团主席甚至表示短缺可能持续到 2030 年。