AI Lab 工程实践全景图 v1.0

MiaoDX

AI Lab 工程实践全景图 v1.0

整理:WLB + GSD | 日期:2026-03-30 目的:收集国内外 Top AI Lab/Company 的公开工程实践分享,供团队借鉴学习


🇺🇸 海外 — 基础模型 / AI Lab

公司工程博客/实践页面核心特色推荐度
Anthropicanthropic.com/engineeringAgent 设计、eval、multi-agent、context engineering、安全沙箱⭐⭐⭐
OpenAIopenai.com/news/engineering + developers blogPrompt Engineering、Agent 开发、reasoning best practices⭐⭐⭐
Google DeepMinddeepmind.google/blogGemini Deep Think、AlphaEvolve、Agent 设计⭐⭐
Meta AI (FAIR)ai.meta.com/blog + engineering.fb.com大规模 ML 效率优化、开源 (PyTorch/Llama)⭐⭐
Mistral AImistral.ai/newsDevstral (agentic coding)、MoE、开源模型⭐⭐
Coherecohere.com/blogRAG 优化、Prompt Engineering
Stability AIstability.ai/research扩散模型训练、开源实践
xAIx.ai/news仅产品公告,工程深度较低

🇺🇸 海外 — 基础设施 / 平台

公司工程博客/实践页面核心特色推荐度
NVIDIAdeveloper.nvidia.com/blogGPU 推理优化、Dynamo、多节点推理、Agentic AI⭐⭐⭐
AWSaws.amazon.com/blogs/machine-learningSageMaker MLOps、Bedrock RAG、Well-Architected ML⭐⭐⭐
Microsoftazure.microsoft.com/blog + devblogs.microsoft.comAzure AI Agent、负责任 AI、生成式 AI 最佳实践⭐⭐
Databricksdatabricks.com/blogAI-native 数据工程、Lakeflow、Agent Bricks⭐⭐
Cerebrascerebras.ai/blogWafer-scale training、硬件+软件全栈

🇺🇸 海外 — 开发工具 / Agent 框架

公司工程博客/实践页面核心特色推荐度
Hugging Facehuggingface.co/blogSecrets 管理、PEFT/QLoRA、RAG 评估、推理优化、开源生态⭐⭐⭐
LangChainblog.langchain.devAgent 框架、LangGraph、LangSmith 可观测性⭐⭐
Vercelvercel.com/blog + sdk.vercel.aiAI SDK、streaming、前端 AI 集成⭐⭐
Pineconepinecone.io/blog向量数据库、RAG 架构
Together AItogether.ai/blog推理优化、开源模型 serving
Scale AIscale.com/blogAI 评估、Agent 训练数据

🇨🇳 国内 — 大模型公司

公司技术博客/实践页面核心特色推荐度
DeepSeekGitHub: deepseek-ai技术报告极详尽 (MoE/MLA/FP8/V3/R1),工程密度最高⭐⭐⭐
月之暗面 (Kimi)platform.moonshot.cn/docsMooncake KV 缓存、Kimi K2 技术报告、长上下文⭐⭐⭐
腾讯腾讯云开发者 / CodeBuddyCodeBuddy 2.0 多 Agent、九步工作流⭐⭐⭐
智谱 AI (GLM)zhipuai.cn + GitHub: THUDMGLM 系列、CogAgent、AutoGLM⭐⭐
阿里通义 (Qwen)GitHub: QwenLMQwen 系列开源模型、百炼平台⭐⭐
华为昇腾博客 / MindSporeMindSpore、CANN、昇腾芯片、ModelArts⭐⭐
零一万物lingyiwanwu.com/blogYi 系列轻量化模型、万智 Agent 平台
MiniMax技术博客 (官网)M2/M2.1 混合注意力、MoE
商汤科技sensetime.com/cn/blogSenseCore AI 大装置、多模态 Agent
百度百度智能云 / 飞桨文心大模型、AIAK 推理加速
百川 (Baichuan)GitHub: baichuan-inc国内开源模型

🇨🇳 国内 — 基础设施

公司技术博客/实践页面核心特色推荐度
字节跳动Seed 技术博客 / CSDN + GitHub: bytedanceTrae Agent、btrace、云原生调度⭐⭐

🎯 精选推荐

⭐⭐⭐ 第一梯队 (最值得借鉴)

公司为什么选它
Anthropic最系统的 Agent 工程方法论 — eval、harness、context engineering、multi-agent、安全
OpenAI开发者博客 + engineering 栏目,prompt/reasoning 最佳实践、agent 开发
NVIDIAGPU 推理/训练优化权威,Dynamo 分布式推理、多节点架构
AWS云原生 MLOps 最佳实践,SageMaker + Bedrock + Well-Architected ML
Hugging Face开源生态 + 生产级工程实践,PEFT/QLoRA/RAG/推理优化
DeepSeek工程细节密度最高的技术报告 — MoE、MLA、FP8 训练、通信优化

⭐⭐ 第二梯队

公司为什么选它
月之暗面 (Kimi)Mooncake 架构创新,KV 缓存 + 长上下文处理
Meta大规模 ML 效率优化,PyTorch 生态
DatabricksAI-native 数据工程
腾讯国内最完整的多 Agent 工程案例
华为国产 AI 芯片 + 框架全栈

📚 Anthropic /engineering 文章索引

按时间倒序,Anthropic 的工程博客是目前最好的参考范本:

文章日期主题
Infrastructure noise in agentic coding evals2026Agent eval 基础设施噪声
Claude Code auto mode2026-03安全权限
Harness design for long-running apps2026-03长运行 Agent harness
Eval awareness in BrowseComp2026-03Eval 意识
Building a C compiler with parallel Claudes2026-02多 Agent 并行开发
AI-resistant technical evaluations2026-01AI 抗性 eval
Demystifying evals for AI agents2026-01Agent eval 解密
Effective harnesses for long-running agents2025-11长运行 Agent harness
Advanced tool use2025-11高级工具使用
Code execution with MCP2025-11MCP 代码执行
Claude Code sandboxing2025-10安全沙箱
Effective context engineering2025-09Context engineering
A postmortem of three recent issues2025-09事故复盘
Writing effective tools for agents2025-09Agent 工具开发
How we built multi-agent research2025-06Multi-agent 研究系统
Claude Code best practices2025-04Agent coding 最佳实践
The "think" tool2025-03Think tool 设计
SWE-bench with Claude 3.5 Sonnet2025-01SWE-bench

🔗 快速访问

海外: Anthropic · OpenAI · DeepMind · Meta · Hugging Face · NVIDIA · AWS · Mistral · Databricks · LangChain

国内: DeepSeek · Kimi · 智谱 · Qwen · 百川 · 字节


📝 后续计划

  • 从 ⭐⭐⭐ 精选中继续深挖具体文章
  • 按主题分类:Agent / 训练 / 推理 / 安全 / 开发者体验
  • 评估哪些实践可以直接借鉴到我们的项目
  • 定期更新(建议每月一次)

v1.0 — 2026-03-30 由 WLB + GSD 协作整理 · 深度分析专栏 →

M
MiaoDX × AI Agents
机器人研发工程师,OPC 实践者 — One Person, plus multi Claws。白天给机器人写 bug,其他时间和 AI Agents 一起做更多的事。