AI Lab 工程实践全景图 v1.0
AI Lab 工程实践全景图 v1.0
整理:WLB + GSD | 日期:2026-03-30 目的:收集国内外 Top AI Lab/Company 的公开工程实践分享,供团队借鉴学习
🇺🇸 海外 — 基础模型 / AI Lab
| 公司 | 工程博客/实践页面 | 核心特色 | 推荐度 |
|---|---|---|---|
| Anthropic | anthropic.com/engineering | Agent 设计、eval、multi-agent、context engineering、安全沙箱 | ⭐⭐⭐ |
| OpenAI | openai.com/news/engineering + developers blog | Prompt Engineering、Agent 开发、reasoning best practices | ⭐⭐⭐ |
| Google DeepMind | deepmind.google/blog | Gemini Deep Think、AlphaEvolve、Agent 设计 | ⭐⭐ |
| Meta AI (FAIR) | ai.meta.com/blog + engineering.fb.com | 大规模 ML 效率优化、开源 (PyTorch/Llama) | ⭐⭐ |
| Mistral AI | mistral.ai/news | Devstral (agentic coding)、MoE、开源模型 | ⭐⭐ |
| Cohere | cohere.com/blog | RAG 优化、Prompt Engineering | ⭐ |
| Stability AI | stability.ai/research | 扩散模型训练、开源实践 | ⭐ |
| xAI | x.ai/news | 仅产品公告,工程深度较低 | ⭐ |
🇺🇸 海外 — 基础设施 / 平台
| 公司 | 工程博客/实践页面 | 核心特色 | 推荐度 |
|---|---|---|---|
| NVIDIA | developer.nvidia.com/blog | GPU 推理优化、Dynamo、多节点推理、Agentic AI | ⭐⭐⭐ |
| AWS | aws.amazon.com/blogs/machine-learning | SageMaker MLOps、Bedrock RAG、Well-Architected ML | ⭐⭐⭐ |
| Microsoft | azure.microsoft.com/blog + devblogs.microsoft.com | Azure AI Agent、负责任 AI、生成式 AI 最佳实践 | ⭐⭐ |
| Databricks | databricks.com/blog | AI-native 数据工程、Lakeflow、Agent Bricks | ⭐⭐ |
| Cerebras | cerebras.ai/blog | Wafer-scale training、硬件+软件全栈 | ⭐ |
🇺🇸 海外 — 开发工具 / Agent 框架
| 公司 | 工程博客/实践页面 | 核心特色 | 推荐度 |
|---|---|---|---|
| Hugging Face | huggingface.co/blog | Secrets 管理、PEFT/QLoRA、RAG 评估、推理优化、开源生态 | ⭐⭐⭐ |
| LangChain | blog.langchain.dev | Agent 框架、LangGraph、LangSmith 可观测性 | ⭐⭐ |
| Vercel | vercel.com/blog + sdk.vercel.ai | AI SDK、streaming、前端 AI 集成 | ⭐⭐ |
| Pinecone | pinecone.io/blog | 向量数据库、RAG 架构 | ⭐ |
| Together AI | together.ai/blog | 推理优化、开源模型 serving | ⭐ |
| Scale AI | scale.com/blog | AI 评估、Agent 训练数据 | ⭐ |
🇨🇳 国内 — 大模型公司
| 公司 | 技术博客/实践页面 | 核心特色 | 推荐度 |
|---|---|---|---|
| DeepSeek | GitHub: deepseek-ai | 技术报告极详尽 (MoE/MLA/FP8/V3/R1),工程密度最高 | ⭐⭐⭐ |
| 月之暗面 (Kimi) | platform.moonshot.cn/docs | Mooncake KV 缓存、Kimi K2 技术报告、长上下文 | ⭐⭐⭐ |
| 腾讯 | 腾讯云开发者 / CodeBuddy | CodeBuddy 2.0 多 Agent、九步工作流 | ⭐⭐⭐ |
| 智谱 AI (GLM) | zhipuai.cn + GitHub: THUDM | GLM 系列、CogAgent、AutoGLM | ⭐⭐ |
| 阿里通义 (Qwen) | GitHub: QwenLM | Qwen 系列开源模型、百炼平台 | ⭐⭐ |
| 华为 | 昇腾博客 / MindSpore | MindSpore、CANN、昇腾芯片、ModelArts | ⭐⭐ |
| 零一万物 | lingyiwanwu.com/blog | Yi 系列轻量化模型、万智 Agent 平台 | ⭐ |
| MiniMax | 技术博客 (官网) | M2/M2.1 混合注意力、MoE | ⭐ |
| 商汤科技 | sensetime.com/cn/blog | SenseCore AI 大装置、多模态 Agent | ⭐ |
| 百度 | 百度智能云 / 飞桨 | 文心大模型、AIAK 推理加速 | ⭐ |
| 百川 (Baichuan) | GitHub: baichuan-inc | 国内开源模型 | ⭐ |
🇨🇳 国内 — 基础设施
| 公司 | 技术博客/实践页面 | 核心特色 | 推荐度 |
|---|---|---|---|
| 字节跳动 | Seed 技术博客 / CSDN + GitHub: bytedance | Trae Agent、btrace、云原生调度 | ⭐⭐ |
🎯 精选推荐
⭐⭐⭐ 第一梯队 (最值得借鉴)
| 公司 | 为什么选它 |
|---|---|
| Anthropic | 最系统的 Agent 工程方法论 — eval、harness、context engineering、multi-agent、安全 |
| OpenAI | 开发者博客 + engineering 栏目,prompt/reasoning 最佳实践、agent 开发 |
| NVIDIA | GPU 推理/训练优化权威,Dynamo 分布式推理、多节点架构 |
| AWS | 云原生 MLOps 最佳实践,SageMaker + Bedrock + Well-Architected ML |
| Hugging Face | 开源生态 + 生产级工程实践,PEFT/QLoRA/RAG/推理优化 |
| DeepSeek | 工程细节密度最高的技术报告 — MoE、MLA、FP8 训练、通信优化 |
⭐⭐ 第二梯队
| 公司 | 为什么选它 |
|---|---|
| 月之暗面 (Kimi) | Mooncake 架构创新,KV 缓存 + 长上下文处理 |
| Meta | 大规模 ML 效率优化,PyTorch 生态 |
| Databricks | AI-native 数据工程 |
| 腾讯 | 国内最完整的多 Agent 工程案例 |
| 华为 | 国产 AI 芯片 + 框架全栈 |
📚 Anthropic /engineering 文章索引
按时间倒序,Anthropic 的工程博客是目前最好的参考范本:
| 文章 | 日期 | 主题 |
|---|---|---|
| Infrastructure noise in agentic coding evals | 2026 | Agent eval 基础设施噪声 |
| Claude Code auto mode | 2026-03 | 安全权限 |
| Harness design for long-running apps | 2026-03 | 长运行 Agent harness |
| Eval awareness in BrowseComp | 2026-03 | Eval 意识 |
| Building a C compiler with parallel Claudes | 2026-02 | 多 Agent 并行开发 |
| AI-resistant technical evaluations | 2026-01 | AI 抗性 eval |
| Demystifying evals for AI agents | 2026-01 | Agent eval 解密 |
| Effective harnesses for long-running agents | 2025-11 | 长运行 Agent harness |
| Advanced tool use | 2025-11 | 高级工具使用 |
| Code execution with MCP | 2025-11 | MCP 代码执行 |
| Claude Code sandboxing | 2025-10 | 安全沙箱 |
| Effective context engineering | 2025-09 | Context engineering |
| A postmortem of three recent issues | 2025-09 | 事故复盘 |
| Writing effective tools for agents | 2025-09 | Agent 工具开发 |
| How we built multi-agent research | 2025-06 | Multi-agent 研究系统 |
| Claude Code best practices | 2025-04 | Agent coding 最佳实践 |
| The "think" tool | 2025-03 | Think tool 设计 |
| SWE-bench with Claude 3.5 Sonnet | 2025-01 | SWE-bench |
🔗 快速访问
海外: Anthropic · OpenAI · DeepMind · Meta · Hugging Face · NVIDIA · AWS · Mistral · Databricks · LangChain
国内: DeepSeek · Kimi · 智谱 · Qwen · 百川 · 字节
📝 后续计划
- 从 ⭐⭐⭐ 精选中继续深挖具体文章
- 按主题分类:Agent / 训练 / 推理 / 安全 / 开发者体验
- 评估哪些实践可以直接借鉴到我们的项目
- 定期更新(建议每月一次)
v1.0 — 2026-03-30 由 WLB + GSD 协作整理 · 深度分析专栏 →