[Ghi lại 02] Về Agent Harness

Mình nghĩ Agent Harness sẽ là theme chủ đạo cho việc ứng dụng AI trong năm 2026.

Mar 26, 2026

Bài này mình ghi nhanh và vắn tắt nên giữ nhiều thuật ngữ tiếng Anh, cũng hơi khó dịch cho chuẩn.

Dẫn dắt bằng việc đọc 2 blog về long-horizon coding của Cursor và Anthropic. Bài của Cursor khá sơ lược, chưa thể hiện rằng họ đã làm như thế nào. Tuy nhiên với bài của Anthropic, họ viết chi tiết về 2 việc họ làm: 1 là điều phối các Claude Code session, 2 là provide testing một cách thông minh. Việc số 1 chính là Agent Harness.

Trong 1 video của LangChain, họ đưa ra sơ đồ kiến trúc tổng quan của một Reliability Proactive Agents (OpenClaw là ông nổi tiếng nhất của hội này) gồm 3 layer: Agent, Harness, Underlying: Model, Runtime (Sandbox). Trong đó Harness điều phối workflow, gọi tool, xử lý code execution, call model, …, trong một môi trường sandbox.

Agent Layers (copyright of LangChain Youtube channel)

Cách đây cỡ 2 tháng, Cursor ra bài về Agent Harness, OpenAI cũng có bài thì phải; song song mình đọc được một bài tổng hợp công phu trên X.

Mấy ngày trước, Anthropic ra bài blog: Harness design for long-running application development. Mình nghĩ đây là lộ trình cần đi để thực sự đạt được autonomous agentic coding, giải phóng bottleneck ở con người trong việc xây dựng phần mềm.

Mình tổng hợp ở đây một số blog, video, opensource để đọc dần, sẽ viết bài thu hoạch chi tiết sau:

Langchain: Tách riêng 1 mục cho Langchain, đây là foundation về AI workflow, có lẽ các thư viện của Langchain sẽ được dùng nhiều cho các bài toán Harness ở các công ty còn lại.
- Improving Deep Agents with harness engineering
- Conceptual Overviews: Frameworks, runtimes, and harnesses
Agentic Coding top tier:
Video hay ho:
- Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia
- Andrej Karpathy’s Math Proves Agent Skills Will Fail. Here’s What to Build Instead
  - Cậu này hướng dẫn 6 eps để tự build 1 Agent Harness từ đầu. Đặc biệt là hệ thống hoá 12 things need to know để build reliability agent system.
Opensource đáng để tìm hiểu:
- DeepAgents from LangChain
- DeerFlow (Deep Exploration and Efficient Research Flow) from ByteDance
- Goose - Coding Agent from Block
- Minions - Coding Agent from Stripe
  - Không phải opensource, tuy nhiên Stripe viết 2 bài blog rất chi tiết về cách họ xây dựng Coding Agents cho chính công ty sử dụng.
Proactive Agents:
- OpenClaw
- NanoClaw
Awesome sandboxs:
- E2B
- Daytona
- Sandbox by Cloudflare workers
- OpenSandbox from Alibaba
- OpenShell from Nvidia
- Symphony from OpenAI

thanhtt | Ghi lại | Run, Code & Drink Coffee

Discussion about this post

Ready for more?