[Ghi lại 02] Về Agent Harness
Mình nghĩ Agent Harness sẽ là theme chủ đạo cho việc ứng dụng AI trong năm 2026.
Bài này mình ghi nhanh và vắn tắt nên giữ nhiều thuật ngữ tiếng Anh, cũng hơi khó dịch cho chuẩn.
Dẫn dắt bằng việc đọc 2 blog về long-horizon coding của Cursor và Anthropic. Bài của Cursor khá sơ lược, chưa thể hiện rằng họ đã làm như thế nào. Tuy nhiên với bài của Anthropic, họ viết chi tiết về 2 việc họ làm: 1 là điều phối các Claude Code session, 2 là provide testing một cách thông minh. Việc số 1 chính là Agent Harness.
Trong 1 video của LangChain, họ đưa ra sơ đồ kiến trúc tổng quan của một Reliability Proactive Agents (OpenClaw là ông nổi tiếng nhất của hội này) gồm 3 layer: Agent, Harness, Underlying: Model, Runtime (Sandbox). Trong đó Harness điều phối workflow, gọi tool, xử lý code execution, call model, …, trong một môi trường sandbox.
Cách đây cỡ 2 tháng, Cursor ra bài về Agent Harness, OpenAI cũng có bài thì phải; song song mình đọc được một bài tổng hợp công phu trên X.
Mấy ngày trước, Anthropic ra bài blog: Harness design for long-running application development. Mình nghĩ đây là lộ trình cần đi để thực sự đạt được autonomous agentic coding, giải phóng bottleneck ở con người trong việc xây dựng phần mềm.
Mình tổng hợp ở đây một số blog, video, opensource để đọc dần, sẽ viết bài thu hoạch chi tiết sau:
Langchain: Tách riêng 1 mục cho Langchain, đây là foundation về AI workflow, có lẽ các thư viện của Langchain sẽ được dùng nhiều cho các bài toán Harness ở các công ty còn lại.
Agentic Coding top tier:
Anthropic
OpenAI:
Cursor
Video hay ho:
Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia
Andrej Karpathy’s Math Proves Agent Skills Will Fail. Here’s What to Build Instead
Cậu này hướng dẫn 6 eps để tự build 1 Agent Harness từ đầu. Đặc biệt là hệ thống hoá 12 things need to know để build reliability agent system.
Opensource đáng để tìm hiểu:
DeepAgents from LangChain
DeerFlow (Deep Exploration and Efficient Research Flow) from ByteDance
Goose - Coding Agent from Block
Minions - Coding Agent from Stripe
Không phải opensource, tuy nhiên Stripe viết 2 bài blog rất chi tiết về cách họ xây dựng Coding Agents cho chính công ty sử dụng.
Proactive Agents:
Awesome sandboxs:
OpenSandbox from Alibaba
OpenShell from Nvidia
Symphony from OpenAI

