Bạn đã nghe về prompt engineering. Nhưng những kỹ sư đang triển khai AI agent cho production vào năm 2025 lại đang nói về điều gì đó sâu hơn: context engineering.
Repository Agent-Skills-for-Context-Engineering của Muratcan Koylan là một bộ sưu tập mở toàn diện các Agent Skill có cấu trúc — đã được viện dẫn trong nghiên cứu học thuật từ Đại học Bắc Kinh — dạy nghệ thuật và khoa học của việc quản lý những gì đưa vào context window của mô hình để tối đa hóa hiệu quả của agent.
Phần 1: Nền Tảng — Mô Hình Tư Duy
Prompt Engineering vs. Context Engineering
Hầu hết developer dừng lại ở prompt engineering: viết hướng dẫn thông minh để định hướng hành vi của mô hình. Điều đó cần thiết, nhưng chỉ là một mảnh ghép.
Context engineering là kỷ luật quản lý tất cả mọi thứ mà language model có thể chú ý đến tại thời điểm inference:
- System prompts
- Định nghĩa tool
- Tài liệu được truy xuất
- Lịch sử hội thoại
- Kết quả tool outputs
Giới hạn cơ bản không phải là dung lượng token thô — mà là cơ chế attention. Khi độ dài context tăng, mô hình thể hiện các mẫu xuống cấp có thể dự đoán được: hiện tượng “lạc giữa đường”, đường cong attention hình chữ U, và sự khan hiếm attention. Mục tiêu là tìm tập hợp token có tín hiệu cao nhỏ nhất tối đa hóa xác suất đạt được kết quả mong muốn.
Hãy nghĩ context window của mô hình như bảng điều tra của thám tử. Một thám tử giỏi không ghim mọi mẩu báo lên bảng — họ chỉ chọn lọc những bằng chứng quan trọng nhất. Context engineering chính là nghệ thuật làm trợ lý cho người thám tử đó.
Agent Skill là gì?
Repository này triển khai đặc tả Agent Skills — một cách có cấu trúc để đóng gói hướng dẫn cho AI agent. Mỗi skill tuân theo định dạng chuẩn:
| |
Thiết kế tuân theo progressive disclosure (tiết lộ dần dần): khi khởi động, agent chỉ tải tên và mô tả skill. Nội dung đầy đủ chỉ tải khi skill được kích hoạt cho task liên quan. Điều này giữ cho agent nhanh trong khi vẫn có thể truy cập chuyên môn sâu khi cần.
Phần 2: Khảo Sát — Kiến Trúc Skill
13 Skill Trên 5 Danh Mục
Bộ sưu tập tổ chức 13 skill thành một lộ trình học tập mạch lạc:
| Danh mục | Các Skills |
|---|---|
| Nền tảng | context-fundamentals, context-degradation, context-compression |
| Kiến trúc | multi-agent-patterns, memory-systems, tool-design, filesystem-context, hosted-agents |
| Vận hành | context-optimization, evaluation, advanced-evaluation |
| Phát triển | project-development |
| Nhận thức | bdi-mental-states |
Tích Hợp Plugin Claude Code
Điều khiến bộ sưu tập này độc đáo là tích hợp trực tiếp với marketplace plugin của Claude Code:
| |
Skill tự động kích hoạt dựa trên ngữ cảnh task — không cần cấu hình thủ công.
Phần 3: Phân Tích — Thực Sự Làm Được Gì Cho Developer
3.1 Giải Phẫu Context (từ context-fundamentals)
Skill context-fundamentals phân tích những gì thực sự tồn tại trong context của mô hình:
| Thành phần | Đặc điểm |
|---|---|
| System prompts | Tải một lần, tồn tại suốt session |
| Định nghĩa tool | Được serialize gần đầu context; mô tả định hướng hành vi |
| Tài liệu truy xuất | Tải theo just-in-time qua RAG |
| Lịch sử tin nhắn | Tăng tuyến tính; chiếm ưu thế trong các task chạy dài |
| Tool outputs | Có thể đạt tới 83,9% tổng context trong các agent trajectory |
Insight chính: context phải được coi là tài nguyên hữu hạn với lợi nhuận cận biên giảm dần. Mỗi token mới làm cạn kiệt ngân sách attention.
Ví dụ thực tế — tổ chức system prompt với ranh giới phần rõ ràng:
| |
3.2 Các Mẫu Xuống Cấp Context (từ context-degradation)
Đây là nơi mọi thứ trở nên hấp dẫn về mặt thực nghiệm. Skill ghi lại 5 chế độ hỏng hóc riêng biệt:
1. Lạc Giữa Đường (Lost-in-the-Middle) — Thông tin ở giữa context nhận được độ chính xác thu hồi thấp hơn 10-40% so với thông tin ở đầu hoặc cuối. Đây không phải lỗi; đây là hệ quả của cơ chế attention.
2. Đầu Độc Context (Context Poisoning) — Một ảo giác hoặc kết quả tool sai lầm đi vào context và nhân lên qua các tham chiếu lặp đi lặp lại. Khôi phục đòi hỏi cắt bỏ context đến trước điểm bị đầu độc.
3. Phân Tâm Context (Context Distraction) — Ngay cả một tài liệu không liên quan cũng giảm hiệu suất. Hiệu ứng không tỷ lệ; nó là hàm bước nhảy.
4. Nhầm Lẫn Context (Context Confusion) — Khi context chứa nhiều loại task, mô hình có thể áp dụng ràng buộc từ task sai.
5. Xung Đột Context (Context Clash) — Nhiều thông tin chính xác nhưng mâu thuẫn nhau tạo ra hướng dẫn trái chiều.
Ngưỡng xuống cấp theo model (từ dữ liệu tham khảo của skill):
| Model | Xuống cấp bắt đầu | Xuống cấp nặng |
|---|---|---|
| GPT-5.2 | ~64K tokens | ~200K tokens |
| Claude Opus 4.5 | ~100K tokens | ~180K tokens |
| Claude Sonnet 4.5 | ~80K tokens | ~150K tokens |
| Gemini 3 Pro | ~500K tokens | ~800K tokens |
Giảm thiểu thực tế — chiến lược Four-Bucket:
| |
3.3 Multi-Agent Patterns (từ multi-agent-patterns)
Skill multi-agent tiết lộ một insight quan trọng: sub-agent tồn tại chủ yếu để cô lập context, không phải để mô phỏng cơ cấu tổ chức.
Thực tế kinh tế token:
| Kiến trúc | Hệ số nhân Token |
|---|---|
| Chat với single agent | 1× |
| Single agent có tools | ~4× |
| Hệ thống multi-agent | ~15× |
Mặc dù chi phí cao hơn, cách tiếp cận multi-agent mở khóa khả năng song song hóa. Nghiên cứu về đánh giá BrowseComp cho thấy lượng token sử dụng giải thích 80% phương sai hiệu suất — xác nhận rằng phân phối công việc qua các agent với context window riêng biệt xứng đáng với chi phí bỏ ra.
Vấn Đề Trò Chơi Điện Thoại — một cạm bẫy nghiêm trọng trong kiến trúc supervisor:
Benchmark LangGraph phát hiện kiến trúc supervisor ban đầu hoạt động kém hơn 50% so với phiên bản tối ưu vì supervisor diễn giải lại phản hồi của sub-agent một cách sai lệch. Giải pháp là tool forward_message:
| |
3.4 Các Ví Dụ Thực Tế Được Đính Kèm
Repo đi kèm 5 ví dụ cấp production thể hiện cách các skill kết hợp trong thực tế:
| Ví dụ | Minh họa gì |
|---|---|
digital-brain-skill | Hệ điều hành cá nhân cho founder — 6 module, 4 automation script, bộ nhớ JSONL ghi một chiều |
x-to-book-system | Pipeline multi-agent theo dõi tài khoản X → tạo sách tổng hợp hàng ngày |
llm-as-judge-skills | Công cụ đánh giá LLM bằng TypeScript — 19 test pass, so sánh theo cặp, giảm thiểu bias |
book-sft-pipeline | Fine-tune mô hình 8B theo phong cách bất kỳ tác giả với tổng chi phí 2 USD |
interleaved_thinking | Minh họa kiến trúc nhận thức |
Phần 4: Giải Pháp — Cách Sử Dụng
Cho Người Dùng Claude Code
Con đường nhanh nhất:
| |
Skill tự kích hoạt khi bạn dùng các cụm từ kích hoạt:
| Cụm từ kích hoạt | Skill được kích hoạt |
|---|---|
| “compress context” | context-compression |
| “implement LLM-as-judge” | advanced-evaluation |
| “design multi-agent system” | multi-agent-patterns |
| “build background agent” | hosted-agents |
Cho Cursor / Codex / IDE Bất Kỳ
Copy nội dung SKILL.md liên quan vào file .rules hoặc thư mục hướng dẫn dự án của bạn. Các skill được thiết kế không phụ thuộc nền tảng một cách có chủ ý.
Lộ Trình Học Tập Được Khuyến Nghị
- Bắt đầu với
context-fundamentals— xây dựng mental model - Học
context-degradation— hiểu cách mọi thứ sai lệch - Áp dụng
context-compressionvàcontext-optimization— phòng ngừa vấn đề - Mở rộng sang các skill kiến trúc theo nhu cầu hệ thống của bạn
Mental Model Cuối Cùng
| |
Dù bạn đang xây dựng AI agent đầu tiên hay tối ưu hóa hệ thống multi-agent cho production, bộ sưu tập này cung cấp từ vựng, mental model, và các pattern cụ thể để thực hiện context engineering đúng cách.
Repository: Agent-Skills-for-Context-Engineering
Tác giả: Muratcan Koylan