Context Engineering: Kỹ Thuật Phân Tách AI Agent Giỏi Khỏi Agent Xuất Sắc

Bạn đã nghe về prompt engineering. Nhưng những kỹ sư đang triển khai AI agent cho production vào năm 2025 lại đang nói về điều gì đó sâu hơn: context engineering.

Repository Agent-Skills-for-Context-Engineering của Muratcan Koylan là một bộ sưu tập mở toàn diện các Agent Skill có cấu trúc — đã được viện dẫn trong nghiên cứu học thuật từ Đại học Bắc Kinh — dạy nghệ thuật và khoa học của việc quản lý những gì đưa vào context window của mô hình để tối đa hóa hiệu quả của agent.

Phần 1: Nền Tảng — Mô Hình Tư Duy

Prompt Engineering vs. Context Engineering

Hầu hết developer dừng lại ở prompt engineering: viết hướng dẫn thông minh để định hướng hành vi của mô hình. Điều đó cần thiết, nhưng chỉ là một mảnh ghép.

Context engineering là kỷ luật quản lý tất cả mọi thứ mà language model có thể chú ý đến tại thời điểm inference:

System prompts
Định nghĩa tool
Tài liệu được truy xuất
Lịch sử hội thoại
Kết quả tool outputs

Giới hạn cơ bản không phải là dung lượng token thô — mà là cơ chế attention. Khi độ dài context tăng, mô hình thể hiện các mẫu xuống cấp có thể dự đoán được: hiện tượng “lạc giữa đường”, đường cong attention hình chữ U, và sự khan hiếm attention. Mục tiêu là tìm tập hợp token có tín hiệu cao nhỏ nhất tối đa hóa xác suất đạt được kết quả mong muốn.

Hãy nghĩ context window của mô hình như bảng điều tra của thám tử. Một thám tử giỏi không ghim mọi mẩu báo lên bảng — họ chỉ chọn lọc những bằng chứng quan trọng nhất. Context engineering chính là nghệ thuật làm trợ lý cho người thám tử đó.

Agent Skill là gì?

Repository này triển khai đặc tả Agent Skills — một cách có cấu trúc để đóng gói hướng dẫn cho AI agent. Mỗi skill tuân theo định dạng chuẩn:

1
2
3
4
skill-name/
├── SKILL.md         # Bắt buộc: hướng dẫn + metadata
├── scripts/         # Tùy chọn: code thực thi
└── references/      # Tùy chọn: tài liệu bổ sung

Thiết kế tuân theo progressive disclosure (tiết lộ dần dần): khi khởi động, agent chỉ tải tên và mô tả skill. Nội dung đầy đủ chỉ tải khi skill được kích hoạt cho task liên quan. Điều này giữ cho agent nhanh trong khi vẫn có thể truy cập chuyên môn sâu khi cần.

Phần 2: Khảo Sát — Kiến Trúc Skill

13 Skill Trên 5 Danh Mục

Bộ sưu tập tổ chức 13 skill thành một lộ trình học tập mạch lạc:

Danh mục	Các Skills
Nền tảng	`context-fundamentals`, `context-degradation`, `context-compression`
Kiến trúc	`multi-agent-patterns`, `memory-systems`, `tool-design`, `filesystem-context`, `hosted-agents`
Vận hành	`context-optimization`, `evaluation`, `advanced-evaluation`
Phát triển	`project-development`
Nhận thức	`bdi-mental-states`

Tích Hợp Plugin Claude Code

Điều khiến bộ sưu tập này độc đáo là tích hợp trực tiếp với marketplace plugin của Claude Code:

1
2
3
4
5
6
7
# Đăng ký marketplace
/plugin marketplace add muratcankoylan/Agent-Skills-for-Context-Engineering

# Cài đặt các gói plugin cụ thể
/plugin install context-engineering-fundamentals@context-engineering-marketplace
/plugin install agent-architecture@context-engineering-marketplace
/plugin install agent-evaluation@context-engineering-marketplace

Skill tự động kích hoạt dựa trên ngữ cảnh task — không cần cấu hình thủ công.

Phần 3: Phân Tích — Thực Sự Làm Được Gì Cho Developer

3.1 Giải Phẫu Context (từ `context-fundamentals`)

Skill context-fundamentals phân tích những gì thực sự tồn tại trong context của mô hình:

Thành phần	Đặc điểm
System prompts	Tải một lần, tồn tại suốt session
Định nghĩa tool	Được serialize gần đầu context; mô tả định hướng hành vi
Tài liệu truy xuất	Tải theo just-in-time qua RAG
Lịch sử tin nhắn	Tăng tuyến tính; chiếm ưu thế trong các task chạy dài
Tool outputs	Có thể đạt tới 83,9% tổng context trong các agent trajectory

Insight chính: context phải được coi là tài nguyên hữu hạn với lợi nhuận cận biên giảm dần. Mỗi token mới làm cạn kiệt ngân sách attention.

Ví dụ thực tế — tổ chức system prompt với ranh giới phần rõ ràng:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
<BACKGROUND_INFORMATION>
Bạn là chuyên gia Python hỗ trợ team phát triển.
Dự án hiện tại: Pipeline xử lý dữ liệu bằng Python 3.9+
</BACKGROUND_INFORMATION>

<INSTRUCTIONS>
- Viết code Python sạch, đúng idiom
- Bao gồm type hints cho function signatures
- Thêm docstrings cho public functions
</INSTRUCTIONS>

<TOOL_GUIDANCE>
Dùng bash cho shell operations, python cho code tasks.
File operations nên dùng pathlib để đảm bảo đa nền tảng.
</TOOL_GUIDANCE>

3.2 Các Mẫu Xuống Cấp Context (từ `context-degradation`)

Đây là nơi mọi thứ trở nên hấp dẫn về mặt thực nghiệm. Skill ghi lại 5 chế độ hỏng hóc riêng biệt:

1. Lạc Giữa Đường (Lost-in-the-Middle) — Thông tin ở giữa context nhận được độ chính xác thu hồi thấp hơn 10-40% so với thông tin ở đầu hoặc cuối. Đây không phải lỗi; đây là hệ quả của cơ chế attention.

2. Đầu Độc Context (Context Poisoning) — Một ảo giác hoặc kết quả tool sai lầm đi vào context và nhân lên qua các tham chiếu lặp đi lặp lại. Khôi phục đòi hỏi cắt bỏ context đến trước điểm bị đầu độc.

3. Phân Tâm Context (Context Distraction) — Ngay cả một tài liệu không liên quan cũng giảm hiệu suất. Hiệu ứng không tỷ lệ; nó là hàm bước nhảy.

4. Nhầm Lẫn Context (Context Confusion) — Khi context chứa nhiều loại task, mô hình có thể áp dụng ràng buộc từ task sai.

5. Xung Đột Context (Context Clash) — Nhiều thông tin chính xác nhưng mâu thuẫn nhau tạo ra hướng dẫn trái chiều.

Ngưỡng xuống cấp theo model (từ dữ liệu tham khảo của skill):

Model	Xuống cấp bắt đầu	Xuống cấp nặng
GPT-5.2	~64K tokens	~200K tokens
Claude Opus 4.5	~100K tokens	~180K tokens
Claude Sonnet 4.5	~80K tokens	~150K tokens
Gemini 3 Pro	~500K tokens	~800K tokens

Giảm thiểu thực tế — chiến lược Four-Bucket:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
# Write: lưu context ra ngoài cửa sổ
scratchpad: "Ghi kết quả trung gian vào filesystem"

# Select: chỉ kéo context liên quan vào
retrieval: "Lọc tài liệu trước khi tải"

# Compress: giảm token nhưng giữ thông tin
summarization: "Thay thế output dài dòng bằng tham chiếu ngắn gọn"

# Isolate: chia cho sub-agent
partition: "Cho mỗi agent một context mới mẻ, tập trung"

3.3 Multi-Agent Patterns (từ `multi-agent-patterns`)

Skill multi-agent tiết lộ một insight quan trọng: sub-agent tồn tại chủ yếu để cô lập context, không phải để mô phỏng cơ cấu tổ chức.

Thực tế kinh tế token:

Kiến trúc	Hệ số nhân Token
Chat với single agent	1×
Single agent có tools	~4×
Hệ thống multi-agent	~15×

Mặc dù chi phí cao hơn, cách tiếp cận multi-agent mở khóa khả năng song song hóa. Nghiên cứu về đánh giá BrowseComp cho thấy lượng token sử dụng giải thích 80% phương sai hiệu suất — xác nhận rằng phân phối công việc qua các agent với context window riêng biệt xứng đáng với chi phí bỏ ra.

Vấn Đề Trò Chơi Điện Thoại — một cạm bẫy nghiêm trọng trong kiến trúc supervisor:

Benchmark LangGraph phát hiện kiến trúc supervisor ban đầu hoạt động kém hơn 50% so với phiên bản tối ưu vì supervisor diễn giải lại phản hồi của sub-agent một cách sai lệch. Giải pháp là tool forward_message:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
def forward_message(message: str, to_user: bool = True):
    """
    Chuyển tiếp phản hồi sub-agent trực tiếp đến user mà không qua tổng hợp của supervisor.
    
    Dùng khi:
    - Phản hồi sub-agent đã hoàn chỉnh
    - Supervisor tổng hợp sẽ mất chi tiết quan trọng
    - Định dạng phản hồi phải được giữ nguyên
    """
    if to_user:
        return {"type": "direct_response", "content": message}
    return {"type": "supervisor_input", "content": message}

3.4 Các Ví Dụ Thực Tế Được Đính Kèm

Repo đi kèm 5 ví dụ cấp production thể hiện cách các skill kết hợp trong thực tế:

Ví dụ	Minh họa gì
`digital-brain-skill`	Hệ điều hành cá nhân cho founder — 6 module, 4 automation script, bộ nhớ JSONL ghi một chiều
`x-to-book-system`	Pipeline multi-agent theo dõi tài khoản X → tạo sách tổng hợp hàng ngày
`llm-as-judge-skills`	Công cụ đánh giá LLM bằng TypeScript — 19 test pass, so sánh theo cặp, giảm thiểu bias
`book-sft-pipeline`	Fine-tune mô hình 8B theo phong cách bất kỳ tác giả với tổng chi phí 2 USD
`interleaved_thinking`	Minh họa kiến trúc nhận thức

Phần 4: Giải Pháp — Cách Sử Dụng

Cho Người Dùng Claude Code

Con đường nhanh nhất:

1
2
3
4
5
6
# 1. Đăng ký marketplace
/plugin marketplace add muratcankoylan/Agent-Skills-for-Context-Engineering

# 2. Cài đặt gói bạn cần
/plugin install context-engineering-fundamentals@context-engineering-marketplace
# Bao gồm: context-fundamentals, context-degradation, context-compression, context-optimization

Skill tự kích hoạt khi bạn dùng các cụm từ kích hoạt:

Cụm từ kích hoạt	Skill được kích hoạt
“compress context”	`context-compression`
“implement LLM-as-judge”	`advanced-evaluation`
“design multi-agent system”	`multi-agent-patterns`
“build background agent”	`hosted-agents`

Cho Cursor / Codex / IDE Bất Kỳ

Copy nội dung SKILL.md liên quan vào file .rules hoặc thư mục hướng dẫn dự án của bạn. Các skill được thiết kế không phụ thuộc nền tảng một cách có chủ ý.

Lộ Trình Học Tập Được Khuyến Nghị

Bắt đầu với context-fundamentals — xây dựng mental model
Học context-degradation — hiểu cách mọi thứ sai lệch
Áp dụng context-compression và context-optimization — phòng ngừa vấn đề
Mở rộng sang các skill kiến trúc theo nhu cầu hệ thống của bạn

Mental Model Cuối Cùng

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Tóm tắt Context Engineering
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

LÀ GÌ:   Bộ sưu tập có cấu trúc gồm 13 agent skill để xây dựng
          hệ thống AI cấp production qua quản lý context

TẠI SAO: Context window có giới hạn. Attention khan hiếm.
          Nhiều token hơn ≠ hiệu suất tốt hơn.

THẾ NÀO: Progressive disclosure + Chiến lược Four-Bucket
          (Write → Select → Compress → Isolate)

INSIGHT CHÍNH:
  Sub-agent tồn tại để cô lập context, không phải mô phỏng sơ đồ tổ chức.
  Đặt thông tin quan trọng ở ĐẦU hoặc CUỐI context, không bao giờ ở giữa.
  Chỉ một tài liệu không liên quan cũng làm giảm hiệu suất rõ rệt.

TÁC ĐỘNG:
  Được viện dẫn trong nghiên cứu Đại học Bắc Kinh về agentic skill evolution.
  13 skill bao phủ từ nền tảng → kiến trúc → vận hành.
  5 ví dụ production hoàn chỉnh với code thực.

NỀN TẢNG:  Claude Code · Cursor · Codex · Mọi agent framework

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Dù bạn đang xây dựng AI agent đầu tiên hay tối ưu hóa hệ thống multi-agent cho production, bộ sưu tập này cung cấp từ vựng, mental model, và các pattern cụ thể để thực hiện context engineering đúng cách.

Repository: Agent-Skills-for-Context-Engineering
Tác giả: Muratcan Koylan