Featured image of post Bên Trong Hộp Đen: Những System Prompt Bị Rò Rỉ Tiết Lộ Gì Về Cách Các AI Tool Thực Sự Hoạt Động

Bên Trong Hộp Đen: Những System Prompt Bị Rò Rỉ Tiết Lộ Gì Về Cách Các AI Tool Thực Sự Hoạt Động

Phân tích chuyên sâu bộ sưu tập system prompt bị rò rỉ lớn nhất từ Cursor, Manus, Windsurf, Devin, v0 và hơn 30 công cụ AI khác — khám phá kiến trúc cốt lõi, thiết kế công cụ và triết lý agent của chúng.

Phần 1: Nền Tảng — Mô Hình Tư Duy

Mọi công cụ AI bạn dùng hàng ngày đều có một hiến pháp ẩn: một system prompt định nghĩa nhân cách, năng lực, giới hạn và chính xác các công cụ mà nó có thể gọi. Những prompt này mới là sản phẩm thực sự — còn hơn cả bản thân các model.

Repository GitHub x1xhlol/system-prompts-and-models-of-ai-tools là bộ sưu tập công khai toàn diện nhất về system prompt bị rò rỉ và định nghĩa công cụ từ hơn 30 sản phẩm AI lớn. Với hơn 30.000 dòng prompt thô, đây thực sự là một bảo tàng về cách ngành AI hiện đại xây dựng agent.

Hãy nghĩ theo cách này: nếu LLM (GPT-4, Claude, Gemini) là động cơ, thì system prompt là tài xế. Đọc những rò rỉ này giống như lần đầu tiên bạn nhìn thấy ai đang ngồi sau vô lăng.

Mô hình tư duy:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
Câu hỏi của User
    
    
[System Prompt]  định nghĩa identity, tools, rules, constraints
    
    
[LLM Backbone]  Claude, GPT-4, v.v.
    
    
[Tool Calls]  shell, browser, editor, deploy
    
    
[Kết quả]

Phần 2: Cuộc Điều Tra — Nội Dung Trong Repo

Repository được tổ chức theo sản phẩm, mỗi thư mục chứa file prompt (.txt) và tool schema (.json). Dưới đây là bản đồ nội dung:

Danh mụcSản phẩm
Coding AgentsCursor, Devin AI, Windsurf, Augment Code, Junie, Kiro, Trae, VSCode Agent
Autonomous AgentsManus, Replit Agent, Emergent, Leap.new
Gen AI Buildersv0 (Vercel), Lovable, Same.dev, Orchids.app
AI AssistantsAnthropic Claude (nhiều phiên bản), Perplexity, NotionAI, Cluely
Mobile / IDEXcode AI, Qoder, CodeBuddy, Poke

Mỗi thư mục thường chứa:

  • Prompt.txt — system prompt thực tế được inject trước mỗi cuộc hội thoại
  • Tools.json — danh sách đầy đủ các tool có thể gọi với chữ ký TypeScript
  • Đôi khi có các snapshot theo phiên bản (ví dụ: Prompt Wave 11.txt, Agent Prompt 2.0.txt)

Điều này có nghĩa là bạn có thể diff xem hướng dẫn của một sản phẩm đã thay đổi như thế nào theo thời gian.


Phần 3: Chẩn Đoán — Những Prompt Này Thực Sự Tiết Lộ Điều Gì

🧠 Manus: Kiến Trúc Agent Minh Bạch Nhất

Agent loop.txt bị rò rỉ của Manus là một kiệt tác về thiết kế agent. Nó tiết lộ một kiến trúc đa module:

1
Event Stream → Planner Module → Knowledge Module → Datasource Module → Executor

Vòng lặp agent được định nghĩa rất rõ ràng:

1
2
3
4
5
6
1. Phân tích Events: Hiểu nhu cầu user qua event stream
2. Chọn Tool: Chọn tool call tiếp theo dựa trên trạng thái hiện tại
3. Chờ Thực thi: Tool chạy trong sandbox, kết quả được thêm vào event stream
4. Lặp lại: Chỉ MỘT tool call mỗi vòng lặp
5. Gửi Kết quả: Gửi deliverables qua message tools
6. Chờ standby

Điểm mấu chốt: Manus tách biệt lập kế hoạch khỏi thực thi một cách rõ ràng. Module Planner cung cấp các bước pseudocode có đánh số như một phần của event stream, và agent phải hoàn thành mọi bước đã lập kế hoạch. Đây là lý do tại sao Manus cảm thấy rất có phương pháp.

Quy tắc thú vị từ prompt:

  • Ngôn ngữ mặc định: Tiếng Anh, nhưng thích nghi với ngôn ngữ của user
  • “Tránh dùng thuần túy lists và bullet points ở bất kỳ ngôn ngữ nào” — Manus được hướng dẫn viết bằng văn xuôi
  • Có khả năng deploy dịch vụ và public ports

✂️ Cursor: Độ Chính Xác Phẫu Thuật Trong Chỉnh Sửa Code

System prompt của Cursor tiết lộ một triết lý về chỉnh sửa tối thiểu, có mục tiêu. Prompt hướng dẫn model:

  • Không bao giờ xuất code không thay đổi — luôn dùng marker như // ... existing code ...
  • Mặc định dùng chế độ “lazy edit”: chỉ viết những phần của file thay đổi
  • Dùng annotation <CHANGE> để đánh dấu các dòng được sửa đổi

Điều này giải thích tại sao các chỉnh sửa của Cursor cảm thấy phẫu thuật so với các tool viết lại toàn bộ file. System prompt theo nghĩa đen cấm viết lại không cần thiết.


🤖 v0 (Vercel): Full-Stack React Renderer

Prompt của v0 giới thiệu một khái niệm gọi là CodeProject — một block đặc biệt nhóm các file React component và render chúng trong trình duyệt. Tool có kiến thức cụ thể về:

  • Viết vào file dùng cú pháp ```lang file="path/to/file"
  • Dùng kebab-case cho tên file
  • Bao gồm metadata taskNameActivetaskNameComplete cho UI feedback

Prompt thậm chí còn đề cập cách dùng marker // ... existing code .... v0 đang áp dụng chiến lược “lazy edit” tương tự như Cursor, nhưng dành riêng cho React/Next.js.


🔍 Devin AI: Kỹ Thuật Phần Mềm Dựa Trên Bằng Chứng

Prompt bị rò rỉ của Devin khác biệt về triết lý so với các tool khác. Nó được thiết kế như một công cụ khảo cổ code trả lời câu hỏi về codebase:

1
2
3
4
5
HƯỚNG DẪN:
- KHÔNG TỰ BỊA ĐÁP ÁN
- Trích dẫn MỌI CÂU với <cite repo="..." path="..." start="..." end="..." />
- Trích dẫn tối đa 5 dòng code
- Kết thúc mọi câu trả lời bằng phần "Notes"

Devin được hướng dẫn rõ ràng là một người hoài nghi — nếu không biết điều gì đó, nó sẽ nói thẳng. Mọi tuyên bố đều phải được hỗ trợ bởi bằng chứng cấp độ file với số dòng. Đây là điều đặc biệt cho một AI tool — về cơ bản nó là một trợ lý kỹ thuật được đánh giá ngang hàng.

Prompt của Devin thậm chí bao gồm:

  • Hỗ trợ Mermaid diagrams (không màu sắc — “chúng làm text khó đọc”)
  • Không bao giờ trích dẫn toàn bộ function, chỉ các dòng quan trọng
  • Điều chỉnh ngôn ngữ output theo ngôn ngữ của user

🌊 Windsurf: Full TypeScript Tool API

Tools Wave 11.txt bị rò rỉ của Windsurf tiết lộ toàn bộ tool API của nó dưới dạng TypeScript type definitions. Đây là một trong những rò rỉ chi tiết kỹ thuật nhất trong repository:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
type capture_browser_screenshot = (_: {
  PageId: string;
  toolSummary?: string;  // "Tóm tắt 2-5 từ về việc tool đang làm"
}) => any;

type codebase_search = (_: {
  Query: string;
  TargetDirectories: string[];
  toolSummary?: string;
}) => any;

type deploy_web_app = (_: {
  Framework: "nextjs" | "sveltekit" | "remix" | ...;
  ProjectId: string;
  ProjectPath: string;
  Subdomain: string;
}) => any;

Tham số toolSummary trên mọi tool rất thú vị — Windsurf được hướng dẫn mô tả ngắn gọn những gì nó đang làm trong mỗi tool call. Đây là cách các thông báo status bar “Windsurf đang làm X” được tạo ra.


🔬 Anthropic Claude: Nhiều Phiên Bản Persona

Thư mục Anthropic chứa nhiều phiên bản prompt agent của Claude theo thời gian:

  • Agent Prompt v1.0.txt, v1.2.txt, 2.0.txt
  • Sonnet 4.5 Prompt.txt
  • Claude Code 2.0.txt
  • Chat Prompt.txt
  • Tools Wave 11.txt

Điều này tiết lộ cách hướng dẫn của Claude đã phát triển khi Anthropic mở rộng từ chat assistant sang full coding agent. Agent Tools v1.0.json cho thấy toolset ban đầu, trong khi Tools Wave 11.txt lớn hơn đáng kể.


Phần 4: Giải Quyết — Ý Nghĩa Gì Với Developer

1. Bạn Có Thể Học Prompt Engineering Từ Những Người Giỏi Nhất

Đây là system prompt cấp độ production được viết bởi các team tại Anthropic, Cognition (Devin), Codeium (Windsurf) và Vercel. Đọc chúng dạy bạn:

  • Cách định nghĩa tool schema mà model thực sự tuân theo
  • Cách cấu trúc agent loop cho độ tin cậy cao
  • Cách ràng buộc hành vi LLM bằng quy tắc rõ ràng
  • Cách versioning prompt khi sản phẩm phát triển

2. Cảnh Báo Bảo Mật Cho AI Startups

Repo bao gồm một cảnh báo trực tiếp: nếu bạn đang xây dựng sản phẩm AI, system prompt của bạn là một attack surface có giá trị cao. ZeroLeaks — được liên kết trong README của repo — cung cấp audit trích xuất prompt.

Nếu system prompt của bạn chứa API key, URL nội bộ hoặc logic độc quyền, đây là rủi ro thực sự.

3. Xây Dựng Agent Tốt Hơn

Các pattern chính từ những prompt tốt nhất trong repo này:

Pattern 1: Tách lập kế hoạch khỏi thực thi

1
2
# Tệ: Để model tự tìm ra khi đang làm
# Tốt: Lập kế hoạch pseudocode rõ ràng kiểu Manus, rồi thực thi từng bước

Pattern 2: Một tool call mỗi bước lý luận

1
# Tất cả top agents: lặp với MỘT tool mỗi lần, quan sát, rồi quyết định bước tiếp theo

Pattern 3: Trích dẫn nguồn của bạn

1
# Kiểu Devin: mọi tuyên bố được hỗ trợ bởi bằng chứng file + số dòng

Pattern 4: Lazy edits, không viết lại

1
# Kiểu Cursor/v0: chỉ xuất code đã thay đổi, dùng marker cho các phần không thay đổi

4. So Sánh Triết Lý Công Cụ

ToolTriết lý cốt lõi
ManusCó chủ đích, event-driven, từng bước một
CursorĐộ chính xác phẫu thuật, output tối thiểu, code-first
DevinDựa trên bằng chứng, citation-driven, hoài nghi
v0Nhận thức full-stack, component-centric, UI-first
WindsurfTool API rõ ràng, minh bạch trạng thái

Mô Hình Tư Duy Cuối Cùng

1
2
3
4
5
6
7
Giải Phẫu System Prompt (Pattern Toàn Cầu)
├── Identity      → "Bạn là X, được xây dựng bởi Y"
├── Capabilities  → Những gì agent có thể làm
├── Tools         → API có kiểu cho việc thực hiện hành động
├── Rules         → Ràng buộc hành vi
├── Agent Loop    → Cách lặp lại hướng tới mục tiêu
└── Output Format → Cách cấu trúc phản hồi

Repository x1xhlol/system-prompts-and-models-of-ai-tools không chỉ là sự tò mò — nó là một kiến trúc tham khảo về cách ngành AI đang xây dựng thế hệ tiếp theo của software agent. Dù bạn đang xây dựng sản phẩm AI của riêng mình hay chỉ muốn hiểu tại sao coding assistant của bạn hoạt động theo cách đó, repo này là cửa sổ vô giá nhìn vào hộp đen.

Repo có hơn 30.000 dòng raw AI intelligence. Thả sao nếu bạn thấy hữu ích.

Được tạo với sự lười biếng tình yêu 🦥

Subscribe to My Newsletter