Hệ thống multi-agent (đa tác nhân) đang trở thành một xu hướng mạnh mẽ trong việc tự động hóa, cho phép nhiều AI agent hoạt động độc lập nhưng phối hợp nhịp nhàng để giải quyết các tác vụ phức tạp. Với sự hỗ trợ của các công cụ no-code như n8n, việc xây dựng một hệ thống như vậy chưa bao giờ dễ dàng đến thế.
Trong bài viết này, được chia sẻ bởi Nate Herk, tôi sẽ phân tích chi tiết một workflow multi-agent hiệu quả được xây dựng hoàn toàn trên n8n. Workflow này sử dụng kiến trúc orchestrator (điều phối) để phân bổ công việc một cách thông minh cho các agent chuyên biệt. Nếu bạn đang tìm cách tự động hóa các quy trình phức tạp mà không cần viết code, hãy cùng khám phá cấu trúc và cách thiết lập của hệ thống này.
Download workflow: https://romhub.io/n8n/Multi_Agent_System_Benefits
Kiến trúc của Workflow: Orchestrator và các Agent chuyên biệt
Workflow này được xây dựng dựa trên mô hình orchestrator, trong đó có một agent chính (parent agent) đóng vai trò điều phối, và nhiều agent phụ (child agents) thực hiện các nhiệm vụ cụ thể.
- Parent Agent (The Orchestrator): Agent trung tâm có tên là "Ultimate Assistant". Nhiệm vụ duy nhất của nó là hiểu yêu cầu của người dùng (nhận qua tin nhắn văn bản hoặc tin nhắn thoại trên Telegram) và giao việc cho các agent con phù hợp. Nó không tự mình thực hiện bất kỳ hành động nào như viết email hay tạo sự kiện.
- Child Agents (The Specialists): Bốn agent phụ, mỗi agent tập trung vào một lĩnh vực riêng:
- Email Agent: Xử lý mọi thứ liên quan đến Gmail, từ gửi, trả lời, tạo bản nháp cho đến quản lý nhãn.
- Calendar Agent: Chịu trách nhiệm quản lý Google Calendar, bao gồm tạo, cập nhật, xóa và lấy thông tin sự kiện.
- Contact Agent: Quản lý danh bạ được lưu trữ trên Airtable, có thể lấy, thêm hoặc cập nhật thông tin liên hệ.
- Content Creator Agent: Chuyên viết blog, sử dụng công cụ Tavily để nghiên cứu thông tin trên web và đảm bảo nội dung có đầy đủ trích dẫn.
Lợi ích của kiến trúc Multi-Agent này
Workflow này được thiết kế để tận dụng những lợi ích vốn có của hệ thống đa tác nhân:
- Các thành phần có khả năng tái sử dụng cao.
- Linh hoạt trong việc chọn mô hình AI (sử dụng các mô hình khác nhau cho mỗi agent).
- Dễ dàng gỡ lỗi và bảo trì hơn.
- Logic prompt rõ ràng và khả năng kiểm thử tốt hơn.
- Nền tảng cho các agent có khả năng xử lý nhiều lượt hoặc có bộ nhớ riêng.
Phân tích từng Agent trong hệ thống
Hãy cùng đi sâu vào vai trò, công cụ và mô hình AI mà mỗi agent sử dụng trong workflow này.
1. The Orchestrator: "Ultimate Assistant"
Đây là bộ não của hệ thống, có nhiệm vụ điều phối và tuân thủ các quy tắc nghiêm ngặt.
- Mô hình AI: GPT-4.1.
- System Prompt:
- Vai trò: "Bạn là một trợ lý cá nhân tối thượng. Công việc của bạn là gửi yêu cầu của người dùng đến đúng công cụ. Bạn không bao giờ được viết email hay tạo bản tóm tắt, bạn chỉ cần gọi đúng công cụ.".
- Công cụ: Được trang bị các công cụ là chính các child agent:
emailAgent
,calendarAgent
,contactAgent
,contentCreator
và các công cụ hỗ trợ nhưThink
vàTavily
. - Quy tắc xử lý: Đối với các tác vụ như gửi email hoặc tạo sự kiện với người tham dự, nó phải luôn gọi
contactAgent
trước để lấy thông tin email, sau đó mới chuyển yêu cầu cùng với email đó cho agent tương ứng. - Quy tắc bắt buộc: Phải luôn sử dụng công cụ
"Think"
để xác minh các bước đã thực hiện.
2. The Specialists: Các Child Agent
Mỗi agent con được tối ưu hóa cho một nhiệm vụ cụ thể với mô hình AI và công cụ riêng.
Email Agent
- Mô hình AI: gpt-4.1-mini.
- Công cụ: Sử dụng các node của Gmail để
Send Email
,Email Reply
,Create Draft
,Get Emails
,Label Emails
,Get Labels
, vàMark Unread
. - Chỉ dẫn đặc biệt: "Tất cả email phải được định dạng chuyên nghiệp bằng HTML và ký tên là 'Nate.'".
Calendar Agent
- Mô hình AI: gpt-4.1-mini.
- Công cụ: Sử dụng các node của Google Calendar để
Create Event with Attendee
,Create Event
,Get Events
,Delete Event
, vàUpdate Event
. - Chỉ dẫn đặc biệt: "Nếu thời lượng của sự kiện không được chỉ định, hãy mặc định là một giờ.".
Contact Agent
- Mô hình AI: Gemini 2.0 Flash.
- Công cụ: Sử dụng các node của Airtable để
Get Contacts
vàAdd or Update Contact
. - Nhiệm vụ: Quản lý, tra cứu và cập nhật thông tin trong cơ sở dữ liệu liên hệ.
Content Creator Agent
- Mô hình AI: Claude 3.7 Sonnet.
- Công cụ: Sử dụng
Tavily
để tìm kiếm thông tin trên web. - Chỉ dẫn đặc biệt: "Định dạng tất cả nội dung blog bằng HTML... Tất cả các trích dẫn từ công cụ Tavily phải được giữ lại, với các siêu liên kết có thể nhấp vào để người đọc truy cập nguồn gốc.".
Hướng dẫn cài đặt hệ thống Multi-Agent này
Để triển khai workflow này, bạn cần làm theo hướng dẫn cài đặt chi tiết do Nate Herk cung cấp ngay trong workflow:
- Lấy Email Agent và đặt nó vào một workflow mới.
- Trong workflow chính, liên kết công cụ Email Agent với workflow mới mà bạn vừa tạo.
- Trong workflow của Email Agent, hãy bắt đầu bằng trigger "Execute Workflow" (
When workflow is executed by another
). - Lặp lại các bước 1-3 cho Calendar Agent, Contact Agent, và Content Creator Agent.
- Đảm bảo tất cả các agent đều được kết nối với một Chat Model (ví dụ: OpenRouter, Google, hoặc OpenAI).
- Kết nối tất cả các thông tin xác thực cần thiết:
- ✅ Thông tin xác thực của Chat model.
- ✅ Khóa API của Tavily.
- ✅ Tài khoản Google.
- ✅ Airtable.
- ✅ Telegram.
Kết luận
Việc xây dựng hệ thống multi-agent với n8n, như đã được minh họa trong workflow này, là một cách tiếp cận cực kỳ mạnh mẽ để tự động hóa các quy trình phức tạp mà không cần kỹ năng lập trình. Bằng cách áp dụng kiến trúc orchestrator, bạn có thể phân chia công việc một cách thông minh, tận dụng sự chuyên môn hóa của từng agent và linh hoạt lựa chọn mô hình AI phù hợp cho từng tác vụ để đạt hiệu quả cao nhất. Hy vọng rằng phân tích chi tiết này sẽ giúp bạn tự tin bắt đầu hành trình xây dựng hệ thống multi-agent của riêng mình.