Khám phá AI Agent: Định nghĩa, Agentic Workflow, Mô hình thiết kế (Reflection, Tool use, Planning, Multi-agent) & tạo Workflow No-code với n8n.
Định nghĩa về AI Agent
- Một trong những điều khó khăn nhất là định nghĩa về AI agent vì đây là một lĩnh vực mới và đang được phát triển. 00:00:37
- Ví dụ về thứ KHÔNG phải là AI agent: Khi bạn yêu cầu AI làm điều gì đó trực tiếp, còn được gọi là one-shot prompting. 00:01:49
- Ví dụ: Yêu cầu ChatGPT viết một bài luận đầy đủ về chủ đề X từ đầu đến cuối chỉ trong một lần. 00:02:04
- Kết quả có thể mơ hồ và không đáp ứng được mong đợi của bạn. 00:02:11
- Agentic workflow (quy trình làm việc theo kiểu agent) có thể cải thiện đáng kể kết quả. 00:02:19
- Chia nhỏ nhiệm vụ tổng thể thành các bước khác nhau. 00:02:25
- Ví dụ quy trình viết bài luận theo kiểu agent:
- Viết dàn ý cho chủ đề. 00:02:27
- Nghiên cứu web nếu cần. 00:02:29
- Viết bản nháp đầu tiên. 00:02:32
- Xem xét phần nào của bản nháp cần sửa đổi hoặc nghiên cứu thêm. 00:02:34
- Sửa đổi bản nháp trước khi hoàn thành bài luận. 00:02:36
- Non-agentic workflow (quy trình làm việc không theo kiểu agent) là quy trình tuyến tính từ đầu đến cuối, một lần là xong. 00:02:41
- Agentic workflow là một quá trình lặp đi lặp lại theo vòng tròn. 00:02:44
- Suy nghĩ, nghiên cứu, đưa ra kết quả, sửa đổi, lặp lại cho đến khi đạt được kết quả cuối cùng. 00:02:47
- Autonomous AI agent (AI agent tự chủ thực sự) là cấp độ thứ ba, cao hơn agentic workflow. 00:03:05
- AI có thể tự chủ hoàn toàn xác định các bước chính xác, công cụ cần sử dụng. 00:03:12
- Tự thực hiện quy trình sửa đổi lặp đi lặp lại để đưa ra kết quả cuối cùng. 00:03:15
- Mục tiêu là AI agent trở nên tự chủ ở cấp độ này, nhưng hiện tại vẫn đang tập trung vào agentic workflow. 00:03:21
Các mô hình thiết kế Agentic
- Có bốn mô hình thiết kế agentic được chấp nhận rộng rãi, theo Anjhing. 00:03:44
- Reflection (Phản xạ) 00:03:52
- Mô hình đơn giản nhất, yêu cầu AI xem xét kỹ lưỡng kết quả của chính mình. 00:03:53
- Ví dụ:
- Yêu cầu AI viết code để hoàn thành một nhiệm vụ cụ thể. 00:03:59
- Sau khi AI xuất code, yêu cầu AI tự kiểm tra code về tính chính xác, kiểu dáng và hiệu quả. 00:04:07
- Yêu cầu AI đưa ra những phê bình mang tính xây dựng để cải thiện code. 00:04:11
- AI có thể tự xem xét và sửa lỗi trong code của mình, cải thiện kết quả đầu ra. 00:04:15
- Mở rộng của Reflection: Sử dụng một AI khác để nhắc AI ban đầu thực hiện quy trình phản xạ. Đây là multi-agent framework (khung đa agent). 00:04:34
- Tool use (Sử dụng công cụ) 00:04:50
- Cung cấp cho AI khả năng sử dụng các công cụ để giúp AI phân tích và thực hiện các phần cụ thể của nhiệm vụ tốt hơn. 00:04:52
- Ví dụ:
- Hỏi AI: "Máy pha cà phê tốt nhất theo đánh giá của người dùng là gì?". 00:05:05
- Cung cấp cho AI công cụ tìm kiếm web để AI có thể tìm kiếm các bài đánh giá khác nhau trên internet, tổng hợp và tóm tắt chúng. 00:05:07
- Kết quả sẽ tốt hơn nhiều so với việc chỉ yêu cầu AI đưa ra câu trả lời trực tiếp. 00:05:19
- Code execution tool (Công cụ thực thi code) là một công cụ mạnh mẽ thường được sử dụng. 00:05:24
- Cho phép AI tạo và xây dựng mọi thứ, ví dụ: website hoặc tính toán các vấn đề liên quan đến số và toán học. 00:05:29
- Ví dụ: Hỏi AI: "Nếu tôi đầu tư 100 đô la với lãi suất kép 7% trong 12 năm, tôi sẽ có bao nhiêu tiền vào cuối kỳ hạn?". AI có thể sử dụng công cụ này để tính toán câu trả lời. 00:05:39
- Các công cụ khác: object detection (nhận diện đối tượng), web generation (tạo web), truy cập email và lịch để lên lịch sự kiện. 00:05:49
- Planning and reasoning (Lập kế hoạch và suy luận) 00:05:59
- Cung cấp cho AI một nhiệm vụ và AI có thể tự tìm ra các bước chính xác để hoàn thành và các công cụ cần thiết. 00:06:01
- Ví dụ:
- Yêu cầu AI tạo ảnh một cô gái đang đọc sách, tư thế giống như cậu bé trong ảnh ví dụ (ví dụ. JPEG). 00:06:15
- Sau đó, yêu cầu AI mô tả hình ảnh mới bằng giọng nói. 00:06:23
- Với framework agentic, AI có thể:
- Xem ảnh ví dụ và sử dụng model để xác định tư thế của cậu bé. 00:06:27
- Sử dụng model khác để chuyển đổi tư thế đó thành hình ảnh cô gái. 00:06:33
- Sử dụng model khác để dịch hình ảnh thành văn bản. 00:06:38
- Sử dụng model chuyển văn bản thành giọng nói để mô tả bằng âm thanh những gì cô gái đang làm (ví dụ: "Cô gái đang ngồi trên giường đọc sách"). 00:06:40
- Multi-agent systems (Hệ thống đa agent) 00:06:48
- Sử dụng nhiều large language model (LLM) khác nhau, mỗi LLM có vai trò riêng. 00:06:50
- Lý do sử dụng hệ thống đa agent: Tương tự như làm việc nhóm của con người, mỗi agent có chuyên môn riêng, phối hợp để hoàn thành dự án tốt hơn so với một agent duy nhất làm tất cả. 00:07:03
- Nghiên cứu cho thấy quy trình làm việc đa agent tạo ra kết quả cuối cùng tốt hơn so với việc chỉ sử dụng một AI duy nhất. 00:07:17
- Mẹo ghi nhớ 4 mô hình thiết kế agentic: "Red Turtles Paint Murals" (Rùa đỏ vẽ tranh tường). 00:07:22
- Reflection (Phản xạ)
- Tool use (Sử dụng công cụ)
- Planning (Lập kế hoạch)
- Multi-agents (Đa agent)
- Ví dụ về các tác vụ có thể thực hiện với hệ thống agentic: 00:07:28
- Xác định và đếm số lượng cầu thủ trên sân trong ảnh trận bóng đá. 00:07:55
- Phân tích video: Chia video thành các clip 5 giây và tìm clip ghi lại bàn thắng, hiển thị các khung hình liên quan đến bàn thắng. 00:08:01
- Các ví dụ khác về hệ thống agentic thành công: 00:08:21
- Trợ lý nghiên cứu AI
- AI writer
- Coder AI
- Trợ lý cá nhân
- Prompt engineering rất quan trọng đối với AI agent và agentic workflow. 00:08:37
- Prompt engineering là một trong những kỹ năng có ROI (tỷ lệ hoàn vốn đầu tư) cao nhất hiện nay. 00:08:44
Multi-Agent Design Patterns (Mô hình thiết kế đa Agent)
- Single AI agent (Agent AI đơn lẻ) có 4 thành phần (TAMT): 00:09:49
- Task (Nhiệm vụ): Nhiệm vụ cụ thể mà agent cần thực hiện. 00:09:52
- Answer (Câu trả lời): Loại kết quả đầu ra mong muốn. 00:09:55
- Model (Mô hình): Mô hình AI được sử dụng (ví dụ: Anthropic Claude). 00:09:56
- Tools (Công cụ): Các công cụ mà agent có thể truy cập và sử dụng. 00:09:59
- Ví dụ về Travel Planner AI agent (Agent AI lập kế hoạch du lịch): 00:10:06
- Task: Lập kế hoạch chuyến đi 3 ngày đến Tokyo với ngân sách tiết kiệm. 00:10:09
- Answer: Lịch trình chi tiết với địa điểm, chi phí, đặt phòng khách sạn và vé. 00:10:12
- Model: Anthropic Claude (có thể thay thế bằng các model khác). 00:10:19
- Tools: Google Maps, Skyscanner (vé máy bay), Booking.com (khách sạn), thông tin thẻ tín dụng đã lưu (đặt chỗ). 00:10:25
- Multi-AI agent (Đa Agent AI) đơn giản nhất: Hai AI agent làm việc cùng nhau. 00:10:45
- Mỗi agent có chương trình riêng nhưng làm việc cùng nhau hướng tới mục tiêu chung. 00:10:49
- Ví dụ: Writer agent (Agent viết bài) và Editor agent (Agent biên tập) làm việc cùng nhau để viết bài blog. 00:10:55
- Agent có thể có task riêng, đồng thời làm việc với agent khác trong một task chung. 00:11:05
- Agent có thể có công cụ riêng hoặc task có thể có công cụ riêng mà agent chỉ có thể truy cập cho task đó. 00:11:15
- Các mô hình thiết kế đa agent (khi có nhiều hơn 2 agent): 00:11:39
- Sequential pattern (Mô hình tuần tự): Agent này hoàn thành nhiệm vụ rồi chuyển cho agent khác, giống như dây chuyền lắp ráp. 00:11:52
- Ví dụ: Xử lý tài liệu bằng AI. 00:12:09
- Agent 1: Trích xuất văn bản từ tài liệu scan. 00:12:09
- Agent 2: Tóm tắt văn bản. 00:12:15
- Agent 3: Trích xuất các hành động cần thực hiện và đưa vào bản tóm tắt. 00:12:18
- Agent 4: Lưu dữ liệu vào database. 00:12:21
- Ví dụ: Xử lý tài liệu bằng AI. 00:12:09
- Hierarchical agent system (Hệ thống agent phân cấp): Có agent lãnh đạo (manager agent) giám sát các sub-agent (agent cấp dưới) có task riêng. Các sub-agent báo cáo kết quả cho manager agent để tổng hợp. 00:12:28
- Ví dụ: Viết báo cáo phục vụ ra quyết định kinh doanh. 00:12:47
- Manager agent nhận task và phân công cho các sub-agent. 00:12:51
- Sub-agent 1: Theo dõi và báo cáo xu hướng thị trường (sử dụng các công cụ chuyên biệt). 00:12:55
- Sub-agent 2: Theo dõi tâm lý khách hàng nội bộ (truy cập database nội bộ). 00:13:01
- Sub-agent 3: Theo dõi các chỉ số nội bộ của công ty (hiểu cách sản phẩm tương tác với các sản phẩm khác). 00:13:08
- Manager agent tổng hợp báo cáo từ các sub-agent và có thể chuyển cho agent ra quyết định (decision making agent). 00:13:19
- Decision making agent: Tổng hợp thông tin và đưa ra báo cáo chuyên nghiệp, đề xuất quyết định kinh doanh cuối cùng. 00:13:30
- Ví dụ: Viết báo cáo phục vụ ra quyết định kinh doanh. 00:12:47
- Hybrid system (Hệ thống hỗn hợp): Kết hợp mô hình tuần tự và phân cấp. Agent có thể cộng tác theo cả chiều dọc và chiều ngang. 00:13:36
- Ví dụ: Xe tự lái. 00:13:46
- Agent cấp cao nhất: Lập kế hoạch tuyến đường tổng thể và chiến lược giao thông. 00:13:48
- Sub-agent: Xử lý các vấn đề như: 00:13:54
- Sensor Fusion (kết hợp dữ liệu cảm biến)
- Collision avoidance (tránh va chạm)
- Road condition analysis (phân tích điều kiện đường xá)
- Cần có vòng phản hồi liên tục giữa các agent và agent cấp cao nhất do điều kiện thay đổi liên tục. 00:14:10
- Mô hình này phổ biến trong robotics, hệ thống định vị và hệ thống AI thích ứng. 00:14:25
- Ví dụ: Xe tự lái. 00:13:46
- Parallel agent Design Systems (Hệ thống thiết kế agent song song): Các agent làm việc độc lập trên các luồng công việc khác nhau, xử lý đồng thời các phần khác nhau của task để tăng tốc độ xử lý. 00:14:30
- Ví dụ: AI cho phân tích dữ liệu quy mô lớn. 00:14:40
- Các agent lấy các phần dữ liệu khác nhau và xử lý riêng, sau đó hợp nhất kết quả. 00:14:49
- Ví dụ: AI cho phân tích dữ liệu quy mô lớn. 00:14:40
- Asynchronous multi-agent systems (Hệ thống đa agent bất đồng bộ): Các agent thực hiện task độc lập và vào các thời điểm khác nhau. Phù hợp với điều kiện không chắc chắn hơn so với mô hình tuần tự hoặc song song. 00:14:55
- Ví dụ: AI phát hiện mối đe dọa an ninh mạng. 00:15:09
- Agent 1: Giám sát lưu lượng mạng theo thời gian thực. 00:15:11
- Agent 2: Giám sát các mẫu sử dụng đáng ngờ. 00:15:17
- Agent 3: Lấy mẫu ngẫu nhiên và thử nghiệm các trường hợp sử dụng khác nhau. 00:15:20
- Khi agent phát hiện điều bất thường, sẽ gắn cờ và các hành động khác sẽ xảy ra sau đó. 00:15:26
- Mô hình này hữu ích cho các hệ thống giám sát thời gian thực hoặc hệ thống tự phục hồi. 00:15:39
- Ví dụ: AI phát hiện mối đe dọa an ninh mạng. 00:15:09
- Float: Liên kết các hệ thống đa agent khác nhau với nhau, tạo ra quy trình xử lý phức tạp. 00:15:41
- Tăng độ phức tạp của hệ thống cũng làm tăng tính hỗn loạn do thiếu quyền truy cập trực tiếp vào các agent. 00:15:47
- Tương tự như cách các công ty hoạt động: Công ty càng lớn, càng hỗn loạn và càng cần cấu trúc tổ chức và phân cấp. 00:16:11
- Sequential pattern (Mô hình tuần tự): Agent này hoàn thành nhiệm vụ rồi chuyển cho agent khác, giống như dây chuyền lắp ráp. 00:11:52
Tạo AI Agent Workflow No-Code (Không cần code)
- Sử dụng công cụ no-code n8n để tạo hệ thống đa agent. 00:16:54
- Ví dụ về AI assistant trên Telegram (Inky bot) sử dụng n8n. 00:17:15
- Inky bot có thể giao tiếp, giúp người dùng sắp xếp thứ tự ưu tiên công việc bằng cách truy cập Google Calendar và tạo sự kiện lịch. 00:17:19
- Ví dụ tương tác với Inky bot: "Hôm nay tôi cần làm gì?". Bot sẽ trả lời danh sách công việc và sự kiện theo lịch. 00:17:30
- Quy trình làm việc của Inky bot: 00:18:04
- Telegram trigger: Kích hoạt khi người dùng gửi tin nhắn cho Inky bot (text hoặc voice). 00:18:06
- Switch: Phân loại input là text hay voice. 00:18:10
- Text input: Chuyển trực tiếp vào AI agent. 00:18:17
- Voice input:
- Telegram lấy file voice. 00:18:21
- Gửi file đến OpenAI để transcribe (chuyển giọng nói thành văn bản). 00:18:26
- Gửi text đến AI agent. 00:18:28
- AI agent (sử dụng mô hình TAMT): 00:18:28
- Task: Xử lý truy vấn của người dùng về công việc cần làm trong ngày. 00:18:35
- Answer: Danh sách việc cần làm được ưu tiên và sự kiện được lên lịch trong Google Calendar (nếu cần). 00:18:39
- Model: OpenAI GPT-4o (có thể thay thế). 00:18:45
- Tools: 00:18:58
- Get calendar events: Đọc sự kiện từ Google Calendar. 00:19:00
- Create calendar events: Tạo sự kiện trên Google Calendar. 00:19:05
- Telegram: Giao tiếp với người dùng qua Telegram cho đến khi người dùng hài lòng với danh sách công việc. 00:19:13
- Inky bot có thể thực hiện các tác vụ khác như: check off list, lên kế hoạch trước, xem lại lịch sử. 00:19:20
- Workflow đơn giản với single agent đã có thể tạo ra kết quả hữu ích. Việc thêm agent và chức năng khác sẽ mở rộng khả năng. 00:19:26
Cơ hội cho AI Agent
- Lời khuyên từ Why Combinator: "Đối với mỗi công ty SaaS (Software as a Service), sẽ có một công ty AI agent tương ứng". 00:19:52
- Lặp lại: Mọi công ty SaaS hiện tại sẽ có phiên bản AI agent tương ứng. 00:20:12
- Nếu muốn xây dựng một business về AI agent, hãy xem xét các công ty SaaS hàng đầu và nghĩ cách chuyển đổi chúng thành AI agent company. 00:20:23
- Ví dụ các công ty SaaS hàng đầu: Adobe, Microsoft, Salesforce, Shopify, Linktree, Canva, Squarespace... 00:20:36
- Mọi công ty SaaS unicorn đều có thể có một vertical AI unicorn tương đương. 00:20:49
Đánh giá
- Video kết thúc bằng phần đánh giá với các câu hỏi để kiểm tra kiến thức về AI agent. 00:21:00
Bình luận