Giao thức AG-UI ra mắt để chuẩn hóa tương tác giữa AI Agent và con người trong các ứng dụng

BigGo Editorial Team
Giao thức AG-UI ra mắt để chuẩn hóa tương tác giữa AI Agent và con người trong các ứng dụng

Hệ sinh thái AI agent đã có một bước tiến quan trọng với việc giới thiệu AG-UI, một giao thức mở mới được thiết kế để chuẩn hóa cách thức AI agent tương tác với các ứng dụng giao diện người dùng. Sự phát triển này đáp ứng nhu cầu ngày càng tăng trong cộng đồng AI về các cách thức nhất quán để kết nối hệ thống agent phía backend với giao diện người dùng.

Lấp đầy khoảng trống quan trọng trong tiêu chuẩn giao tiếp của Agent

AG-UI định vị mình như một giao thức bổ sung cho các tiêu chuẩn hiện có trong lĩnh vực giao tiếp agent. Trong khi các giao thức khác như MCP (Model Completion Protocol) xử lý giao tiếp giữa agent và công cụ, A2A/ACP quản lý tương tác giữa agent với agent, AG-UI đặc biệt nhắm vào lớp giao diện giữa agent và con người. Sự phân biệt này rất quan trọng vì nó giải quyết điều mà một thành viên cộng đồng mô tả là nhu cầu tồn tại từ lâu:

Tôi đã thắc mắc về điều này một thời gian - tôi gọi nó là MWP - model workload protocol - một cách hiển thị những gì agent đang làm mà không phụ thuộc vào client: đang làm việc, đang suy nghĩ, đang gọi công cụ, gặp lỗi, cần đầu vào từ con người, cần sự phê duyệt của con người, v.v.

Giao thức này xuất hiện sau một năm hợp tác đơn lẻ giữa CopilotKit và các framework agent khác nhau, cuối cùng dẫn đến quyết định tạo ra một phương pháp tiêu chuẩn hóa có thể mang lại lợi ích cho toàn bộ hệ sinh thái.

Triển khai kỹ thuật và hỗ trợ framework

AG-UI hoạt động như một giao thức nhẹ, dựa trên sự kiện với 16 loại sự kiện chuẩn hóa bao gồm các tương tác agent-người dùng phổ biến. Kiến trúc của nó được thiết kế một cách linh hoạt, hoạt động với nhiều cơ chế truyền tải sự kiện khác nhau bao gồm Server-Sent Events (SSE), WebSockets, và webhooks.

Giao thức ra mắt với sự hỗ trợ ngay lập tức cho một số framework agent phổ biến bao gồm LangGraph, Mastra, CrewAI, và AG2, với nhiều đối tác khác đang được phát triển. Chiến lược tích hợp ngay từ ngày đầu tiên này dường như đang được cộng đồng nhà phát triển đón nhận, với một người bình luận lưu ý rằng nó sẽ giải quyết rất nhiều vấn đề cho những người xây dựng agent.

Các Framework Tương thích với AG-UI

Framework Trạng thái
LangGraph Hỗ trợ
Mastra Hỗ trợ
CrewAI Hỗ trợ
AG2 Hỗ trợ
Agno Đang phát triển
OpenAI Agent SDK Mở cho đóng góp
Google ADK Mở cho đóng góp
Vercel AI SDK Mở cho đóng góp
AWS Bedrock Agents Mở cho đóng góp
Cloudflare Agents Mở cho đóng góp

Tính năng và trường hợp sử dụng

Giao thức hỗ trợ nhiều mẫu tương tác mà các ứng dụng AI hiện đại yêu cầu, bao gồm trò chuyện với agent có khả năng phát trực tiếp theo thời gian thực, đồng bộ hóa trạng thái hai chiều, giao diện người dùng tạo sinh với phát trực tiếp delta, và quy trình làm việc hợp tác có sự tham gia của con người.

Đối với các nhà phát triển, AG-UI cung cấp một cách tiêu chuẩn để triển khai các tính năng như hiển thị khi agent đang làm việc, đang suy nghĩ, đang gọi công cụ, gặp lỗi, hoặc yêu cầu đầu vào hoặc phê duyệt từ con người. Việc chuẩn hóa này có thể giảm đáng kể chi phí phát triển cho các đội ngũ xây dựng ứng dụng được hỗ trợ bởi AI.

Đội ngũ AG-UI cũng đã tạo ra các tài nguyên minh họa bao gồm ứng dụng hello-world và AG-UI Dojo - một bộ sưu tập các khối xây dựng được thiết kế để đơn giản và tập trung, thường chỉ từ 50-200 dòng mã mỗi khối.

Các tính năng chính của AG-UI

  • Trò chuyện tác nhân với luồng dữ liệu thời gian thực
  • Đồng bộ hóa trạng thái hai chiều (vào và ra khỏi cuộc trò chuyện)
  • Giao diện người dùng tạo sinh và tin nhắn có cấu trúc với luồng delta
  • Làm phong phú ngữ cảnh theo thời gian thực
  • Sử dụng công cụ phía giao diện người dùng (tool calls)
  • Hợp tác với con người trong vòng lặp và con người trên vòng lặp

Phản hồi từ cộng đồng và hướng phát triển trong tương lai

Phản ứng ban đầu đối với AG-UI có vẻ tích cực, với các thành viên cộng đồng bày tỏ sự phấn khích về việc thử nghiệm giao thức và tham gia vào quá trình phát triển của nó. Đội ngũ AG-UI đã lên lịch một cuộc họp nhóm làm việc để giúp mở rộng và định hướng cho giao thức, thể hiện cam kết phát triển dựa trên cộng đồng.

Khi AI agent ngày càng phổ biến trong các ứng dụng trên nhiều nền tảng khác nhau, những nỗ lực chuẩn hóa như AG-UI có thể chứng minh tầm quan trọng trong việc thiết lập các mẫu trải nghiệm người dùng nhất quán và đẩy nhanh chu kỳ phát triển. Sự tập trung của giao thức vào tương tác giữa con người và agent giải quyết một nhu cầu cụ thể có khả năng sẽ phát triển khi các khả năng AI tiếp tục tiến bộ và tích hợp sâu hơn vào các ứng dụng hàng ngày.

Tham khảo: AG-UI: The Agent-User Interaction Protocol