Tự động hóa trình duyệt đang phát triển vượt ra ngoài các phương pháp lập trình truyền thống, và một dự án mới có tên Workflow Use đang thu hút sự chú ý nhờ cách tiếp cận đổi mới trong việc tạo ra các quy trình làm việc xác định và tự phục hồi. Dự án này, được mô tả là RPA 2.0, nhằm đơn giản hóa quá trình tự động hóa các tác vụ lặp đi lặp lại trên trình duyệt bằng cách cho phép người dùng ghi lại các hành động một lần và phát lại chúng một cách đáng tin cậy.
Workflow Use đại diện cho một bước tiến đáng kể trong công nghệ tự động hóa trình duyệt, giải quyết những vấn đề phổ biến mà các nhà phát triển và kiểm thử viên thường gặp phải khi làm việc với các công cụ như Playwright và Selenium. Mặc dù vẫn đang trong giai đoạn phát triển ban đầu và chưa được khuyến nghị sử dụng trong môi trường sản xuất, dự án đã thu hút được sự quan tâm đáng kể từ cộng đồng tự động hóa.
Tính năng chính của Workflow Use
- Ghi lại một lần, tái sử dụng mãi mãi: Ghi lại các tương tác trên trình duyệt một lần và phát lại vô thời hạn
- Hiển thị, không cần nhắc nhở: Loại bỏ việc nhắc nhở lặp đi lặp lại cho các tác vụ tự động hóa
- Quy trình làm việc có cấu trúc & có thể thực thi: Chuyển đổi các bản ghi thành các kịch bản xác định với khả năng trích xuất biến số tự động
- Hiểu biết tương tác giống con người: Lọc nhiễu từ các bản ghi để tạo ra quy trình làm việc có ý nghĩa
- Khả năng tự phục hồi: Chuyển sang Browser Use nếu một bước thất bại
- Nền tảng sẵn sàng cho doanh nghiệp: Được xây dựng cho khả năng mở rộng trong tương lai
Tự động hóa tự phục hồi
Một trong những tính năng được thảo luận nhiều nhất của Workflow Use là khả năng tự phục hồi. Khi một bước trong quy trình làm việc thất bại, hệ thống có thể tự động chuyển sang Browser Use (một công cụ tự động hóa trình duyệt được hỗ trợ bởi AI) để cố gắng khôi phục. Cách tiếp cận này giải quyết một vấn đề phổ biến với các framework tự động hóa truyền thống khi các script thường bị hỏng khi trang web thay đổi.
Very cool to see the fallback to the agentic run when the automation breaks. For our e2e testing browser automation, we independently arrived at the same pattern and have been impressed with how well it works.
Cơ chế tự phục hồi này dường như đang được đón nhận bởi các nhà phát triển đã từng trải nghiệm sự mong manh của các script tự động hóa trình duyệt thông thường. Khả năng tự động cập nhật quy trình làm việc khi chúng bị hỏng có thể giảm đáng kể công sức bảo trì cho các đội ngũ dựa vào tự động hóa trình duyệt.
Thách thức về thời gian và độ tin cậy
Các cuộc thảo luận trong cộng đồng cho thấy vấn đề về thời gian vẫn là một mối quan tâm quan trọng trong tự động hóa trình duyệt. Khi thực hiện một chuỗi các hành động trên trình duyệt, việc đảm bảo mỗi bước chờ đợi thích hợp cho các phần tử trang web tải xong là điều cần thiết để đảm bảo độ tin cậy.
Workflow Use giải quyết vấn đề này thông qua một hàm phân tích hoạt động mạng để xác định khi nào một trang đã tải xong, thay vì dựa vào các độ trễ thời gian cố định. Cách tiếp cận này giúp lọc ra các yêu cầu mạng không thiết yếu như ping phân tích dữ liệu, vốn có thể gây nhầm lẫn cho các cơ chế tính thời gian.
Ứng dụng doanh nghiệp và các trường hợp sử dụng
Nhiều bình luận nhấn mạnh các ứng dụng tiềm năng của Workflow Use trong doanh nghiệp. Khả năng tạo ra các quy trình làm việc xác định có thể được thực hiện lặp đi lặp lại với các biến khác nhau làm cho nó đặc biệt có giá trị cho việc tự động hóa biểu mẫu, nhập dữ liệu và các kịch bản kiểm thử.
Một thành viên cộng đồng đã hỏi cụ thể về việc sử dụng công cụ này để lấy dữ liệu từ cơ sở dữ liệu và sử dụng nó để tự động điền vào các biểu mẫu - một yêu cầu phổ biến của doanh nghiệp, điều này làm nổi bật các ứng dụng thực tế của công nghệ này.
Khả năng mở rộng và tích hợp
Có sự quan tâm đáng kể đến việc mở rộng khả năng của Workflow Use. Các thành viên cộng đồng đã bày tỏ mong muốn hỗ trợ tiện ích mở rộng Chrome và khả năng chạy tự động hóa trực tiếp trong các phiên trình duyệt hiện có của họ. Điều này sẽ đặc biệt có giá trị cho các trang web sử dụng các biện pháp chống tự động hóa, khiến việc tự động hóa trình duyệt headless truyền thống trở nên khó khăn.
Lộ trình của dự án gợi ý về việc tích hợp trong tương lai với các bước LLM (Large Language Model) và khả năng hiển thị các quy trình làm việc như các công cụ cho các hệ thống khác, cho thấy tầm nhìn về Workflow Use như một phần của hệ sinh thái tự động hóa rộng lớn hơn.
Tóm lại, mặc dù Workflow Use vẫn đang trong giai đoạn đầu phát triển, nó đại diện cho một hướng đi đầy hứa hẹn cho công nghệ tự động hóa trình duyệt. Bằng cách kết hợp các quy trình làm việc xác định với cơ chế dự phòng được hỗ trợ bởi AI, nó giải quyết các vấn đề chính trong các phương pháp tự động hóa hiện tại. Khi sự phát triển tiếp tục, dự án có thể tác động đáng kể đến cách các đội ngũ tiếp cận tự động hóa web, đặc biệt là đối với các tác vụ lặp đi lặp lại đòi hỏi độ tin cậy và khả năng thích ứng với các giao diện web đang thay đổi.
Tham khảo: browser-use/workflow-use