Trong một minh họa thông minh về khả năng nhận dạng hình ảnh của AI, một nhà phát triển gần đây đã tạo ra một bài kiểm tra tự động thành công phát hiện khói trắng từ ống khói Nhà nguyện Sistine, báo hiệu việc bầu chọn giáo hoàng mới. Bài kiểm tra, được đặt tên phù hợp là smoke test (kiểm tra khói), cho thấy cách AI có thể được sử dụng để giám sát sự kiện theo thời gian thực thông qua đánh giá trực quan thay vì các phương pháp phân tích hình ảnh truyền thống.
AI Kiểm Tra Trực Quan Thay Thế Phân Tích Hình Ảnh Truyền Thống
Nhà phát triển đã tạo một kịch bản kiểm tra sử dụng framework kiểm tra AI kết nối với luồng YouTube trực tiếp về ống khói Nhà nguyện Sistine của Vatican. Thay vì triển khai các thuật toán xử lý hình ảnh phức tạp để phát hiện màu khói, hệ thống tận dụng khả năng nhận dạng trực quan của AI thông qua các lệnh đơn giản. Bài kiểm tra được thiết kế để chỉ thông qua khi khói trắng xuất hiện, báo hiệu cuộc bầu cử giáo hoàng thành công, và thất bại nếu khói đen hoặc không có khói. Theo bình luận từ nhà phát triển, bài kiểm tra đã thông qua ngay khi khói bắt đầu xuất hiện, xác nhận cuộc bầu cử theo thời gian thực.
Cách tiếp cận này cho thấy cách kỹ thuật lập lệnh có thể cung cấp một giải pháp đơn giản hơn so với các kỹ thuật thị giác máy tính truyền thống. Bằng cách hướng dẫn AI đánh giá trực quan các điều kiện cụ thể thông qua các khẳng định ngôn ngữ tự nhiên, các nhà phát triển có thể tránh được sự phức tạp của việc xây dựng các giải pháp phân tích hình ảnh tùy chỉnh.
Chi tiết triển khai kiểm thử:
- Framework: Framework kiểm thử AI tùy chỉnh
- Thời gian chờ: 60.000 mili giây (1 phút)
- Mô hình AI sử dụng: Nhiều mô hình được kiểm thử bao gồm Gemini, GPT-4o
- Chi phí: 0,29 USD cho 2 ngày giám sát
- Phương pháp: Kiểm tra trực quan qua AI thay vì phân tích hình ảnh truyền thống
- Repository: Có sẵn trên GitHub (donobu-papal-election-tests)
Ứng Dụng AI Đa Phương Thức Tiết Kiệm Chi Phí
Một khía cạnh đặc biệt thú vị của việc triển khai này là tính hiệu quả về chi phí. Khi được hỏi về chi phí API cho việc chạy bài kiểm tra với Google's Flash 2.0, nhà phát triển cho biết chỉ tiêu tốn 0,29 đô la Mỹ trong hai ngày giám sát. Khoản chi tiêu tối thiểu này cho thấy khả năng AI tiên tiến đã trở nên dễ tiếp cận như thế nào, ngay cả đối với các trường hợp sử dụng chuyên biệt như giám sát sự kiện.
Một số người bình luận đã thảo luận về tiềm năng tương lai của các ứng dụng như vậy, gợi ý rằng các mô hình AI đa phương thức tại chỗ sẽ làm cho những triển khai này tốt hơn đáng kể. Nhà phát triển xác nhận họ đang chuẩn bị cho tương lai này với cách tiếp cận ưu tiên cục bộ bao gồm một ứng dụng máy tính để bàn, cho thấy độ trễ và yêu cầu xử lý vẫn là những cân nhắc cho các nhiệm vụ đánh giá trực quan theo thời gian thực.
Thay vì AI xem xét mã và trình duyệt của bạn và viết các kịch bản Playwright, AI trực tiếp điều khiển trình duyệt và khẳng định qua các bài kiểm tra.
Bài kiểm tra vừa là một ứng dụng thực tế vừa là một cách chơi chữ thông minh. Trong phát triển phần mềm, smoke test thường đề cập đến việc kiểm tra sơ bộ để xác minh chức năng cơ bản. Ở đây, thuật ngữ này mang ý nghĩa đen khi bài kiểm tra thực sự giám sát khói, tạo ra một trò đùa kỹ thuật thú vị đã gây được tiếng vang trong cộng đồng nhà phát triển.
Mặc dù một số người bình luận đề xuất các giải pháp đơn giản hơn—như theo dõi thông báo tin tức trên điện thoại—cách tiếp cận dựa trên AI cho thấy cách nhận dạng hình ảnh có thể được áp dụng cho các sự kiện trong thế giới thực với nỗ lực phát triển tối thiểu, tiềm năng mở ra cánh cửa cho các ứng dụng tương tự trong các lĩnh vực khác yêu cầu giám sát hình ảnh và phát hiện sự kiện.
Tham khảo: papal_election_smoke.test.ts