Các Mô Hình AI Cạnh Tranh Trong Việc Tạo Ra Trò Chơi Chăn Cừu: Claude 3.7 Dẫn Đầu

BigGo Editorial Team
Các Mô Hình AI Cạnh Tranh Trong Việc Tạo Ra Trò Chơi Chăn Cừu: Claude 3.7 Dẫn Đầu

Nhiệm vụ tạo ra hành vi đàn trong trò chơi một cách chân thực đã thách thức các nhà phát triển trong thời gian dài, nhưng giờ đây các mô hình ngôn ngữ AI đang thể hiện khả năng ấn tượng trong phát triển trò chơi. Một thí nghiệm gần đây đã thách thức nhiều mô hình AI khác nhau tạo ra một trò chơi chăn cừu có tên Shepherd's Dog chỉ trong một lần thử, và Claude 3.7 đã nổi lên như người chiến thắng rõ ràng.

Ý tưởng đằng sau Shepherd's Dog rất đơn giản nhưng hấp dẫn: người chơi điều khiển một con chó để lùa cừu vào chuồng trước khi trời tối. Điều làm cho trò chơi thú vị là hành vi đàn thực tế của những con cừu, phải thể hiện động lực nhóm chân thực trong khi phản ứng với sự hiện diện của chó và di chuyển xung quanh các chướng ngại vật.

Các Mô Hình AI Thể Hiện Mức Độ Thành Công Khác Nhau

Claude 3.7 thống trị cuộc thi với điểm số 24/28, tạo ra những gì nhiều người dùng mô tả là một trò chơi thực sự vui với chuyển động của cừu tự nhiên. Phiên bản của Claude thậm chí còn hoạt hình hóa quá trình chuyển sang đêm mà không cần được yêu cầu cụ thể. Một người chơi nhận xét rằng trò chơi gợi nhớ đến những ngày đầu của các trò chơi di động trên iPhone về sự đơn giản và hấp dẫn.

Các mô hình khác cho thấy kết quả hỗn hợp. O3-mini của Anthropic đạt điểm 16/28, triển khai thuật toán boids cổ điển cho hành vi đàn. Mặc dù ấn tượng về mặt kỹ thuật, một số người dùng lưu ý rằng cách tiếp cận này không cảm thấy hoàn toàn tự nhiên đối với cừu vì thuật toán boids duy trì chuyển động liên tục, trong khi cừu thật có thể đứng yên.

Ở cuối bảng xếp hạng, các mô hình như Deepseek không tạo ra JavaScript hợp lệ, trong khi GPT-4o và Gemini Pro chỉ đạt 4/28 điểm, với các tính năng hạn chế và vấn đề về chức năng.

Bảng xếp hạng mô hình AI cho trò chơi Chó chăn cừu

Mô hình Điểm số Ghi chú
Claude 3.7 24/28 Bản demo thực sự ấn tượng, thiếu một số động lực chướng ngại vật
o3-mini 16/28 Thiếu một số tính năng, nhưng có khả năng tụ họp đàn và lối chơi tốt
o1 Pro 12/28 Tương tự như o3-mini
Mistral 12/28 Chức năng chăn cừu không được triển khai đúng cách
GPT-4o 4/28 Tính năng hạn chế, mô hình không tiếp tục
Gemini Pro 4/28 Khó khăn vì cừu không ở trong chuồng
Deepseek 0/28 JavaScript không hợp lệ
Cursor 0/28 Ấn tượng nhưng có thể không đủ điều kiện là "one-shot"

Thuật Toán Đàn: Trọng Tâm Của Thử Thách

Thách thức cốt lõi trong việc tạo ra trò chơi này nằm ở việc triển khai hành vi đàn thực tế. Nhiều mô hình AI mặc định sử dụng thuật toán boids, một phương pháp nổi tiếng để mô phỏng hành vi đàn được phát triển vào những năm 1980. Tuy nhiên, như một người bình luận đã chỉ ra, boids có thể không lý tưởng cho mô phỏng cừu:

Có vẻ như o3-mini triển khai thuật toán 'boids' cho hành vi đàn (có lẽ do sự phổ biến của nó trên mạng), nhưng tôi thấy rằng ở đây nó không thực sự phù hợp. Thực tế, trong boids mỗi phần tử có một vận tốc không đổi (hoặc tối thiểu), khiến cho cừu không bao giờ dừng 'chạy'. Tôi thấy hành vi đàn của Claude trông tự nhiên hơn, đối với cừu.

Nhận xét này nhấn mạnh cách triển khai của Claude 3.7 đã tạo ra hành vi động vật có vú chân thực hơn bằng cách cho phép cừu có tốc độ tối thiểu bằng không—một sự khác biệt tinh tế nhưng quan trọng đã làm cho mô phỏng của nó cảm thấy chân thực hơn.

Sự Tham Gia Của Cộng Đồng và Cải Tiến

Phản hồi của cộng đồng đối với các trò chơi do AI tạo ra đã rất nhiệt tình, với một số người dùng chia sẻ phiên bản của riêng họ hoặc đề xuất cải tiến. Một người dùng đã tạo ra một phiên bản nâng cao sử dụng nhiều mô hình AI kết hợp, cho thấy cách hướng dẫn của con người có thể giúp tinh chỉnh mã do AI tạo ra.

Một số người dùng lưu ý các vấn đề về khả năng chơi sẽ được hưởng lợi từ sự tinh chỉnh của con người, chẳng hạn như bản đồ quá lớn trên máy tính để bàn hoặc cừu bị kẹt ở các góc. Những quan sát này nhấn mạnh rằng mặc dù AI có thể tạo ra các trò chơi hoạt động trong một lần thử, nhưng việc kiểm tra và lặp lại của con người vẫn là điều cần thiết để hoàn thiện trải nghiệm.

Điều thú vị là một số người bình luận đề cập rằng họ đã từng cố gắng tạo ra các trò chơi tương tự, cho thấy khái niệm chăn cừu có sức hấp dẫn rộng rãi trong số các nhà phát triển trò chơi. Thách thức để có được hành vi đàn đúng đắn dường như là một rào cản phổ biến mà nhiều người đã gặp phải.

Thí nghiệm này cho thấy sự tiến bộ nhanh chóng của khả năng lập trình AI đồng thời cũng tiết lộ những hạn chế hiện tại của chúng. Là những sáng tạo một lần mà không có phản hồi hoặc lặp lại, những trò chơi này đại diện cho những thành tựu kỹ thuật ấn tượng, nhưng chúng vẫn được hưởng lợi từ sự tinh chỉnh của con người để đạt đến tiềm năng đầy đủ.

Đối với những người quan tâm đến việc thử nghiệm các trò chơi do AI tạo ra này, chúng có sẵn thông qua bản xem trước HTML GitHub, mặc dù một số người dùng báo cáo cảnh báo bảo mật từ một số trình duyệt nhất định—một rào cản không mong đợi cho những gì về cơ bản là các trò chơi HTML/JavaScript đơn giản được lưu trữ trên GitHub Pages.

Tham khảo: Shepherd's Dog Game Concept and AI Leaderboard