LLMs và AI Truyền thống: Cuộc chiến làm chủ Pokemon ngày càng nóng

BigGo Editorial Team
LLMs và AI Truyền thống: Cuộc chiến làm chủ Pokemon ngày càng nóng

Trong bối cảnh trí tuệ nhân tạo đang không ngừng phát triển, một thí nghiệm thú vị đã xuất hiện: sử dụng các mô hình ngôn ngữ lớn để chơi Pokemon FireRed một cách tự động. Dự án này, có tên gọi là Fire Red Agent, đã làm dấy lên những cuộc thảo luận về các phương pháp hiệu quả nhất cho AI chơi game và những ý nghĩa rộng lớn hơn đối với ngành giải trí.

Dự án Fire Red Agent

Dự án Fire Red Agent đại diện cho một nỗ lực đầy tham vọng nhằm sử dụng mô hình ngôn ngữ lớn để chơi Pokemon FireRed một cách tự động. Nhà phát triển đã tích hợp một LLM với trình giả lập game, triển khai các hệ thống để đọc bộ nhớ, điều hướng, tìm đường đi và xử lý các trận đấu. Mặc dù gặp phải những khó khăn kỹ thuật, đặc biệt là về kiểm soát đầu vào theo chương trình với trình giả lập RetroArch, dự án đã chứng minh tiềm năng của LLM trong việc hiểu và điều hướng trong môi trường game phức tạp mà không cần được đào tạo cụ thể cho mục đích đó.

Điều làm cho dự án này đặc biệt thú vị là tầm nhìn của nhà phát triển về nó như tương lai của TV - định vị gameplay AI như nội dung giải trí thay vì chỉ là một minh họa kỹ thuật. Quan điểm này gợi ý một hình thức truyền thông tương tác mới, nơi các tác nhân AI trở thành những người biểu diễn mà khán giả có thể xem và có khả năng tác động.

Các thành phần chính của Fire Red Agent

  • Tích hợp giả lập
  • Quản lý bộ nhớ trò chơi
  • Điều hướng & Tìm đường
  • Phân tích văn bản trò chơi
  • Tích hợp LLM (sử dụng GPT-4o)
  • Xử lý trận đấu
  • Xử lý tương tác & Hội thoại

So sánh các dự án Pokemon AI

Dự án Công nghệ Tiến độ
Fire Red Agent LLM (GPT-4o) Phát triển tạm dừng do vấn đề kiểm soát đầu vào
Claude Plays Pokemon Claude 3.7 LLM Đã đánh bại Lt. Surge, giải quyết câu đố nhà thi đấu
AI Plays Pokemon CNNs và Học tăng cường Đã đến Mt. Moon sau nhiều tháng cải tiến

LLMs và các phương pháp AI truyền thống

Cuộc thảo luận trong cộng đồng cho thấy một cuộc tranh luận đáng kể về việc liệu LLM có phải là công cụ tối ưu cho nhiệm vụ này hay không. Một số người bình luận chỉ ra rằng các phương pháp AI truyền thống sử dụng các công cụ tìm đường, cây hành vi và lập kế hoạch hành động định hướng mục tiêu (GOAP) có thể chơi Pokemon hiệu quả và tốt hơn so với LLM.

Tôi muốn lưu ý rằng nếu bạn thực sự muốn một AI chơi Pokémon, bạn có thể làm điều đó với một AI đơn giản hơn và rẻ hơn nhiều so với LLM và nó sẽ chơi game tốt hơn nhiều, làm cho việc này chủ yếu là một bài tập về việc làm phức tạp hóa một điều tầm thường.

Tuy nhiên, những người ủng hộ phương pháp LLM nhấn mạnh rằng giá trị không nằm ở tối ưu hóa mà ở tính tổng quát hóa. Việc Claude 3.7 có thể chơi Pokemon hiệu quả mà không được thiết kế đặc biệt cho nó chứng minh chữ G trong AGI (Trí tuệ nhân tạo tổng quát). Không giống như các hệ thống chuyên biệt vượt trội ở một nhiệm vụ nhưng thất bại ở những nhiệm vụ khác, LLM cho thấy khả năng thích ứng với nhiều thách thức đa dạng - một đặc điểm chính của trí thông minh tổng quát.

Claude chơi Pokemon và triển khai kỹ thuật

Cuộc thảo luận cũng đề cập đến một dự án khác, Claude Plays Pokemon, dường như đang đạt được tiến bộ đáng kể trong trò chơi. Sự suy đoán của cộng đồng tập trung vào cách triển khai này xử lý dữ liệu trò chơi - liệu bằng cách phân tích bộ nhớ trực tiếp hay bằng cách cung cấp dữ liệu RAM thô cho LLM. Dự án Claude được báo cáo là đã tiến xa hơn Mt. Moon và đánh bại Lt. Surge, chứng minh khả năng ấn tượng của phương pháp dựa trên LLM.

Thành tựu này đặc biệt đáng chú ý khi so sánh với các dự án AI Pokemon trước đây sử dụng mạng nơ-ron tích chập và học tăng cường, được báo cáo là đã mất nhiều tháng lặp lại và tài nguyên tính toán đáng kể để đến được Mt. Moon.

Đề xuất giá trị giải trí

Có lẽ khía cạnh thú vị nhất của những dự án này là tiềm năng giải trí của chúng. Nhà phát triển Fire Red Agent hình dung các hệ thống nơi AI chơi game tự động trong khi kết hợp các đề xuất từ người xem, tạo ra một trải nghiệm giải trí tương tác. Một số người bình luận mở rộng tầm nhìn này để bao gồm cả robot AI chiến đấu theo kiểu đấu sĩ hoặc gameplay cạnh tranh giữa các đội AI được quản lý bởi huấn luyện viên là con người.

Quan điểm này định hình lại việc AI chơi game từ một thách thức thuần túy kỹ thuật thành một hình thức sản xuất giải trí, có khả năng tạo ra các thể loại phương tiện mới nơi các tác nhân nhân tạo trở thành người biểu diễn và con người trở thành đạo diễn hoặc người ảnh hưởng đến hành vi của họ.

Khi LLM tiếp tục phát triển về khả năng, chúng ta có thể thấy nhiều thí nghiệm hơn làm mờ ranh giới giữa nghiên cứu AI, trò chơi và giải trí. Liệu việc xem bot chơi Pokemon có trở thành tương lai của TV hay không vẫn còn phải chờ xem, nhưng những dự án này chắc chắn chỉ ra những khả năng thú vị về cách chúng ta có thể tương tác và được giải trí bởi trí tuệ nhân tạo trong những năm tới.

Tham khảo: Fire Red Agent