Mô hình AI WHAMM của Microsoft chạy Quake II trên trình duyệt với đồ họa sinh thành thời gian thực
Mô hình AI WHAMM của Microsoft chạy Quake II trên trình duyệt với đồ họa sinh thành thời gian thực
Microsoft đã có một bước tiến táo bạo trong lĩnh vực trò chơi điện tử được hỗ trợ bởi AI với mô hình thử nghiệm mới nhất của họ, mô hình này có thể thay đổi cách các trò chơi cổ điển được hiển thị trong tương lai. Gã khổng lồ công nghệ này đã giới thiệu một phương pháp mới cho thấy cả tiềm năng và những hạn chế hiện tại của AI sinh thành trong lĩnh vực giải trí tương tác.WHAMM: Mô hình AI trò chơi mới của MicrosoftMicrosoft gần đây đã công bố WHAMM (World and Human Action MaskGIT Model), một hệ thống AI sinh thành được thiết kế đặc biệt cho các ứng dụng trò chơi thời gian thực. Mô hình mới này đại diện cho một bước tiến đáng kể so với phiên bản tiền nhiệm WHAM-1.6B, được phát hành vào tháng Hai. Minh chứng ấn tượng nhất cho khả năng của WHAMM là một phiên bản có thể chơi được của trò chơi cổ điển Quake II ra mắt cách đây 28 năm, người dùng có thể trải nghiệm trực tiếp trên trình duyệt web thông qua Copilot Labs. Mặc dù công nghệ này vẫn đang trong giai đoạn thử nghiệm, nó cho thấy AI có thể cuối cùng sẽ chuyển đổi trải nghiệm chơi game bằng cách tạo ra nội dung hình ảnh theo thời gian thực dựa trên tương tác của người chơi.Giao diện AI WHAMM cho việc tạo game theo thời gian thực trong Quake IIĐổi mới kỹ thuật đằng sau WHAMMĐổi mới kỹ thuật chính trong WHAMM nằm ở việc nó không sử dụng các mô hình tự hồi quy truyền thống, vốn tạo ra các token một cách tuần tự. Thay vào đó, WHAMM sử dụng kiến trúc kiểu MaskGIT có thể tạo ra tất cả các token hình ảnh cho một khung hình song song. Sự thay đổi kiến trúc này giảm đáng kể số lượng forward pass cần thiết và giảm sự phụ thuộc giữa các phần tử, cho phép đầu ra hình ảnh nhanh hơn, tiệm cận với khả năng phản hồi thời gian thực. Độ phân giải cũng đã được cải thiện từ 300 x 180 pixel của mô hình trước đến 640 x 360 pixel chi tiết hơn, cung cấp hình ảnh rõ ràng hơn trong khi vẫn duy trì kiến trúc encoder-decoder cơ bản.Kiến trúc kỹ thuật của mô hình WHAM thể hiện thiết kế đổi mới của nóQuy trình đào tạo được đẩy nhanhCó lẽ điều đáng chú ý nhất là việc giảm đáng kể thời gian đào tạo cần thiết cho WHAMM. Trong khi mô hình WHAM-1.6B trước đây cần bảy năm dữ liệu gameplay để đào tạo, các nhà phát triển đã dạy WHAMM chỉ với hơn một tuần gameplay Quake II được tuyển chọn. Hiệu quả này đạt được nhờ tận dụng dữ liệu từ các chuyên gia kiểm thử trò chơi chuyên nghiệp, những người chỉ tập trung vào một cấp độ duy nhất của trò chơi. Đây là một bước tiến đáng kể trong hiệu quả đào tạo mô hình AI, có khả năng làm cho các hệ thống tương tự trở nên thực tế hơn để phát triển trong tương lai.Hạn chế hiện tại và trải nghiệm người dùngMặc dù có những tiến bộ này, WHAMM vẫn đang ở giai đoạn thử nghiệm. Bản demo chạy ở tốc độ khung hình cực kỳ thấp, chỉ đạt mức thấp đến trung bình của những năm teen, và bị độ trễ đầu vào đáng chú ý. Microsoft nhấn mạnh rằng bản demo nên được xem như một trình diễn công nghệ hơn là một sản phẩm trò chơi hoàn chỉnh. Người chơi có thể thực hiện các hành động cơ bản như bắn, nhảy, ngồi xuống và tương tác với kẻ thù, nhưng trải nghiệm bị cản trở bởi nhiều hạn chế. Tương tác với kẻ thù xuất hiện mờ, theo dõi sức khỏe và thống kê thiệt hại thường không chính xác, và mô hình có độ dài ngữ cảnh hạn chế—quên các đối tượng rời khỏi tầm nhìn của người chơi trong hơn chín phần mười giây. Ngoài ra, bản demo chỉ giới hạn trong một cấp độ duy nhất, vì việc cố gắng tiến xa hơn sẽ làm đóng băng quá trình tạo hình ảnh do thiếu dữ liệu đào tạo được ghi lại.Thông số kỹ thuật của WHAMM:Độ phân giải: 640 x 360 pixel (tăng từ 300 x 180 ở mô hình trước)Kiến trúc: Tạo token song song kiểu MaskGITDữ liệu huấn luyện: Một tuần gameplay được tuyển chọn từ Quake II (giảm từ bảy năm ở mô hình trước)Hạn chế hiện tại: Tốc độ khung hình thấp (FPS ở mức thấp đến trung bình, khoảng 10-19), độ trễ đầu vào cao, bộ nhớ ngữ cảnh hạn chế (0,9 giây), giới hạn trong một cấp độ duy nhấtAI trong các ngành công nghiệp sáng tạo: Tăng cường so với thay thếWHAMM xuất hiện giữa những cuộc thảo luận rộng rãi hơn về vai trò của AI trong các ngành công nghiệp sáng tạo. Những tranh cãi gần đây, chẳng hạn như các sáng tạo AI lấy cảm hứng từ Ghibli của OpenAI, đã làm nổi bật sự hoài nghi của công chúng về việc liệu AI có thể thực sự sao chép nghệ thuật của con người hay không. Microsoft định vị WHAMM không phải là sự thay thế cho sáng tạo của con người mà là một công cụ để tăng cường nó—một triết lý tương tự như công nghệ ACE của Nvidia, công nghệ này nâng cao các NPC sống động trong các trò chơi như inZOI. Việc triển khai lý tưởng sẽ thấy AI tăng cường chứ không phải thay thế các tác phẩm sáng tạo, thêm các yếu tố động trong khi vẫn giữ được nét đặc trưng của con người làm cho các trò chơi trở nên hấp dẫn.Ý nghĩa tương lai cho phương tiện truyền thông tương tácNhìn về phía trước, Microsoft hình dung WHAMM và các công nghệ tương tự sẽ cho phép các hình thức phương tiện truyền thông tương tác hoàn toàn mới. Mặc dù các trò chơi được tạo ra hoàn toàn bởi AI vẫn đang ở chân trời xa hơn là một thực tế ngay lập tức, những đổi mới như WHAMM cho thấy chúng có thể xuất hiện trong vài năm tới. Các phiên bản trong tương lai có khả năng sẽ giải quyết những thiếu sót hiện tại trong khi trao quyền cho các nhà phát triển trò chơi để tạo ra các câu chuyện hấp dẫn hơn được làm phong phú bởi các công cụ do AI điều khiển. Công nghệ này đại diện cho một cái nhìn thú vị về cách AI sinh thành có thể cuối cùng chuyển đổi không chỉ cách các trò chơi trông như thế nào, mà còn cách chúng hoạt động và phản ứng với hành động của người chơi.
AI
21 phút trước
Ubisoft Được Cho Là Đang Phát Triển Trò Chơi Chiến Thuật Lấy Cảm Hứng Từ XCOM Cho Rainbow Six Siege
Trò chơi console
1 giờ trước
Ubisoft Được Cho Là Đang Phát Triển Trò Chơi Chiến Thuật Lấy Cảm Hứng Từ XCOM Cho Rainbow Six Siege
Font Sparks Tạo Trực Quan Hóa Dữ Liệu Trong Văn Bản, Nhưng Gây Tranh Cãi Về Định Nghĩa
AI
5 giờ trước
Font Sparks Tạo Trực Quan Hóa Dữ Liệu Trong Văn Bản, Nhưng Gây Tranh Cãi Về Định Nghĩa
Plugin Pytest.nvim Tích Hợp Kiểm Thử Trực Tiếp Trong Neovim Với Hỗ Trợ Docker
5 giờ trước
Plugin Pytest.nvim Tích Hợp Kiểm Thử Trực Tiếp Trong Neovim Với Hỗ Trợ Docker
Hệ thống OCR gây lo ngại về rủi ro ảo tưởng của AI và việc sử dụng dữ liệu đạo đức
AI
5 giờ trước
Hệ thống OCR gây lo ngại về rủi ro ảo tưởng của AI và việc sử dụng dữ liệu đạo đức
uWrap: Giải pháp ngắt dòng văn bản nhẹ mà các nhà phát triển đã chờ đợi
Ứng dụng
11 giờ trước
uWrap: Giải pháp ngắt dòng văn bản nhẹ mà các nhà phát triển đã chờ đợi
SpacetimeDB Gây Tranh Luận Về Cấp Phép Cơ Sở Dữ Liệu và Ứng Dụng Phát Triển Game
23 giờ trước
SpacetimeDB Gây Tranh Luận Về Cấp Phép Cơ Sở Dữ Liệu và Ứng Dụng Phát Triển Game
Báo cáo cho biết Google Cloud đang hỗ trợ giám sát biên giới bằng AI bất chấp những phủ nhận trước đây
AI
Hôm qua
Báo cáo cho biết Google Cloud đang hỗ trợ giám sát biên giới bằng AI bất chấp những phủ nhận trước đây
Dell Phát Hành Bộ Cáp AlienFX Giá 35 Đô La Cho Phép Tương Thích Với Bo Mạch Chủ Bên Thứ Ba Cho Alienware Area-51
Bo mạch chủ
Hôm qua
Dell Phát Hành Bộ Cáp AlienFX Giá 35 Đô La Cho Phép Tương Thích Với Bo Mạch Chủ Bên Thứ Ba Cho Alienware Area-51
Giá Nvidia RTX 5060 Ti bị rò rỉ: 399 đô la Mỹ cho phiên bản 8GB và 499 đô la Mỹ cho phiên bản 16GB, dự kiến ra mắt ngày 16 tháng 4
GPU
Hôm qua
Giá Nvidia RTX 5060 Ti bị rò rỉ: 399 đô la Mỹ cho phiên bản 8GB và 499 đô la Mỹ cho phiên bản 16GB, dự kiến ra mắt ngày 16 tháng 4
Bản Cập Nhật Cold Fusion của Abiotic Factor Mang Đến Hệ Thống Nâng Cấp Mới và Sửa Lỗi Tấn Công Căn Cứ
Trò chơi trên Steam
Hôm qua
Bản Cập Nhật Cold Fusion của Abiotic Factor Mang Đến Hệ Thống Nâng Cấp Mới và Sửa Lỗi Tấn Công Căn Cứ
Thông số kỹ thuật và giá của Samsung Galaxy XCover 7 Pro bị rò rỉ: Điện thoại siêu bền với độ bền chuẩn quân đội sẽ ra mắt trong tháng này
Điện thoại
Hôm qua
Thông số kỹ thuật và giá của Samsung Galaxy XCover 7 Pro bị rò rỉ: Điện thoại siêu bền với độ bền chuẩn quân đội sẽ ra mắt trong tháng này
Ferron: Máy chủ Web An toàn về Bộ nhớ Mới bằng Rust Cho thấy Tiềm năng So với Các Đối thủ Đã Thành lập
Khởi nghiệp
Hôm qua
Ferron: Máy chủ Web An toàn về Bộ nhớ Mới bằng Rust Cho thấy Tiềm năng So với Các Đối thủ Đã Thành lập
Bản cập nhật mới nhất của Inzoi giải quyết những vấn đề quan trọng của người chơi: Thời gian ngủ, Thói quen ăn uống và Nhịp độ phát triển mối quan hệ
Ứng dụng
Hôm qua
Bản cập nhật mới nhất của Inzoi giải quyết những vấn đề quan trọng của người chơi: Thời gian ngủ, Thói quen ăn uống và Nhịp độ phát triển mối quan hệ
Dịch vụ Đăng ký AI Mới của Garmin Gây Thất Vọng với Thông Tin Chung Chung và Lỗi Tính Toán
AI
Hôm qua
Dịch vụ Đăng ký AI Mới của Garmin Gây Thất Vọng với Thông Tin Chung Chung và Lỗi Tính Toán
Android 16 giới thiệu tính năng biên dịch đám mây để tăng tốc cài đặt ứng dụng
Ứng dụng
Hôm qua
Android 16 giới thiệu tính năng biên dịch đám mây để tăng tốc cài đặt ứng dụng
Nhà Bán Lẻ Việt Nam Xây Dựng Máy Chủ AI Mạnh Mẽ Sử Dụng Nhiều GPU RTX 5090 Trong Bối Cảnh Thiếu Hụt Toàn Cầu
Phần cứng AI
Hôm qua
Nhà Bán Lẻ Việt Nam Xây Dựng Máy Chủ AI Mạnh Mẽ Sử Dụng Nhiều GPU RTX 5090 Trong Bối Cảnh Thiếu Hụt Toàn Cầu
Khi Shell Scripts Trở Nên Quá Phức Tạp: Cuộc Tranh Luận về Bash INI Parser
Hôm qua
Khi Shell Scripts Trở Nên Quá Phức Tạp: Cuộc Tranh Luận về Bash INI Parser
Microsoft Chặn Tiện Ích Mở Rộng C/C++ Trên Các Bản Fork VSCode, Bao Gồm Cursor
Microsoft
Hôm qua
Microsoft Chặn Tiện Ích Mở Rộng C/C++ Trên Các Bản Fork VSCode, Bao Gồm Cursor
Honor 400 Lite ra mắt với camera 108MP, chip Dimensity 7025-Ultra và Android 15
Điện thoại
Hôm qua
Honor 400 Lite ra mắt với camera 108MP, chip Dimensity 7025-Ultra và Android 15