AMD đã hé lộ kiến trúc đồ họa thế hệ tiếp theo của mình, giới thiệu nền tảng kỹ thuật sẽ cung cấp sức mạnh cho dòng Radeon RX 9000 sắp ra mắt. Kiến trúc RDNA 4 đại diện cho một bước tiến hóa đáng kể trong triết lý thiết kế GPU của AMD, với sự tập trung mới vào hiệu suất gaming cùng với những cải tiến đáng kể cho khả năng dò tia (ray tracing) và xử lý AI.
Kiến Trúc Ưu Tiên Game Thủ
RDNA 4 của AMD được thiết kế từ đầu với game thủ là đối tượng chính. Không giống như các thế hệ trước cố gắng cân bằng giữa gaming và khối lượng công việc chuyên nghiệp, RDNA 4 tập trung cụ thể vào hiệu suất gaming cao cấp. Kiến trúc này giới thiệu các đơn vị tính toán được tối ưu hóa mạnh mẽ, mang lại hiệu suất rasterization cao hơn gấp 2 lần so với RDNA 2, với những cải tiến thậm chí còn đáng kể hơn trong các khối lượng công việc chuyên biệt như ray tracing (2,5 lần) và học máy (3,5 lần) trên mỗi đơn vị tính toán.
Những Cải Tiến Chính của RDNA 4
- Rasterization: Tăng hiệu suất lên gấp 2 lần so với RDNA 2 trên mỗi đơn vị tính toán
- Ray Tracing: Tăng hiệu suất lên gấp 2,5 lần so với RDNA 2 trên mỗi đơn vị tính toán
- Hiệu suất ML: Tăng hiệu suất lên gấp 3,5 lần trong các tác vụ ma trận dày FP16 so với RDNA 2 trên mỗi đơn vị tính toán
- Ray Traversal: Hiệu suất gấp 2 lần so với RDNA 3 ở cùng tốc độ xung nhịp
- Yêu cầu bộ nhớ BVH: Giảm xuống còn dưới 60% so với RDNA 3
Thiết Kế Động Cơ Tính Toán Mới
Trung tâm của RDNA 4 là một Động Cơ Tính Toán được thiết kế lại với các Đơn Vị Vector SIMD32 Kép và Hoạt Động Ma Trận Nâng Cao. Những đơn vị này hỗ trợ nhiều định dạng độ chính xác bao gồm tốc độ ma trận dày 2x-16b và 4x-8b/4b, cùng với Cấu Trúc Thưa 4:2 cho tốc độ xử lý gấp đôi. Một đổi mới đáng chú ý là hệ thống phân bổ thanh ghi động, cho phép các shader yêu cầu thanh ghi từ một nhóm chia sẻ khi cần và giải phóng chúng khi công việc hoàn thành. Phương pháp này cải thiện đáng kể việc xử lý độ trễ bộ nhớ và tăng hiệu quả tổng thể của lõi chia sẻ.
Dò Tia Thế Hệ Thứ Ba
Có lẽ cải tiến ấn tượng nhất đến từ bộ phận ray tracing, nơi AMD đã triển khai các đơn vị dò tia thế hệ thứ ba, tăng gấp đôi tốc độ giao cắt tia so với RDNA 3 ở cùng tốc độ xung nhịp và băng thông. Các bộ tăng tốc ray mới có tính năng nén BVH (Bounding Volume Hierarchy) cải tiến giúp giảm yêu cầu bộ nhớ xuống còn chưa đến 60% so với nhu cầu của RDNA 3, nhờ vào thiết kế 8-wide mới. Các cải tiến bổ sung bao gồm biến đổi thể hiện phần cứng, quản lý ngăn xếp RT được cải thiện và Hộp Giới Hạn Định Hướng có thể giảm chi phí duyệt xuống tới 10%.
Khả Năng Dò Đường Dẫn (Path Tracing)
AMD cũng đang định vị RDNA 4 cho tương lai của kỹ thuật render với hỗ trợ path tracing. Trong khi ray tracing phóng ra các tia chính đơn lẻ cho phản chiếu, bóng đổ và khúc xạ, path tracing tính đến tất cả các đường dẫn ánh sáng có thể, tạo ra các cảnh thực tế hơn với chi phí tính toán cao hơn. Để làm cho điều này khả thi, AMD đang triển khai các kỹ thuật Siêu lấy mẫu và Khử nhiễu bằng Neural Network được tối ưu hóa đặc biệt cho khối lượng công việc path tracing, tương tự như cách tiếp cận của NVIDIA với các trò chơi như Cyberpunk 2077 và Alan Wake II.
FSR 4: Giải Pháp Nâng Cấp Hình Ảnh Được Hỗ Trợ Bởi AI Của AMD
Cùng với thông báo về phần cứng, AMD đã tiết lộ FSR 4, công nghệ nâng cấp hình ảnh thế hệ tiếp theo. Không giống như các phiên bản FSR trước đây sử dụng thuật toán không gian hoặc thời gian, FSR 4 tận dụng học máy thông qua khả năng xử lý FP8 mới trong RDNA 4. Các bản demo sớm tại CES cho thấy những cải tiến đáng kể so với FSR 3.1, đặc biệt là ở chế độ hiệu suất, nơi các phiên bản trước gặp khó khăn với chất lượng hình ảnh ở độ phân giải render thấp.
![]() |
---|
So sánh các phương pháp upscaling làm nổi bật những cải tiến được giới thiệu với công nghệ FSR 4 của AMD |
Triển Khai và Hiệu Suất FSR 4
Khi ra mắt, FSR 4 sẽ được tích hợp ở cấp độ driver, tự động nâng cấp bất kỳ trò chơi nào hỗ trợ FSR 3.1 để sử dụng thuật toán nâng cấp dựa trên AI mới. AMD tuyên bố FSR 4 ở chế độ hiệu suất mang lại mức tăng hiệu suất 65% so với render 4K gốc trên bảy trò chơi được kiểm tra, với một số tựa game như Ratchet & Clank: Rift Apart thấy hiệu suất tăng gấp đôi. Công nghệ này sẽ có sẵn trong hơn 30 trò chơi khi ra mắt, bao gồm các tựa game lớn như Kingdom Come: Deliverance 2, Spider-Man 2 và Call of Duty: Black Ops 6.
Các tuyên bố về hiệu suất của FSR 4
- Tổng thể: Tăng hiệu suất 65% so với render 4K gốc (trung bình trên 7 trò chơi)
- Ratchet & Clank: Rift Apart: Tăng hiệu suất 100% (tăng gấp 2 lần)
- Horizon Zero Dawn Remastered: Tăng hiệu suất 38%
- Hỗ trợ ra mắt: Hơn 30 trò chơi bao gồm Kingdom Come: Deliverance 2, Spider-Man 2, và Call of Duty: Black Ops 6
Thông Số Kỹ Thuật Phần Cứng
GPU RDNA 4 hàng đầu, có tên mã là Navi 48, có 53,9 tỷ bóng bán dẫn trên một die có kích thước 356,5mm² được sản xuất bằng quy trình 4nm của TSMC. Con chip chứa bốn động cơ shader, mỗi động cơ chứa tám Đơn Vị Tính Toán Kép (DCU) với tổng cộng 64 Đơn Vị Tính Toán và 4.096 bộ xử lý luồng. Kiến trúc này bao gồm 64 động cơ Ray Accelerator và 128 động cơ Matrix Acceleration được phân bổ trên các động cơ shader. Hỗ trợ bộ nhớ bao gồm lên đến 16GB bộ nhớ GDDR6 với tốc độ lên đến 20 Gbps trên giao diện bus 256-bit, bổ sung thêm lên đến 64MB Infinity Cache thế hệ thứ ba.
Thông số kỹ thuật Navi 48 (RX 9070 XT)
- Quy trình sản xuất: TSMC 4nm
- Số lượng transistor: 53,9 tỷ
- Kích thước die: 356,5mm²
- Đơn vị tính toán: 64 CU (4.096 bộ xử lý luồng)
- Bộ tăng tốc ray tracing: 64 RA
- Động cơ tăng tốc ma trận: 128 MA
- Bộ nhớ: Lên đến 16GB GDDR6 ở tốc độ 20 Gbps
- Bus bộ nhớ: 256-bit
- Infinity Cache: Lên đến 64MB (Thế hệ thứ 3)
Cải Tiến Media và Hiển Thị
RDNA 4 cũng mang lại những cải tiến cho khả năng mã hóa và giải mã media, với chất lượng mã hóa AVC/H.264 tăng lên đến 25%, chất lượng mã hóa HEVC tốt hơn 11% và thông lượng AV1 gấp đôi. Động cơ Radiance Display Engine được cập nhật hỗ trợ đầu ra DisplayPort 2.1a và HDMI 2.1b, trong khi các chế độ Tối ưu hóa Năng lượng FreeSync nâng cao cung cấp mức tiêu thụ điện năng thấp hơn khi không hoạt động trong cấu hình nhiều màn hình. AMD cũng đã giới thiệu Radeon Image Sharpening 2, hoạt động trên tất cả các API thông qua một công tắc duy nhất để mang lại hình ảnh chất lượng cao hơn.
Con Đường Phía Trước
Mặc dù AMD đã có những bước tiến đáng kể với RDNA 4 và FSR 4, những thách thức vẫn còn trong việc cạnh tranh với hệ sinh thái đã được thiết lập của NVIDIA. Những cải tiến về chất lượng của FSR 4 rất đáng hứa hẹn, nhưng công nghệ này bắt đầu với một khoảng cách đáng kể cần thu hẹp so với DLSS 4 của NVIDIA, vốn đã hỗ trợ hơn 70 trò chơi. Để FSR 4 thành công trong dài hạn, AMD sẽ cần duy trì cam kết mạnh mẽ trong việc mở rộng hỗ trợ trò chơi và tiếp tục cải thiện chất lượng thuật toán. Tuy nhiên, RDNA 4 đại diện cho kiến trúc gaming tập trung nhất của AMD cho đến nay, với những cải tiến đáng kể trên toàn bộ rasterization, ray tracing và xử lý AI, điều này sẽ làm cho dòng Radeon RX 9000 có khả năng cạnh tranh trong thị trường gaming cao cấp.