Google ra mắt Ironwood TPU: Bước tiến mạnh mẽ trong điện toán suy luận AI

BigGo Editorial Team
Google ra mắt Ironwood TPU: Bước tiến mạnh mẽ trong điện toán suy luận AI

Đổi mới chip mới nhất của Google đánh dấu một bước chuyển đáng kể trong cách tiếp cận của công ty đối với điện toán trí tuệ nhân tạo, tập trung vào nhu cầu ngày càng tăng của suy luận AI thay vì chỉ đào tạo. Gã khổng lồ công nghệ đã nhận ra rằng khi các mô hình AI phát triển hướng tới khả năng suy luận, chi phí tính toán ngày càng chuyển từ phát triển sang triển khai.

Sự chuyển dịch sang điện toán suy luận

Tại sự kiện Google Cloud Next 25, Google đã giới thiệu Ironwood, Tensor Processing Unit (TPU) thế hệ thứ 7 của họ. Không giống như các thế hệ trước được định vị chủ yếu cho khối lượng công việc đào tạo AI, Ironwood đại diện cho một bước ngoặt chiến lược hướng tới suy luận - quá trình đưa ra dự đoán từ các mô hình AI đã được đào tạo để đáp ứng yêu cầu của người dùng. Sự chuyển dịch này thừa nhận một điểm chuyển biến kinh tế trong trí tuệ nhân tạo, nơi ngành công nghiệp đang chuyển từ các dự án nghiên cứu thử nghiệm sang việc triển khai thực tế, rộng rãi các mô hình AI bởi các doanh nghiệp.

Tiến bộ kỹ thuật

Ironwood mang lại những cải tiến kỹ thuật ấn tượng so với người tiền nhiệm, TPU Trillium thế hệ thứ 6. Google tuyên bố chip mới đạt hiệu suất gấp đôi trên mỗi watt, cung cấp 29,3 nghìn tỷ phép tính dấu phẩy động mỗi giây. Dung lượng bộ nhớ đã được tăng lên đáng kể lên 192GB bộ nhớ băng thông cao (HBM) trên mỗi chip - gấp sáu lần so với Trillium. Ngoài ra, băng thông bộ nhớ đã được tăng 4,5 lần để đạt 7,2 terabit mỗi giây, cho phép di chuyển dữ liệu lớn hơn nhiều cả trong chip và giữa các hệ thống.

Thông số kỹ thuật TPU Ironwood so với thế hệ trước (Trillium)

Tính năng Ironwood (Thế hệ 7) Trillium (Thế hệ 6) Cải tiến
Hiệu suất trên mỗi watt 29,3 TFLOPS ~14,65 TFLOPS 2x
Dung lượng bộ nhớ HBM 192GB trên mỗi chip 32GB trên mỗi chip 6x
Băng thông bộ nhớ 7,2 TBps 1,6 TBps 4,5x
Khả năng tính toán đỉnh trên mỗi chip 4.614 TFLOPs Không được xác định -
Khả năng mở rộng tối đa 9.216 chip trên mỗi pod "hàng trăm nghìn" -
Tổng khả năng tính toán khi mở rộng 42,5 exaflops Không được xác định -

Khả năng mở rộng

Có lẽ ấn tượng nhất là khả năng mở rộng của Ironwood. TPU có thể mở rộng lên đến 9.216 chip mỗi pod, cung cấp sức mạnh tính toán khổng lồ 42,5 exaflops. Để hiểu rõ hơn, Google lưu ý rằng điều này mạnh hơn 24 lần so với sức mạnh tính toán của El Capitan, hiện là siêu máy tính lớn nhất thế giới. Tiềm năng mở rộng quy mô khổng lồ này được tăng cường hơn nữa bởi ngăn xếp phần mềm Pathways được thiết kế bởi Google's DeepMind, cho phép các nhà phát triển khai thác hàng chục nghìn TPU Ironwood làm việc cùng nhau.

Ý nghĩa kinh tế

Thời điểm ra mắt của Ironwood đặc biệt quan trọng do chi phí ngày càng tăng của cơ sở hạ tầng AI. Các nhà phân tích Phố Wall ngày càng tập trung vào những khoản chi phí khổng lồ liên quan đến việc xây dựng và triển khai các hệ thống AI, đặc biệt là khi các mô hình như Gemini của Google hướng tới khả năng suy luận làm tăng đáng kể nhu cầu tính toán. Bằng cách phát triển các chip suy luận hiệu suất cao của riêng mình, Google có thể giảm sự phụ thuộc vào các nhà cung cấp như Nvidia, AMD và Intel, tiềm năng tiết kiệm hàng tỷ đô la chi phí cơ sở hạ tầng.

Định vị thị trường

Mặc dù Google đã phát triển TPU trong hơn một thập kỷ qua sáu thế hệ trước đó, việc định vị rõ ràng Ironwood như một chip ưu tiên suy luận đại diện cho sự thay đổi so với cách tiếp cận trước đây. Trước đây, Google đã mô tả TPU như những khoản đầu tư cần thiết cho nghiên cứu tiên tiến nhưng không phải là giải pháp thay thế cho các chip từ các nhà cung cấp đã thành lập. Thị trường suy luận được coi là thị trường khối lượng cao trong thế giới chip, vì nó phải đáp ứng nhu cầu của hàng nghìn hoặc hàng triệu khách hàng yêu cầu dự đoán hàng ngày từ các mạng nơ-ron đã được đào tạo.

Phát triển phần mềm

Bên cạnh thông báo về phần cứng, Google cũng tiết lộ họ đang cung cấp phần mềm Pathways cho công chúng thông qua Pathways on Cloud. Phần mềm này phân phối khối lượng công việc điện toán AI trên các máy tính khác nhau, tiềm năng cho phép khách hàng đạt được hiệu quả và sử dụng tài nguyên AI của họ tốt hơn.

Tương lai của điện toán AI

Với Ironwood, Google đang định vị mình ở vị trí tiên phong trong điều mà họ coi là thế hệ tiếp theo của điện toán AI - chuyển từ các mô hình phản hồi chỉ đơn giản trình bày thông tin sang các hệ thống chủ động có khả năng diễn giải và suy luận. Như Amin Vahdat, Phó Chủ tịch/Tổng Giám đốc ML, Systems & Cloud AI tại Google đã nói, Ironwood được xây dựng đặc biệt để cung cấp năng lượng cho các mô hình AI suy luận, tư duy ở quy mô lớn, báo hiệu tầm nhìn của Google cho các ứng dụng AI phức tạp hơn có thể suy luận qua các vấn đề phức tạp thay vì chỉ đơn giản đáp ứng các lời nhắc.