Các Mô Hình AI của DeepSeek Thể Hiện Hiệu Suất Đột Phá Trên GPU Moore Threads của Trung Quốc

BigGo Editorial Team
Các Mô Hình AI của DeepSeek Thể Hiện Hiệu Suất Đột Phá Trên GPU Moore Threads của Trung Quốc

Lĩnh vực trí tuệ nhân tạo đang chứng kiến một bước phát triển quan trọng khi các mô hình AI mã nguồn mở của DeepSeek chứng minh khả năng tương thích với GPU Moore Threads sản xuất tại Trung Quốc, tiềm năng giảm sự phụ thuộc vào phần cứng truyền thống của NVIDIA cho các tác vụ suy luận AI.

Thành Tựu Kỹ Thuật

Moore Threads đã triển khai thành công mô hình DeepSeek-R1-Distill-Qwen-7B trên cả card đồ họa MTT S80 dành cho người dùng và card đồ họa MTT S4000 cấp trung tâm dữ liệu. Việc triển khai sử dụng framework Ollama, một giải pháp nhẹ được thiết kế để chạy các mô hình ngôn ngữ lớn cục bộ trên nhiều hệ điều hành khác nhau, kết hợp với các tối ưu hóa động cơ suy luận độc quyền của Moore Threads.

  • Giá API DeepSeek: 2,2 USD cho mỗi triệu token đầu ra
  • Giá API OpenAI: 60 USD cho mỗi triệu token đầu ra
  • Phần cứng được hỗ trợ: MTT S80 (GPU cho máy khách), MTT S4000 (GPU cho trung tâm dữ liệu)
  • Hỗ trợ Framework: Ollama (cho MacOS, Linux, Windows)
  • Các mô hình tương thích: DeepSeek-R1-Distill-Qwen-7B

Tác Động Thị Trường

Sự phát triển này diễn ra vào thời điểm quan trọng khi DeepSeek đang tạo tiếng vang trong cộng đồng AI toàn cầu. Chiến lược giá của công ty đặc biệt mang tính cạnh tranh, cung cấp dịch vụ API với giá 2,2 đô la Mỹ cho mỗi triệu token đầu ra, thấp hơn đáng kể so với mức giá 60 đô la Mỹ cho mỗi triệu token của OpenAI. Các công ty công nghệ lớn của Trung Quốc bao gồm Alibaba, ByteDance, Baidu và JD Cloud đã tích hợp các mô hình của DeepSeek vào dịch vụ đám mây của họ.

Hiệu Suất và Tích Hợp

Mặc dù các chỉ số hiệu suất cụ thể chưa được công bố, Moore Threads tuyên bố đạt được kết quả xuất sắc thông qua các tối ưu hóa tính toán tùy chỉnh và cải thiện quản lý bộ nhớ. GPU của công ty đã chứng minh khả năng tương thích CUDA, đặc biệt có lợi cho các ứng dụng tiếng Trung. Sự tích hợp này thể hiện một bước tiến quan trọng trong khả năng phát triển phần cứng AI nội địa của Trung Quốc.

Ý Nghĩa Tương Lai

Việc triển khai thành công các mô hình DeepSeek trên GPU Moore Threads báo hiệu một sự thay đổi tiềm năng trong bối cảnh phần cứng AI. Sự phát triển này có thể dẫn đến các tùy chọn triển khai AI với giá cả phải chăng và dễ tiếp cận hơn, đặc biệt là tại thị trường Trung Quốc. Tuy nhiên, cần lưu ý rằng các demo hiện tại chỉ giới hạn ở các mô hình đã được tinh giản, và việc so sánh hiệu suất toàn diện với các giải pháp của AMD, Apple hoặc NVIDIA vẫn chưa được thiết lập.