DeepSeek R1 ra mắt với hiệu năng ngang tầm OpenAI o1, cung cấp mô hình mã nguồn mở theo giấy phép MIT

BigGo Editorial Team
DeepSeek R1 ra mắt với hiệu năng ngang tầm OpenAI o1, cung cấp mô hình mã nguồn mở theo giấy phép MIT

Trong một bước phát triển quan trọng của ngành công nghiệp AI, DeepSeek đã chính thức phát hành mô hình R1, đánh dấu một thành tựu đáng chú ý trong việc phát triển AI mã nguồn mở. Sự ra mắt này thể hiện một bước đi chiến lược kết hợp giữa khả năng hiệu năng cao với cách tiếp cận mã nguồn mở, có tiềm năng định hình lại bối cảnh về khả năng tiếp cận và phát triển mô hình AI.

Phương pháp huấn luyện đột phá

DeepSeek R1 giới thiệu một phương pháp huấn luyện đột phá chủ yếu dựa vào học tăng cường (RL), khác biệt so với cách tiếp cận điều chỉnh có giám sát truyền thống (SFT). Phiên bản R1-Zero cho thấy hiệu quả của việc huấn luyện thuần túy bằng RL, đạt được những cải thiện hiệu năng đáng kể mà không cần dữ liệu SFT thông thường. Phương pháp sáng tạo này đã mang lại kết quả ấn tượng, với hiệu suất của mô hình trên AIME 2024 tăng từ 15,6% lên 71,0% chỉ thông qua huấn luyện RL.

Các chỉ số hiệu năng

Mô hình đã thể hiện khả năng vượt trội trong nhiều tiêu chuẩn đánh giá, đặc biệt là trong các nhiệm vụ toán học, lập trình và suy luận. DeepSeek R1 đạt điểm 79,8% trên AIME 2024 và ấn tượng với 97,3% trên MATH-500, ngang bằng hoặc nhỉnh hơn một chút so với hiệu năng của OpenAI o1. Trong các cuộc thi lập trình, mô hình đạt điểm Elo 2029 trên Codeforces, vượt qua 96,3% người tham gia.

Kết quả đánh giá hiệu suất:

  • AIME 2024: 79,8% (vượt trội hơn OpenAI o1)
  • MATH-500: 97,3% (tương đương với OpenAI o1)
  • Codeforces: Xếp hạng Elo 2029 (vượt trội hơn 96,3% người tham gia)
Jim Fan thảo luận về bối cảnh cạnh tranh của AI, nhấn mạnh những cải tiến về hiệu suất của DeepSeek-R1
Jim Fan thảo luận về bối cảnh cạnh tranh của AI, nhấn mạnh những cải tiến về hiệu suất của DeepSeek-R1

Chiến lược giá cả cạnh tranh

DeepSeek đã định vị R1 với mức giá rất cạnh tranh cho dịch vụ API. Giá API của mô hình được đặt ở mức 0,14 đô la Mỹ cho mỗi triệu token đối với cache hit và 0,55 đô la Mỹ cho cache miss ở đầu vào, với đầu ra có giá 2,19 đô la Mỹ cho mỗi triệu token. Cấu trúc giá này thể hiện lợi thế chi phí đáng kể so với các sản phẩm của OpenAI, giúp khả năng AI tiên tiến dễ tiếp cận hơn với các nhà phát triển và doanh nghiệp.

So sánh giá API:

  • DeepSeek R1:

    • Đầu vào (cache hit): 0,14 USD/triệu token
    • Đầu vào (cache miss): 0,55 USD/triệu token
    • Đầu ra: 2,19 USD/triệu token
  • OpenAI o1:

    • Đầu vào: 15 USD/triệu token
    • Đầu ra: 60 USD/triệu token

Cam kết mã nguồn mở

Bản phát hành không chỉ bao gồm mô hình mà còn có tài liệu kỹ thuật toàn diện và sáu mô hình nhỏ hơn được chưng cất. Theo Giấy phép MIT, người dùng có thể tự do sử dụng, sửa đổi và thương mại hóa mô hình, bao gồm cả trọng số và đầu ra của nó. Cách tiếp cận này khác biệt đáng kể so với nhiều mô hình AI thương mại, thúc đẩy tính minh bạch và đổi mới hợp tác trong cộng đồng AI.

Chưng cất và phát triển hệ sinh thái

DeepSeek đã thành công trong việc chưng cất khả năng của R1 thành các mô hình nhỏ hơn, thực tế hơn bằng cách sử dụng các kiến trúc phổ biến như Qwen và Llama. Các phiên bản chưng cất 32B và 70B đạt được mức hiệu suất tương đương với OpenAI o1-mini, chứng minh hiệu quả của việc chuyển giao kiến thức từ mô hình lớn sang mô hình nhỏ hơn trong khi vẫn duy trì tiêu chuẩn hiệu suất cao.

Ý nghĩa tương lai

Bản phát hành này thể hiện một bước tiến quan trọng hướng tới dân chủ hóa khả năng AI tiên tiến. Bằng cách kết hợp hiệu suất tối tân với khả năng tiếp cận mã nguồn mở và giá cả cạnh tranh, DeepSeek R1 có thể đẩy nhanh đổi mới trong lĩnh vực AI đồng thời giúp các công cụ AI mạnh mẽ dễ tiếp cận hơn với nhiều nhà phát triển và tổ chức.