Trong một bước tiến quan trọng về khả năng trí tuệ nhân tạo, Anthropic đã công bố mô hình AI mới nhất kết hợp khả năng phản hồi nhanh với khả năng phân tích sâu sắc. Sự ra mắt này đánh dấu một bước chuyển đổi chiến lược trong cách các mô hình AI tiếp cận các tác vụ giải quyết vấn đề phức tạp.
![]() |
---|
Một minh họa so sánh cho thấy các mô hình AI khác nhau và hiệu suất của chúng trong các tác vụ phức tạp, nhấn mạnh những tiến bộ của mô hình Claude mới |
Giới thiệu công nghệ suy luận kết hợp
Claude 3.7 Sonnet giới thiệu phương pháp suy luận kết hợp đột phá cho phép mô hình chuyển đổi linh hoạt giữa phản hồi nhanh và tư duy phân tích chi tiết. Thiết kế sáng tạo này loại bỏ nhu cầu sử dụng các mô hình suy luận riêng biệt, tối ưu hóa trải nghiệm AI cho người dùng. Mô hình duy trì mức giá ổn định là 3 đô la Mỹ cho mỗi triệu token đầu vào và 15 đô la Mỹ cho mỗi triệu token đầu ra, có thể truy cập thông qua nhiều nền tảng bao gồm API của Anthropic , Amazon Bedrock và Vertix AI của Google Cloud .
Tính năng | Thông số kỹ thuật |
---|---|
Giá | Đầu vào: 3 USD/triệu token |
Đầu ra: 15 USD/triệu token | |
Giới hạn kiến thức | Tháng 10 năm 2024 |
Nền tảng hỗ trợ | - Anthropic API |
- Amazon Bedrock | |
- Google Cloud Vertix AI | |
Giới hạn Token | Giới hạn đầu ra 128K token |
Hiệu suất được cải thiện trên nhiều lĩnh vực
Mô hình mới cho thấy những cải tiến đáng kể trong nhiều lĩnh vực chuyên biệt, đặc biệt là trong lập trình tác nhân, tài chính và các tác vụ pháp lý. Anthropic đã cập nhật thời điểm cắt kiến thức của mô hình đến tháng 10 năm 2024, đảm bảo khả năng cung cấp thông tin cập nhật hơn. Một tính năng đáng chú ý là khả năng cho phép các nhà phát triển kiểm soát thời gian phản hồi và quá trình tư duy của mô hình thông qua chức năng scratchpad, mang đến khả năng tùy chỉnh hành vi AI chưa từng có.
Những Cải Tiến Chính:
- Giảm 45% việc từ chối yêu cầu không cần thiết
- Nâng cao hiệu suất trong lập trình tự động, tài chính và các nhiệm vụ pháp lý
- Cải thiện khả năng ra quyết định chiến lược
- Nâng cao khả năng thao tác và kiểm thử mã nguồn
![]() |
---|
Các chỉ số hiệu suất thể hiện độ chính xác của các mô hình AI khác nhau, minh họa những cải tiến đạt được với Claude 37 Sonnet |
Claude Code: Kỷ nguyên mới trong lập trình AI
Bên cạnh việc ra mắt mô hình chính, Anthropic đã giới thiệu Claude Code , một công cụ lập trình tiên tiến hiện đang được cung cấp dưới dạng bản xem trước nghiên cứu giới hạn. Công cụ này thể hiện một bước tiến quan trọng trong lập trình có sự hỗ trợ của AI, có khả năng xử lý các tác vụ phức tạp như tìm kiếm cơ sở mã, quản lý kiểm thử và tương tác với GitHub . Thử nghiệm ban đầu cho thấy khả năng ấn tượng, với công cụ hoàn thành thành công các tác vụ lập trình thường đòi hỏi 45 phút hoặc hơn của nỗ lực con người.
Ứng dụng thực tế và kiểm thử
Kiểm thử nội bộ tại Anthropic đã cho thấy tính linh hoạt của mô hình, từ xây dựng thiết kế website front-end đến tạo ra các trò chơi tương tác. Công ty đã sử dụng phương pháp kiểm thử sáng tạo bằng trò chơi Pokémon , trong đó Claude 3.7 Sonnet thể hiện tư duy chiến lược vượt trội khi tiến xa hơn phiên bản tiền nhiệm, đánh bại thành công nhiều gym leader - một cải tiến đáng kể so với phiên bản 3.5 không thể vượt qua khu vực ban đầu.
![]() |
---|
Một biểu đồ thể hiện sự tiến bộ của các mô hình Claude trong gameplay Pokémon, minh họa khả năng chiến lược được nâng cao so với các phiên bản trước đó |
Cải tiến về bảo mật và độ tin cậy
Mô hình mới cho thấy khả năng phân biệt tốt hơn giữa các yêu cầu hợp pháp và độc hại, với mức giảm 45% trong việc từ chối yêu cầu không cần thiết so với các phiên bản trước. Cải tiến này nâng cao đáng kể trải nghiệm người dùng trong khi vẫn duy trì các biện pháp bảo mật mạnh mẽ, đạt được thông qua hợp tác với các chuyên gia bảo mật bên ngoài.