Trong một bước tiến quan trọng về khả năng nghiên cứu AI, OpenAI đã giới thiệu Deep Research, một công cụ tiên tiến được thiết kế để cách mạng hóa cách các chuyên gia thực hiện nghiên cứu và phân tích trực tuyến. Tính năng mới này đại diện cho một bước tiến lớn trong khả năng của AI trong việc hiểu, tổng hợp và trình bày thông tin phức tạp từ nhiều nguồn.
Khả năng nghiên cứu nâng cao
Deep Research tận dụng phiên bản chuyên biệt của mô hình o3 của OpenAI, được tối ưu hóa cho duyệt web và phân tích Python. Hệ thống có thể xử lý hàng trăm nguồn trực tuyến cùng lúc, phân tích văn bản, hình ảnh và tệp PDF để tạo ra các báo cáo nghiên cứu toàn diện. Điều làm nó khác biệt là khả năng duy trì ngữ cảnh và cung cấp trích dẫn chi tiết, đảm bảo tính minh bạch và có thể kiểm chứng trong các phát hiện của nó.
Ứng dụng thực tế
Công cụ này được nhắm đến các chuyên gia trong lĩnh vực tài chính, khoa học, chính sách và kỹ thuật - những người cần nghiên cứu kỹ lưỡng và đáng tin cậy. Nó cũng phục vụ nhu cầu thực tế của người tiêu dùng, chẳng hạn như đưa ra quyết định sáng suốt về việc mua sắm lớn như xe cộ, thiết bị gia dụng và nội thất. Người dùng có thể nhập câu hỏi cùng với tài liệu tải lên, bao gồm PDF và bảng tính, với kết quả thường được trả về trong khoảng 5 đến 30 phút.
Tính năng chính:
- Thời gian xử lý: 5-30 phút cho mỗi truy vấn
- Giới hạn truy vấn hàng tháng: 100 (dành cho người dùng Pro)
- Các định dạng tệp được hỗ trợ: PDF, bảng tính
- Đầu ra hiện tại: Báo cáo dạng văn bản
- Nền tảng khả dụng: Chỉ có Web (phiên bản di động/máy tính sẽ ra mắt sớm)
Hiệu suất và điểm chuẩn
Deep Research đã thể hiện khả năng ấn tượng trong môi trường kiểm tra nghiêm ngặt. Trong đánh giá Humanity's Last Exam, nó đạt tỷ lệ chính xác 26,6% đối với các câu hỏi cấp độ chuyên gia trên hơn 100 lĩnh vực. Hệ thống cũng đã giành vị trí hàng đầu trên bảng xếp hạng GAIA, đánh giá hiệu suất AI trên các vấn đề thực tế đòi hỏi khả năng lập luận và thông thạo đa phương thức.
Các Chỉ số Hiệu suất:
- Độ chính xác trong bài kiểm tra " Humanity's Last Exam ": 26,6%
- Tiêu chuẩn " GAIA ": Đạt được hiệu suất SOTA (Tốt nhất hiện tại)
- Phạm vi bao phủ: Hơn 100 lĩnh vực học thuật
![]() |
---|
Hiệu suất của Deep Research trong các nhiệm vụ cấp độ chuyên gia, nhấn mạnh độ chính xác trong môi trường kiểm thử nghiêm ngặt |
Hạn chế hiện tại và cập nhật trong tương lai
Mặc dù mạnh mẽ, Deep Research hiện đang đối mặt với một số hạn chế. Người dùng có thể gặp phải những sai sót về dữ liệu thực tế và thách thức trong việc phân biệt giữa các nguồn có thẩm quyền và thông tin sai lệch. OpenAI thừa nhận những hạn chế này và có kế hoạch khắc phục thông qua các bản cập nhật trong tương lai. Công ty đã công bố kế hoạch giới thiệu hình ảnh nhúng, trực quan hóa dữ liệu và tích hợp với các nguồn dữ liệu chuyên biệt.
Tính khả dụng và quyền truy cập
Hiện tại, Deep Research có sẵn cho người dùng ChatGPT Pro với giới hạn 100 truy vấn mỗi tháng. OpenAI dự định mở rộng quyền truy cập cho người dùng Plus, Team và Enterprise trong những tuần tới. Tính năng này hiện chỉ có trên web, với kế hoạch tích hợp ứng dụng di động và máy tính để bàn dự kiến vào cuối tháng này, đánh dấu một bước tiến quan trọng trong việc làm cho khả năng nghiên cứu nâng cao dễ tiếp cận hơn với người dùng trên các nền tảng khác nhau.