Google Gemini 2.5 Pro Bổ Sung Tính Năng Phân Tích Video và Tìm Kiếm Lịch Sử Trò Chuyện

BigGo Editorial Team
Google Gemini 2.5 Pro Bổ Sung Tính Năng Phân Tích Video và Tìm Kiếm Lịch Sử Trò Chuyện

Trợ lý AI Gemini của Google tiếp tục phát triển nhanh chóng với những khả năng mới đáng kể đang được phát hiện và triển khai. Những phát hiện gần đây cho thấy khả năng phân tích video sắp ra mắt và chức năng tìm kiếm lịch sử trò chuyện, trong khi mô hình Gemini 2.5 Pro mới nhất đã gây ấn tượng với người dùng đủ để gia nhập hàng ngũ các công cụ AI trả phí đáng để đăng ký.

Phân Tích Video Sắp Có Trên Gemini

Một cuộc phân tích APK của Gemini cho Android (phiên bản 16.15.38.sa.arm64 beta) đã tiết lộ rằng Google đang chuẩn bị thêm khả năng phân tích video vào trợ lý AI của mình. Các nhà phát triển đã có thể kích hoạt tính năng chưa phát hành này, cho phép người dùng tải lên video và đặt câu hỏi cho Gemini về nội dung của chúng. Việc triển khai có vẻ xử lý được tối đa năm phút nội dung video, với AI phân tích chính xác các yếu tố hình ảnh, xác định vị trí dựa trên các đặc điểm kiến trúc và cung cấp thông tin theo ngữ cảnh về đoạn phim.

Chức năng này có thể hữu ích cho việc tóm tắt các cuộc họp đã ghi lại, khắc phục sự cố kỹ thuật thông qua bản ghi màn hình, hoặc phân tích nội dung hình ảnh cho nhiều mục đích khác nhau. Tính năng này dường như đang ở giai đoạn thử nghiệm cuối cùng, cho thấy một thông báo chính thức có thể sẽ sớm được đưa ra, có thể tại sự kiện Google I/O sắp tới.

Các tính năng sắp ra mắt của Gemini

  • Phân tích video với giới hạn tải lên 5 phút
  • Chức năng tìm kiếm lịch sử trò chuyện
  • Cải thiện khả năng phân tích tài liệu

Chức Năng Tìm Kiếm cho Lịch Sử Trò Chuyện

Một cải tiến đáng chú ý khác được phát hiện trong cùng phiên bản beta giải quyết một khoảng trống đáng kể về khả năng sử dụng trong Gemini. Hiện tại, mặc dù AI duy trì lịch sử toàn diện về các cuộc trò chuyện trước đó, nhưng không có cách hiệu quả để tìm kiếm qua chúng. Điều này đặc biệt gây thất vọng cho những người dùng thường xuyên khi họ cố gắng tìm kiếm thông tin cụ thể từ các tương tác trước đó.

Việc phân tích APK đã tiết lộ các chuỗi liên quan đến SEARCH_CHAT_HISTORY, cho thấy Google đang phát triển một giải pháp cho vấn đề này. Mặc dù tính năng này dường như đang ở giai đoạn phát triển ban đầu và chưa có triển khai chức năng nào được hiển thị, nhưng nó đại diện cho một cải tiến quan trọng về chất lượng trải nghiệm phù hợp với năng lực cốt lõi của Google trong công nghệ tìm kiếm.

Gemini 2.5 Pro Gây Ấn Tượng Với Người Dùng

Ngoài những tính năng sắp tới này, việc Google gần đây phát hành Gemini 2.5 Pro đã tạo nên làn sóng trong cộng đồng những người đam mê AI. Mô hình này đại diện cho một bước tiến đáng kể so với các phiên bản trước, với các khả năng bao gồm lập luận phức tạp, lập trình và phân tích tài liệu lớn. Cửa sổ ngữ cảnh khổng lồ lên đến 1 triệu token (với kế hoạch mở rộng lên 2 triệu) cho phép nó xử lý và hiểu nhiều thông tin cùng một lúc hơn so với các phiên bản trước.

Bên cạnh Gemini 2.5 Pro, Google cũng giới thiệu Gemini 2.5 Flash, được tối ưu hóa cho tốc độ và hiệu quả chi phí trong các ứng dụng khối lượng lớn như dịch vụ khách hàng. Cả hai mô hình đều hỗ trợ đầu vào đa phương thức trên văn bản, hình ảnh, âm thanh và video, với các tính năng như Manual Reasoning Control để điều chỉnh mức độ kỹ lưỡng mà mô hình suy nghĩ về các vấn đề.

Những cải tiến đã đủ đáng kể đến mức ngay cả những người dùng AI có chọn lọc, những người thường hạn chế các đăng ký trả phí của họ, cũng đang thêm Gemini vào bộ công cụ của họ. Chìa khóa để tận dụng tối đa những mô hình tiên tiến này dường như nằm ở cách người dùng tiếp cận chúng - với giao tiếp rõ ràng, lời nhắc cụ thể và kỳ vọng thực tế về khả năng và giới hạn của chúng.

Tính năng của Gemini 2.5 Pro

  • Cửa sổ ngữ cảnh lên đến 1 triệu token (sắp tới sẽ là 2 triệu)
  • Hỗ trợ đầu vào đa phương thức (văn bản, hình ảnh, âm thanh, video)
  • Manual Reasoning Control để điều chỉnh tư duy của mô hình
  • Canvas: không gian tương tác để chỉnh sửa tài liệu và mã
  • Live API cho phép truyền phát thời gian thực trên nhiều phương thức

Bối Cảnh AI Đang Phát Triển

Mặc dù Gemini 2.5 Pro đại diện cho một bước tiến lớn đối với các sản phẩm AI của Google, người dùng lưu ý rằng sự tích hợp trong hệ sinh thái của Google vẫn cảm thấy hơi rời rạc khi chuyển đổi giữa các chức năng khác nhau. Mô hình này cũng tiếp tục đối mặt với những thách thức về viết lách tinh tế, suy nghĩ sâu sắc hơn và đôi khi có ảo giác - những vấn đề phổ biến trong các mô hình ngôn ngữ lớn.

Khi các công cụ AI tiếp tục phát triển, sự khác biệt giữa chúng không còn nằm ở khả năng thuần túy mà là ở việc người dùng có thể khai thác chúng hiệu quả như thế nào cho các quy trình làm việc cụ thể. Với những tính năng sắp tới và những cải tiến gần đây, Google đang định vị Gemini như một đối thủ đáng gờm trong không gian trợ lý AI ngày càng cạnh tranh, đặc biệt là đối với những người dùng đánh giá cao khả năng phân tích đa phương thức và tích hợp sâu với hệ sinh thái của Google.