Google tiếp tục nâng cao khả năng trợ lý AI của mình, mang đến các tính năng đa ngôn ngữ mới và công cụ tương tác trực quan cho Gemini Live. Những cập nhật này đại diện cho những bước tiến quan trọng trong việc làm cho trợ lý AI trở nên linh hoạt và hữu ích hơn trong các tình huống hàng ngày, phát triển dựa trên tầm nhìn của Google về việc tạo ra các tương tác kỹ thuật số tự nhiên và phù hợp với ngữ cảnh hơn.
Hỗ Trợ Đa Ngôn Ngữ Sắp Ra Mắt Trên Gemini Live
Google đang chuẩn bị triển khai hỗ trợ ngôn ngữ thứ hai trong Gemini Live, cho phép người dùng trò chuyện với trợ lý AI bằng nhiều ngôn ngữ trong cùng một phiên. Tính năng này, đã được phát hiện trong phiên bản beta 16.9.39.sa.arm64 của ứng dụng Google dành cho Android, sẽ cho phép các cuộc hội thoại bằng các kết hợp ngôn ngữ như Spanglish, Hinglish và nhiều ngôn ngữ khác. Theo trang hỗ trợ cập nhật của Google, Gemini Live hiện hỗ trợ hơn 45 ngôn ngữ, mặc dù ban đầu người dùng sẽ chỉ được giới hạn thêm một ngôn ngữ phụ. Khi được triển khai, tính năng này sẽ hoạt động trên lớp phủ Gemini, trong ứng dụng và trong các cuộc hội thoại Gemini Live, giúp trợ lý trở nên dễ tiếp cận hơn đáng kể đối với người dùng đa ngôn ngữ.
Ngôn ngữ được hỗ trợ:
- Tổng cộng hơn 45 ngôn ngữ
- Ví dụ về hỗ trợ ngôn ngữ kết hợp: Spanglish, Hinglish, tiếng Ý, tiếng Pháp
- Hiện tại giới hạn một ngôn ngữ phụ cho mỗi người dùng
Khả Năng Tương Tác Trực Quan Mới
Ngoài việc nâng cao ngôn ngữ, Gemini Live đang có thêm các tính năng trực quan mạnh mẽ được hỗ trợ bởi công nghệ Project Astra của DeepMind. Người dùng sẽ sớm có thể hướng camera điện thoại thông minh vào các vật thể và thảo luận về chúng theo thời gian thực với trợ lý. Ví dụ, hệ thống có thể giúp đưa ra quyết định thiết kế bằng cách phân tích các mẫu màu cho một bình gốm thông qua camera trong khi vẫn duy trì cuộc trò chuyện tự nhiên về các lựa chọn. Ngoài ra, Gemini Live đang bổ sung khả năng chia sẻ màn hình cho phép trợ lý nhận diện và thảo luận về nội dung hiển thị trên màn hình của người dùng, cho phép các cuộc trò chuyện theo ngữ cảnh về những gì đang được xem.
Tính năng mới của Gemini Live:
- Hỗ trợ ngôn ngữ thứ hai (hiện đang trong giai đoạn beta)
- Phân tích video theo thời gian thực thông qua camera điện thoại thông minh
- Khả năng chia sẻ màn hình với cuộc hội thoại theo ngữ cảnh
- Được hỗ trợ bởi công nghệ Project Astra của DeepMind
Tương Lai của Trợ Lý AI
Những phát triển này gợi ý về tầm nhìn rộng lớn hơn của Google đối với trợ lý AI. Sameer Samat, Giám đốc Android của Google, đã chỉ ra rằng các tính năng điện thoại thông minh này chỉ là bước khởi đầu, báo hiệu những gì có thể thực hiện được với kính thông minh trong tương lai. Việc tích hợp các khả năng của Project Astra vào Gemini đại diện cho một bước tiến quan trọng hướng tới điều mà Google hình dung là một trợ lý AI phổ quát có thể đồng thời xử lý giọng nói, hình ảnh và ngữ cảnh môi trường. Cửa sổ ngữ cảnh mở rộng này cho phép Gemini tham khảo thông tin đã thấy trước đó, chẳng hạn như các sơ đồ từ sách giáo khoa, khi giúp người dùng giải quyết vấn đề sau này.
Cân Bằng Đổi Mới với Niềm Tin của Người Dùng
Khi Google tiến về phía trước với việc tích hợp AI, công ty luôn chú ý đến nhu cầu cân bằng giữa đổi mới và niềm tin của người tiêu dùng. Samat nhấn mạnh việc tập trung vào lợi ích của công nghệ hơn là bản thân công nghệ, lưu ý rằng Google nhằm mục đích tiến bộ một cách táo bạo nhưng có trách nhiệm. Rút kinh nghiệm từ thời kỳ Google Glass, công ty đang ưu tiên tính minh bạch trong cách thức hoạt động của các khả năng mới này, đặc biệt là liên quan đến các vấn đề về quyền riêng tư. Cách tiếp cận có tính toán này đôi khi có nghĩa là Google không phải là người đầu tiên ra mắt một số khả năng nhất định, ngay cả khi họ đã có công nghệ sẵn sàng.
Sự Cùng Tồn Tại của AI Agent và Ứng Dụng
Mặc dù có lo ngại rằng các AI agent cuối cùng có thể thay thế các ứng dụng truyền thống, Samat vẫn lạc quan về sự cùng tồn tại của chúng. Ông coi các AI agent giống như trợ lý cá nhân giúp người dùng sử dụng tốt hơn các dịch vụ hiện có hơn là thay thế chúng. Quan điểm này cho thấy Google nhìn nhận tương lai của điện toán di động như một sự hợp tác giữa AI agent và các ứng dụng của bên thứ ba, với mỗi bên đóng vai trò bổ sung trong trải nghiệm người dùng.
Hướng Đi Tương Lai
Google rõ ràng coi AI là một công nghệ mang tính chuyển đổi ngang hàng với sự chuyển đổi sang điện toán di động và cá nhân. Chiến lược của công ty dường như tập trung vào việc chứng minh lợi ích cụ thể cho người dùng hơn là nhấn mạnh vào bản thân công nghệ AI. Như Samat đã lưu ý, Người tiêu dùng chỉ muốn biết liệu những thứ này có thể giúp họ thực sự hoàn thành công việc hay không. Mục tiêu cuối cùng dường như là tạo ra các tính năng AI được tích hợp một cách liền mạch đến mức người dùng được hưởng lợi từ chúng mà không nhất thiết phải nhận thức về công nghệ cơ bản.