Google Gemini Mở Rộng Khả Năng AI với Chỉnh Sửa Hình Ảnh và Phân Tích PDF

BigGo Editorial Team

Google Gemini Mở Rộng Khả Năng AI với Chỉnh Sửa Hình Ảnh và Phân Tích PDF

Google đang nâng cao khả năng của AI Gemini với hai bản cập nhật quan trọng, hứa hẹn cải thiện cả việc tạo nội dung hình ảnh và phân tích tài liệu.


Giao diện này minh họa các tính năng đổi mới của trí tuệ nhân tạo Gemini của Google, nâng cao tương tác người dùng thông qua các lệnh bằng giọng nói

Chỉnh Sửa Hình Ảnh AI Sắp Có Mặt trên Gemini

Google sắp giới thiệu khả năng tinh chỉnh cho công cụ tạo hình ảnh AI của Gemini, cho phép người dùng thực hiện các chỉnh sửa chi tiết đối với hình ảnh được tạo bởi AI sau khi tạo ra. Tính năng này nhằm giải quyết các vấn đề phổ biến trong hình ảnh do AI tạo ra, như lỗi giải phẫu học hoặc thiết kế kiến trúc không thể thực hiện được.

Bản cập nhật sắp tới sẽ cung cấp hai phương pháp chỉnh sửa:

Điều chỉnh dựa trên văn bản: Người dùng có thể gửi một yêu cầu để sửa đổi các khía cạnh cụ thể của hình ảnh do AI tạo ra hiện có.
Chỉnh sửa tương tác: Người dùng có thể chọn các khu vực của hình ảnh và mô tả những thay đổi mong muốn, với Gemini chỉ áp dụng sửa đổi cho vùng được chọn.

Những công cụ này có thể đặc biệt hữu ích cho các chuyên gia trong lĩnh vực như thiết kế đồ họa, tiếp thị và mạng xã hội, nơi độ chính xác về hình ảnh và thời gian hoàn thành nhanh chóng là rất quan trọng.

Mặc dù Google không phải là công ty đầu tiên triển khai các tính năng như vậy - các khả năng tương tự đã tồn tại trong các công cụ như DALL-E của OpenAI và Adobe Firefly - bản cập nhật này thể hiện một bước tiến kỹ thuật đáng kể cho Gemini khi Google tiếp tục cạnh tranh trong lĩnh vực AI tạo sinh.


Giao diện minh họa cách Gemini có thể nâng cao năng suất thông qua khả năng chỉnh sửa hình ảnh tiên tiến trong hệ sinh thái của Google

Tích Hợp Gemini với Trình Xem PDF của Google Drive

Trong một phát triển riêng biệt, Google đang giới thiệu chức năng Gemini trực tiếp vào trình xem PDF của Google Drive. Sự tích hợp này mang sức mạnh của Gemini 1.5 Pro vào các tác vụ phân tích và tạo nội dung PDF.

Các tính năng chính của tích hợp Gemini PDF bao gồm:

Tóm tắt các tập tin PDF dài và phức tạp
Khả năng trả lời câu hỏi dựa trên nội dung tài liệu
Công cụ tạo nội dung (ví dụ: hướng dẫn học tập, bản nháp email) sử dụng thông tin từ PDF
Khả năng kết hợp thông tin từ nhiều tập tin Google Drive

Tính năng này hỗ trợ nhiều loại PDF khác nhau, bao gồm tài liệu được quét, tập tin có nhiều văn bản và những tập tin chứa bảng biểu phức tạp.

Tích hợp Gemini này đang được triển khai cho người đăng ký Google One AI Premium và người dùng có gói bổ sung Gemini Business, Enterprise và Education.

Cả hai bản cập nhật đều nhấn mạnh cam kết của Google trong việc mở rộng khả năng của Gemini trên toàn hệ sinh thái của mình, làm cho các công cụ được hỗ trợ bởi AI trở nên dễ tiếp cận hơn và tích hợp vào quy trình làm việc hàng ngày.

Cập nhật: Thứ Năm, ngày 01 tháng 8 lúc 22:48

Google đang tiếp tục mở rộng khả năng của Gemini với các tiện ích mở rộng mới cho các dịch vụ phổ biến. Các tích hợp sắp tới bao gồm Google Keep cho việc ghi chú, Google Tasks cho quản lý công việc, và Google Calendar cho lập lịch sự kiện. Những tiện ích mở rộng này sẽ cho phép người dùng tương tác với các dịch vụ này thông qua lệnh thoại, nâng cao năng suất trong hệ sinh thái Google. Ngoài ra, một tiện ích mở rộng Spotify đang được phát triển, đánh dấu sự tích hợp bên thứ ba đầu tiên của Gemini. Điều này sẽ cho phép người dùng điều khiển việc phát nhạc và podcast mà không cần mở ứng dụng Spotify. Các tiện ích mở rộng tiềm năng khác đang được phát triển bao gồm tích hợp Google Home và các tính năng ứng dụng điện thoại, cho thấy ý định của Google trong việc định vị Gemini như một trung tâm cho cuộc sống kỹ thuật số của người dùng trên nhiều dịch vụ và nền tảng khác nhau.


Sự tích hợp của Gemini với Google Drive nâng cao khả năng phân tích PDF và tạo nội dung, giúp quy trình làm việc của người dùng trở nên hiệu quả hơn

Tin tức liên quan

‌

‌
‌

‌

‌
‌

‌