Các cuộc hội thoại trí tuệ nhân tạo đang tiến thêm một bước phát triển khi OpenAI cải tiến công nghệ giao diện giọng nói của mình. Công ty đã triển khai những cải tiến đáng kể cho Chế độ Giọng nói Nâng cao của ChatGPT, tập trung vào việc tạo ra những tương tác tự nhiên, giống con người hơn nhằm giải quyết những khó chịu phổ biến khi sử dụng trợ lý AI.
Một Đối tác Hội thoại Kiên nhẫn hơn
OpenAI đã phát hành bản cập nhật cho Chế độ Giọng nói Nâng cao của ChatGPT, cải thiện đáng kể cách AI xử lý luồng hội thoại. Cải tiến đáng chú ý nhất là khả năng phát hiện các khoảng dừng tự nhiên trong lời nói của con người mà không gây gián đoạn. Như được minh họa bởi nhà nghiên cứu đào tạo sau của OpenAI, Manuka Stratta, trợ lý giọng nói đã cập nhật giờ đây có thể chờ đợi qua những khoảng lặng có chủ ý và những khoảng dừng ngượng ngùng, cho người dùng nhiều thời gian hơn để sắp xếp suy nghĩ mà không cảm thấy áp lực phải lấp đầy mọi khoảnh khắc im lặng.
Tính năng cập nhật của ChatGPT Advanced Voice Mode:
- Giảm thiểu sự gián đoạn trong các khoảng dừng tự nhiên khi nói
- Tính cách hấp dẫn, trực tiếp và súc tích hơn (chỉ dành cho người đăng ký Plus)
- Giọng điệu thích ứng dựa trên ngữ cảnh cuộc trò chuyện
- Luồng hội thoại tự nhiên hơn
Truy cập Miễn phí vào Các Cải tiến Cốt lõi
Tính năng giảm gián đoạn không chỉ giới hạn cho người dùng trả phí. OpenAI đã cung cấp cải tiến cơ bản này cho tất cả người dùng, bao gồm cả những người dùng gói miễn phí. Việc phổ cập hóa một cải tiến khả năng sử dụng quan trọng này thể hiện cam kết của OpenAI trong việc cải thiện trải nghiệm hội thoại cơ bản cho toàn bộ người dùng, bất kể tình trạng đăng ký.
Khả dụng:
- Tính năng giảm gián đoạn: Khả dụng cho tất cả người dùng (miễn phí và trả phí)
- Tính năng cá nhân hóa nâng cao: Chỉ dành cho người đăng ký ChatGPT Plus
- Phương thức truy cập: Nhấp vào biểu tượng sóng bên cạnh hộp tin nhắn trong ChatGPT
Cải thiện Tính cách cho Người dùng Plus
Trong khi những cải tiến về giảm gián đoạn được cung cấp cho tất cả mọi người, người đăng ký ChatGPT Plus nhận được những lợi ích bổ sung với bản cập nhật này. Người dùng trả phí có quyền truy cập vào tính cách giọng nói nâng cao mà OpenAI mô tả là hấp dẫn hơn, trực tiếp hơn và súc tích hơn. Giọng nói giờ đây thích ứng tông điệu dựa trên ngữ cảnh hội thoại, đáp ứng với sắc thái cảm xúc phù hợp cho dù người dùng bày tỏ cảm giác buồn hay lạc quan.
Kết quả Kiểm tra Thực tế
Những người thử nghiệm sớm báo cáo những cải tiến tinh tế nhưng có ý nghĩa trong trải nghiệm hội thoại. Trợ lý giọng nói đã cập nhật cảm thấy ít vội vàng và chú ý hơn, tạo ra một cuộc đối thoại qua lại tự nhiên hơn, mô phỏng tốt hơn cuộc trò chuyện của con người. Khả năng thích ứng tông điệu dựa trên ngữ cảnh cảm xúc đại diện cho một bước tiến đáng kể hướng tới tương tác AI đồng cảm hơn, giải quyết một trong những hạn chế chính của các trợ lý giọng nói trước đây.
Sự Phát triển của Trợ lý Giọng nói AI
Bản cập nhật này đại diện cho một cột mốc khác trong bối cảnh trợ lý giọng nói AI đang phát triển nhanh chóng. OpenAI tiếp tục hoàn thiện khả năng của ChatGPT với tốc độ đáng kinh ngạc, với Chế độ Giọng nói Nâng cao đã nổi bật nhờ khả năng tạo ra các cuộc hội thoại giống con người hơn so với các trợ lý giọng nói truyền thống. Việc bổ sung quyền truy cập camera trong một số phiên bản càng mở rộng tiện ích của trợ lý, cho phép nó phản hồi các truy vấn hình ảnh.
Truy cập Chế độ Giọng nói Đã Cập nhật
Người dùng có thể truy cập Chế độ Giọng nói Nâng cao đã cải tiến bằng cách nhấp vào biểu tượng sóng nằm ở bên phải hộp tin nhắn trong giao diện ChatGPT. Bản cập nhật đã bắt đầu được triển khai, làm cho trải nghiệm hội thoại nâng cao này có sẵn ngay lập tức cho cả người dùng miễn phí và trả phí, mặc dù các cải tiến về tính cách được dành riêng cho người đăng ký Plus.
Tương lai của Hội thoại AI
Khi các trợ lý giọng nói AI tiếp tục cải thiện, ranh giới giữa cuộc hội thoại của con người và nhân tạo ngày càng trở nên mờ nhạt. Sự tập trung của OpenAI vào các khoảng dừng tự nhiên, thích ứng cảm xúc và luồng hội thoại gợi ý một tương lai nơi tương tác với AI trở nên gần như không thể phân biệt với việc nói chuyện với một người khác. Đối với người dùng muốn trải nghiệm công nghệ tiên tiến của AI hội thoại, Chế độ Giọng nói Nâng cao đã cập nhật của ChatGPT cung cấp cái nhìn thoáng qua về những gì sẽ đến.