Meta giới thiệu Llama 3.2: Bước tiến lớn trong AI với khả năng đa phương thức và tích hợp giọng nói

BigGo Editorial Team
Meta giới thiệu Llama 3.2: Bước tiến lớn trong AI với khả năng đa phương thức và tích hợp giọng nói

Meta đã đạt được những bước tiến đáng kể trong lĩnh vực trí tuệ nhân tạo với việc công bố Llama 3.2, giới thiệu một loạt tính năng và khả năng ấn tượng mới tại sự kiện Meta Connect 2024.

Làm chủ đa phương thức

Llama 3.2 đại diện cho một bước tiến lớn trong công nghệ AI của Meta, giới thiệu khả năng đa phương thức cho phép mô hình hiểu và tương tác với cả văn bản và hình ảnh. Sự tiến bộ này tạo điều kiện cho các tương tác AI tự nhiên và linh hoạt hơn trên toàn bộ bộ ứng dụng của Meta.

Tích hợp giọng nói: Ranh giới tiếp theo

Có lẽ nâng cấp đáng chú ý nhất là việc tích hợp khả năng giọng nói vào Meta AI. Người dùng giờ đây có thể tham gia vào các cuộc hội thoại bằng giọng nói với trợ lý AI trên WhatsApp, Facebook, Instagram và Messenger. Mark Zuckerberg, CEO của Meta, tin rằng tương tác AI bằng giọng nói sẽ vượt qua tầm quan trọng của chatbot dựa trên văn bản, có khả năng cách mạng hóa cách người dùng tương tác với AI.

Tương tác với Meta AI bằng giọng nói trên màn hình cảm ứng, thể hiện khả năng tích hợp giọng nói mới
Tương tác với Meta AI bằng giọng nói trên màn hình cảm ứng, thể hiện khả năng tích hợp giọng nói mới

Giọng nói của người nổi tiếng và cá nhân hóa

Thêm vào đó một chút sức hấp dẫn của ngôi sao, Meta đang cung cấp cho người dùng khả năng tùy chỉnh trợ lý AI của họ với giọng nói của người nổi tiếng, bao gồm John Cena, Judi Dench và Kristen Bell. Tính năng này nhằm mục đích làm cho các tương tác AI trở nên hấp dẫn và cá nhân hóa hơn.

AI Studio và tiềm năng Deepfake

AI Studio của Meta đã được nâng cấp để tạo ra các avatar AI giống thật hơn, thể hiện khả năng tạo ra các phản hồi video bắt chước người thật với độ chính xác đáng kinh ngạc. Mặc dù ấn tượng, công nghệ này làm dấy lên lo ngại về khả năng bị lạm dụng trong việc tạo ra các deepfake thuyết phục.

Đột phá trong dịch thuật và lồng tiếng

Tính năng lồng tiếng video tự động cho Reels bằng tiếng Anh và tiếng Tây Ban Nha thể hiện công nghệ đồng bộ môi và hoạt hình khuôn mặt tiên tiến của Meta. Tính năng này cho phép người sáng tạo nội dung tiếp cận đối tượng rộng hơn bằng cách tự động dịch và lồng tiếng video của họ trong khi vẫn duy trì vẻ ngoài tự nhiên.

Mã nguồn mở và mô hình trên thiết bị

Meta đang định vị Llama như Linux của ngành công nghiệp AI bằng cách mở mã nguồn các mô hình nhỏ hơn 1B và 3B tham số được tối ưu hóa để sử dụng trên thiết bị. Động thái này có thể trao quyền cho các nhà phát triển tạo ra các ứng dụng AI an toàn và chuyên biệt hơn.

Khi Meta tiếp tục mở rộng ranh giới của công nghệ AI, công ty đang tự định vị mình là một người chơi chính trong lĩnh vực trợ lý AI. Với gần 500 triệu người dùng hoạt động hàng tháng, Meta AI đang trên đà trở thành một trong những trợ lý AI được sử dụng rộng rãi nhất trên toàn cầu. Tuy nhiên, sự dễ dàng tiếp cận với những tính năng tiên tiến này sẽ là yếu tố then chốt trong việc xác định sự áp dụng rộng rãi và tác động của chúng đối với các tương tác kỹ thuật số hàng ngày.