Trong thế giới tiêu thụ nội dung đa phương tiện ngày càng mở rộng, việc tìm kiếm nội dung mới phù hợp với sở thích của bạn có thể là một thách thức. Một công cụ mã nguồn mở mới có tên là Recommendarr đã xuất hiện, tạo nên cuộc thảo luận giữa những người đam mê công nghệ về ưu điểm của việc sử dụng Mô hình Ngôn ngữ Lớn (LLMs) cho các đề xuất nội dung cá nhân hóa, so với thuật toán đề xuất truyền thống.
Đề xuất nội dung đa phương tiện dựa trên AI
Recommendarr là một ứng dụng web phân tích thư viện Sonarr, Radarr, Plex và Jellyfin của người dùng để tạo ra các đề xuất cá nhân hóa về chương trình truyền hình và phim. Khác với các hệ thống đề xuất thông thường dựa vào lọc cộng tác hoặc thuật toán dựa trên nội dung, Recommendarr tận dụng khả năng hiểu ngữ cảnh của LLMs. Ứng dụng gửi dữ liệu thư viện đến dịch vụ AI, sau đó phân tích các mẫu xem và đề xuất nội dung mới dựa trên hiểu biết về mối quan hệ giữa các nội dung đa phương tiện khác nhau.
Người tạo ra Recommendarr đã giải thích động lực của họ khi sử dụng LLMs thay vì hệ thống đề xuất truyền thống:
Tôi chưa bao giờ thấy các hệ thống đề xuất hoạt động tốt cho mình. Tôi đã thử nhiều hệ thống và lý do tôi quyết định bắt đầu sử dụng LLMs là vì tôi đã hết lựa chọn... và sau khi thử, tôi thực sự thích các đề xuất được đưa ra hơn.
Quan điểm này đã nhận được sự đồng tình từ nhiều người dùng, những người bày tỏ sự thất vọng với các công cụ đề xuất thông thường, lưu ý rằng LLMs có thể hiểu được những kết nối tinh tế giữa các nội dung mà các thuật toán đơn giản hơn có thể bỏ qua.
Hạn chế về thời điểm cắt dữ liệu kiến thức
Một mối quan ngại đáng kể được nêu ra trong cuộc thảo luận cộng đồng là giới hạn về thời điểm cắt dữ liệu kiến thức vốn có trong LLMs. Vì các mô hình này được đào tạo trên dữ liệu đến một thời điểm nhất định, chúng có thể không biết về các chương trình hoặc phim mới hơn được phát hành sau ngày cắt dữ liệu đào tạo. Điều này tạo ra một điểm mù tiềm ẩn trong các đề xuất, đặc biệt là đối với nội dung mới phát hành gần đây.
Nhà phát triển đã thừa nhận giới hạn này, giải thích rằng mặc dù các mô hình có thể có một số nhận thức về các chương trình sắp ra mắt trong thời gian đào tạo của chúng, việc đề xuất các bản phát hành rất gần đây có thể là điểm yếu của hệ thống. Điều này tạo ra một sự đánh đổi thú vị: khả năng hiểu ngữ cảnh và ngôn ngữ tự nhiên của LLMs so với khả năng của hệ thống đề xuất truyền thống trong việc kết hợp các bản phát hành mới nhất thông qua cập nhật cơ sở dữ liệu.
Các phương pháp thay thế và tích hợp
Một số thành viên cộng đồng đã đề xuất các phương pháp thay thế để nâng cao hệ thống đề xuất. Một đề xuất đáng chú ý là sử dụng embeddings cho việc phân cụm thay vì chỉ dựa vào LLMs. Embeddings có thể cung cấp một giải pháp nhẹ hơn, hoạt động tốt với tài liệu mới bằng cách đặt nội dung đa phương tiện trong không gian đa chiều, nơi độ tương đồng có thể được đo lường theo toán học thay vì thông qua hiểu biết ngôn ngữ tự nhiên.
Tích hợp với Trakt.tv là một đề xuất phổ biến khác, với người dùng chỉ ra rằng dịch vụ này đã tích hợp với các máy chủ đa phương tiện như Emby, Jellyfin và Plex cho nhiều người dùng. Cuộc thảo luận nhấn mạnh mối quan ngại về cách hệ thống sẽ xử lý các thư viện cực kỳ lớn, với một số người dùng đề cập đến bộ sưu tập hơn 30.000 bộ phim. Nhà phát triển lưu ý rằng các thư viện lớn như vậy có thể sẽ chạm đến giới hạn token đầu vào cho LLMs, đề xuất phương pháp lấy mẫu như một giải pháp tiềm năng.
Thách thức với hộ gia đình nhiều người dùng
Một chủ đề lặp lại trong các bình luận là thách thức trong việc phân biệt giữa sở thích của các thành viên khác nhau trong gia đình. Nhiều người dùng chia sẻ máy chủ đa phương tiện của họ với các thành viên gia đình có sở thích khác nhau, làm cho các đề xuất thống nhất ít hữu ích hơn. Các thành viên cộng đồng đề xuất tích hợp với các dịch vụ như Tautulli và Overseerr để cho phép đề xuất theo từng người dùng dựa trên mẫu xem riêng lẻ thay vì thư viện kết hợp.
Nhà phát triển đã thừa nhận giới hạn này và đề cập rằng việc tích hợp Tautulli đã được thử nhưng gặp khó khăn. Điều này làm nổi bật một trong những lĩnh vực chính mà hệ thống đề xuất truyền thống với hồ sơ người dùng rõ ràng vẫn có thể có lợi thế so với việc triển khai hiện tại của các đề xuất dựa trên LLM.
Các tính năng chính của Recommendarr
- Đề xuất được hỗ trợ bởi AI sử dụng LLMs
- Tích hợp với Sonarr & Radarr cho phim truyền hình và phim điện ảnh
- Tích hợp với Plex & Jellyfin để phân tích lịch sử xem
- Hỗ trợ AI linh hoạt (API OpenAI hoặc các giải pháp thay thế tương thích)
- Hỗ trợ Docker để triển khai dễ dàng
- Tập trung vào quyền riêng tư (thông tin đăng nhập được lưu trữ trong bộ nhớ cục bộ của trình duyệt)
- Tùy chọn giao diện Tối/Sáng
Cải tiến được cộng đồng đề xuất
- Đề xuất theo từng người dùng cho các hộ gia đình có nhiều người dùng
- Tích hợp Trakt.tv để theo dõi lịch sử xem tốt hơn
- Phân cụm dựa trên embedding như một giải pháp thay thế cho LLMs
- Tích hợp Lidarr cho đề xuất âm nhạc
- Giải pháp để xử lý thư viện phương tiện rất lớn (hơn 30 nghìn mục)
Tiềm năng đề xuất âm nhạc
Một số người dùng bày tỏ sự quan tâm đến việc mở rộng khái niệm này cho các đề xuất âm nhạc, đề xuất tích hợp với Lidarr (một trình quản lý bộ sưu tập âm nhạc tương tự như Sonarr và Radarr). Một người dùng đã chia sẻ kinh nghiệm sử dụng một script để xuất thư viện âm nhạc của họ cho phân tích LLM, lưu ý rằng mặc dù không hoàn hảo, nó đã cung cấp các đề xuất thú vị. Thách thức khi LLMs đề xuất các mục đã có trong thư viện của người dùng đã được đề cập, với một giải pháp đơn giản nhưng hiệu quả là hướng dẫn rõ ràng cho mô hình không lặp lại các mục từ danh sách ban đầu.
Khi việc tiêu thụ nội dung đa phương tiện tiếp tục tăng trưởng trên nhiều nền tảng và định dạng, các công cụ như Recommendarr đại diện cho một khám phá thú vị về cách AI có thể nâng cao việc khám phá nội dung. Trong khi các hệ thống đề xuất truyền thống đã được tinh chỉnh qua nhiều thập kỷ, việc áp dụng LLMs vào lĩnh vực này mang đến một cách tiếp cận mới có thể nắm bắt tốt hơn các mối quan hệ tinh tế giữa các nội dung đa phương tiện khác nhau. Cuộc thảo luận đang diễn ra làm nổi bật cả tiềm năng và hạn chế của phương pháp này, gợi ý rằng hệ thống đề xuất lý tưởng trong tương lai có thể kết hợp các yếu tố của cả thuật toán truyền thống và hiểu biết ngôn ngữ tự nhiên được hỗ trợ bởi AI.
Tham khảo: Recommendarr: Hệ thống đề xuất dựa trên AI dựa trên thông tin thư viện Radarr và Sonarr