Việc ByteDance gần đây phát hành Monolith, một framework học sâu dành cho mô hình hóa đề xuất quy mô lớn, đã tạo ra nhiều cuộc thảo luận sôi nổi trong cộng đồng công nghệ về mối liên hệ của nó với thuật toán đề xuất nổi tiếng của TikTok. Tuy nhiên, qua phân tích kỹ lưỡng cho thấy phiên bản mã nguồn mở này không phải là công nghệ cốt lõi đằng sau sự thành công của TikTok.
Framework và Thuật toán
Mặc dù Monolith cung cấp cơ sở hạ tầng để vận hành và huấn luyện các mô hình đề xuất phân tán, có vẻ như nó chủ yếu nhắm vào giải pháp hệ thống đề xuất thương mại BytePlus của ByteDance, thay vì công nghệ cốt lõi của TikTok. Framework này bao gồm các tính năng như bảng nhúng không xung đột và khả năng huấn luyện thời gian thực, nhưng logic đề xuất thực tế chỉ giới hạn ở một triển khai demo cơ bản.
Các tính năng chính của Framework:
- Bảng nhúng không xung đột
- Hỗ trợ huấn luyện thời gian thực
- Được xây dựng trên nền tảng TensorFlow
- Hỗ trợ huấn luyện và triển khai theo lô/thời gian thực
- Chỉ hỗ trợ biên dịch trên Linux
Bối cảnh Pháp lý và Chiến lược
Luật pháp Trung Quốc cấm xuất khẩu các hệ thống đề xuất, khiến việc ByteDance công bố thuật toán thực tế của TikTok là điều khó có thể xảy ra. Như một thành viên cộng đồng đã nhận xét:
Đây về cơ bản là framework để thực thi hệ thống đề xuất của họ nhưng phần thực sự quyết định việc đề xuất là một mô hình được gọi là demo nên tôi cho rằng đây không phải là mô hình ML thực tế họ sử dụng trong sản phẩm.
Lợi thế cạnh tranh thực sự của TikTok
Phân tích từ cộng đồng cho thấy thành công của TikTok có thể bắt nguồn từ cách tiếp cận độc đáo trong việc mô hình hóa sở thích người dùng. Không giống như đề xuất dựa trên đồ thị xã hội của Meta, TikTok tập trung vào biểu diễn sở thích người dùng theo thời gian, theo dõi nội dung mà người dùng tương tác trực tiếp thay vì dựa vào các kết nối xã hội. Cách tiếp cận này, kết hợp với thiết kế giao diện tạo ra các tín hiệu tương tác rõ ràng, tạo nên một hệ thống đề xuất hiệu quả hơn.
Yếu tố Con người trong Quản lý Nội dung
Ngoài thuật toán, việc phân phối nội dung của TikTok còn có sự tham gia đáng kể của con người trong việc quản lý. Yếu tố con người này giúp đảm bảo trải nghiệm người dùng chất lượng nhưng cũng đặt ra các câu hỏi về việc quảng bá nội dung và khả năng thao túng. Sự kết hợp giữa thuật toán và quản lý nội dung thủ công tạo nên một hệ thống phức tạp không thể quy về một framework mã nguồn mở đơn lẻ.
Tóm lại, mặc dù Monolith cung cấp những hiểu biết quý giá về năng lực kỹ thuật của ByteDance, nó chỉ đại diện cho một thành phần trong một hệ sinh thái đề xuất lớn hơn và phức tạp hơn nhiều. Sức mạnh thực sự của hệ thống đề xuất TikTok có thể nằm ở sự kết hợp giữa thuật toán tiên tiến, thiết kế tương tác người dùng và quản lý nội dung thủ công, phần lớn trong số đó vẫn là độc quyền.
Tham khảo: Monolith: A Deep Learning Framework for Large Scale Recommendation Modeling