Cộng đồng nghiên cứu AI đã phản ứng với sự hoài nghi đáng kể đối với một dự án được công bố gần đây có tên là Neural Graffiti, dự án tuyên bố cho phép sửa đổi hành vi của mô hình ngôn ngữ lớn theo thời gian thực thông qua cách tiếp cận mà người sáng tạo mô tả là neuroplastic (khả năng thích ứng thần kinh). Dự án này, được cho là cho phép uốn cong trực tiếp các mô hình nền tảng ở cấp độ mạng nơ-ron, đã nhận được chỉ trích vì có thể đã phóng đại tính mới mẻ và hiệu quả của nó.
Tái chế thay vì đổi mới
Nhiều người bình luận đã chỉ ra rằng khái niệm cốt lõi đằng sau Neural Graffiti dường như chỉ là việc đổi tên của các kỹ thuật đã tồn tại. Phương pháp này, liên quan đến việc đưa một vector vào lớp ẩn cuối cùng của mô hình transformer để ảnh hưởng đến đầu ra, có sự giống nhau mạnh mẽ với các phương pháp đã được thiết lập như control vectors. Điều này đã dẫn đến sự thất vọng trong số các chuyên gia AI, những người xem đây là một phần của xu hướng đáng lo ngại trong lĩnh vực này.
Tuyệt, ai đó đã tái phát minh control vectors. Ngành công nghiệp này cần ngừng tái phát minh mọi thứ cứ 6 tháng một lần.
Dự án tự mô tả mình được lấy cảm hứng từ nghệ thuật graffiti và bản chất khả năng thích ứng thần kinh của bộ não sống, ngôn ngữ mà một số thành viên cộng đồng cho là không cần thiết hoa mỹ và có thể gây hiểu lầm. Các nhà phê bình cho rằng việc sử dụng thuật ngữ như vậy che giấu sự đơn giản về kỹ thuật của những gì đang được đề xuất - về cơ bản là một trung bình động mũ trên một chuỗi vector được áp dụng ở lớp cuối cùng của mô hình.
Triển khai kỹ thuật đáng ngờ
Phân tích kỹ thuật từ cộng đồng làm dấy lên nghi ngờ về chi tiết triển khai. Theo những người bình luận đã kiểm tra mã, bản đồ tuyến tính được sử dụng trong phương pháp này được khởi tạo ngẫu nhiên mà không có đào tạo thích hợp, điều này có thể ngăn cản nó hoạt động như mô tả. Quan sát này được hỗ trợ bởi báo cáo từ người dùng đã thử nghiệm bản demo và không tìm thấy bằng chứng nào cho thấy hệ thống thực sự giữ lại các khái niệm như đã tuyên bố.
Một người dùng báo cáo rằng sau khi liên tục nói với mô hình rằng họ yêu mèo, khi được hỏi về động vật yêu thích, mô hình tiếp tục trả lời với ong mật và bạch tuộc, không cho thấy dấu hiệu của hiệu ứng ghi nhớ đã hứa. Điều này cho thấy rằng tác động thực tế của Spray Layer có thể là tối thiểu hoặc không tồn tại trong thực tế.
Phạm vi và tiềm năng hạn chế
Ngay cả khi phương pháp hoạt động như mô tả, một số chuyên gia đặt câu hỏi liệu việc chỉ sửa đổi lớp ẩn cuối cùng có thể thay đổi một cách có ý nghĩa cách mô hình suy nghĩ theo bất kỳ cách thức đáng kể nào hay không. Dự án tuyên bố có thể đi dây lại cách nhìn nhận thế giới của nó và ảnh hưởng đến cách nó liên kết các khái niệm, nhưng việc triển khai kỹ thuật dường như quá hạn chế để đạt được những mục tiêu đầy tham vọng như vậy.
Cuộc thảo luận của cộng đồng cũng nhấn mạnh rằng nếu hệ thống hoạt động, về cơ bản nó sẽ hoạt động như một phiên bản sơ khai, chưa được đào tạo đầy đủ của các kỹ thuật như LoRA (Low-Rank Adaptation), nhưng với ít sự tinh tế và hiệu quả hơn nhiều. Điều này đặt ra câu hỏi về tính hữu ích thực tế của phương pháp này ngoài việc khám phá khái niệm.
Những chỉ trích chính về Neural Graffiti
- Thiếu tính mới: Dường như chỉ tái tạo các kỹ thuật hiện có như các vector điều khiển
- Lo ngại về triển khai: Khởi tạo ngẫu nhiên các trọng số mà không có quá trình đào tạo phù hợp
- Bằng chứng hạn chế: Người dùng báo cáo không quan sát thấy hiệu ứng bộ nhớ trong quá trình kiểm tra
- Hạn chế kỹ thuật: Việc chỉ sửa đổi ở lớp ẩn cuối cùng khó có thể tạo ra các hiệu ứng như đã tuyên bố
- Ngôn ngữ tiếp thị: Việc sử dụng các thuật ngữ như "neuroplastic" và "graffiti" được xem là sự phóng đại không cần thiết
- Thiếu các tiêu chuẩn đánh giá: Không cung cấp dữ liệu so sánh hoặc các chỉ số hiệu suất
Bối cảnh rộng hơn: Mối lo ngại về hype trong AI
Dự án Neural Graffiti xuất hiện trong bối cảnh ngày càng lo ngại về hype và ngôn ngữ marketing trong nghiên cứu AI. Các thành viên cộng đồng bày tỏ sự mệt mỏi với điều mà họ coi là việc đổi thương hiệu không cần thiết của các kỹ thuật hiện có với những cái tên và đồ họa bắt mắt, kèm theo những tuyên bố hoành tráng không được hỗ trợ bởi bằng chứng thực nghiệm.
Cuộc thảo luận này kết nối với những quan sát rộng hơn về những thay đổi trong các hệ thống AI thương mại. Một số người dùng đã lưu ý những thay đổi gần đây trong hành vi của ChatGPT hướng tới các phản hồi xu nịnh hơn, suy đoán liệu các kỹ thuật tương tự để sửa đổi hành vi mô hình có thể được sử dụng bởi các công ty AI lớn để định hình trải nghiệm người dùng, thường theo cách ưu tiên sự tương tác hơn là tính hữu ích.
Khi lĩnh vực AI tiếp tục phát triển nhanh chóng, phản ứng của cộng đồng đối với Neural Graffiti nhấn mạnh tầm quan trọng của việc chứng minh các tuyên bố bằng bằng chứng, thừa nhận công việc trước đây, và duy trì độ chính xác kỹ thuật trong giao tiếp - những giá trị dường như ngày càng mâu thuẫn với nền kinh tế chú ý đang thúc đẩy phần lớn sự phát triển AI.
Tham khảo: neuralgraffiti