Cộng đồng trí tuệ nhân tạo đang tham gia vào một cuộc tranh luận sôi nổi về bản chất của sự hiểu biết trong các Mô hình Ngôn ngữ Lớn ( LLM ), được châm ngòi bởi nghiên cứu gần đây của MIT về khả năng định hướng của AI. Mặc dù các mô hình này thể hiện hiệu suất ấn tượng trong các tác vụ cụ thể, cuộc thảo luận đã làm nổi bật những câu hỏi sâu sắc hơn về những gì tạo nên trí thông minh và sự hiểu biết thực sự trong các hệ thống AI.
Tranh luận về Nhận dạng Mẫu và Sự Hiểu biết
Một phần đáng kể trong cộng đồng nhấn mạnh sự khác biệt giữa việc nhận dạng mẫu và sự hiểu biết thực sự. Cuộc thảo luận chỉ ra cách LLM có thể thực hiện các tác vụ phức tạp như cung cấp chỉ đường chi tiết hoặc chơi các trò chơi chiến thuật mà không cần phát triển một mô hình nội tại mạch lạc về cách các hệ thống này thực sự hoạt động. Hạn chế này trở nên rõ ràng khi các mô hình đối mặt với những thay đổi nhỏ trong môi trường hoạt động của chúng, chẳng hạn như việc đóng đường trong các tác vụ định hướng.
LLM trong hình thức hiện tại dường như giống như tư duy trực giác, giống như những gì chúng ta sử dụng khi trò chuyện với bạn bè trong quán bia. Có vẻ như đây chỉ là một phần của bộ não AI trong tương lai, vẫn cần một hệ thống khác để duy trì mô hình thế giới, một hệ thống khác để lập kế hoạch nền, v.v.
Những phát hiện nghiên cứu chính:
- Độ chính xác trong điều hướng giảm từ 100% xuống 67% chỉ với 1% đường phố bị đóng
- Các mô hình tạo ra bản đồ nội bộ không chính xác với các kết nối đường phố không tồn tại
- Dữ liệu huấn luyện ngẫu nhiên tạo ra các mô hình thế giới tốt hơn so với huấn luyện có chiến lược
- Các mô hình có thể đạt hiệu suất cao mà không cần hiểu các quy tắc cơ bản
Tranh cãi về Thuật ngữ AI
Cộng đồng bày tỏ sự thất vọng về việc thuật ngữ AI được áp dụng cho công nghệ LLM hiện tại. Nhiều người cho rằng mặc dù những mô hình này ấn tượng trong các tác vụ cụ thể, chúng vẫn chưa đạt được những gì truyền thống được coi là trí tuệ nhân tạo. Cuộc tranh luận về ngữ nghĩa này phản ánh mối quan tâm rộng lớn hơn về nhận thức và kỳ vọng của công chúng đối với công nghệ AI, với một số người chỉ ra rằng lịch sử 70 năm của lĩnh vực này bao gồm nhiều thứ hơn là chỉ các mô hình ngôn ngữ.
Trí thông minh Sinh học và Học máy
Một điểm tương đồng thú vị xuất hiện trong các cuộc thảo luận so sánh nhận thức của con người với học máy. Các thành viên cộng đồng chỉ ra rằng ngay cả động vật và trẻ nhỏ cũng sở hữu các khái niệm cơ bản như tính bền vững của vật thể mà LLM hiện tại còn thiếu. Điều này làm nổi bật khoảng cách quan trọng giữa trí thông minh sinh học và khả năng AI hiện tại, đặc biệt là trong các lĩnh vực đòi hỏi sự hiểu biết về thế giới vật lý như hóa học và các vấn đề cơ học.
Hiệu quả về Tài nguyên và Học tập
Cộng đồng cũng thảo luận về yêu cầu tài nguyên của LLM so với trí thông minh sinh học. Trong khi con người học ngôn ngữ và hiểu biết về thế giới thông qua đầu vào cảm giác hạn chế và tiêu thụ năng lượng (khoảng 20W năng lượng não), LLM cần tài nguyên tính toán và năng lượng khổng lồ để đạt được khả năng của chúng. Sự so sánh này đặt ra câu hỏi về hiệu quả và tính bền vững của các phương pháp AI hiện tại.
Cuộc thảo luận đang diễn ra cho thấy mặc dù LLM đại diện cho một thành tựu công nghệ đáng kể, chúng vẫn thiếu các khía cạnh quan trọng của sự hiểu biết thực sự mà con người và thậm chí cả các hệ thống sinh học đơn giản đều có. Nhận định này gợi ý rằng sự phát triển AI trong tương lai có thể cần kết hợp các phương pháp khác nhau để đạt được sự hiểu biết thực sự về thế giới.
Nguồn trích dẫn: Mặc dù có đầu ra ấn tượng, AI tạo sinh không có sự hiểu biết mạch lạc về thế giới