Cộng đồng công nghệ đang sôi nổi thảo luận về một prompt hệ thống bị rò rỉ từ trợ lý AI Claude của Anthropic, tiết lộ những hướng dẫn chi tiết định hướng hành vi của nó. Tài liệu này, được báo cáo dài hơn 24.000 token, cung cấp cái nhìn chưa từng có về cách các trợ lý mô hình ngôn ngữ lớn (LLM) được hướng dẫn để tương tác với người dùng.
Prompt Hệ Thống Khổng Lồ
Prompt hệ thống bị rò rỉ của Claude kéo dài hơn 24.000 token, chiếm một phần đáng kể trong cửa sổ ngữ cảnh của AI. Bộ hướng dẫn mở rộng này bao gồm mọi thứ từ cách phản hồi các loại truy vấn khác nhau đến hướng dẫn cụ thể để xử lý các chủ đề nhạy cảm. Prompt bao gồm hướng dẫn chi tiết về định dạng phản hồi, sử dụng markdown, cung cấp ví dụ mã và thậm chí xử lý các tình huống giả định.
Nhiều thành viên cộng đồng bày tỏ sự ngạc nhiên về kích thước khổng lồ của prompt hệ thống. Tài liệu chứa nhiều hướng dẫn cụ thể, bao gồm cách xử lý các thang ưu tiên khác nhau (từ 1-10), hướng dẫn định dạng phản hồi chi tiết, và thậm chí các ví dụ cụ thể về cách trả lời các câu hỏi phổ biến.
Trời, quá nhiều không gian cửa sổ ngữ cảnh bị lãng phí cho những thứ chỉ cải thiện trải nghiệm người dùng một cách tối thiểu.
Các thành phần chính trong System Prompt của Claude:
- Thang ưu tiên (1-10) xác định phong cách và độ sâu của phản hồi
- Hướng dẫn định dạng phản hồi sử dụng markdown
- Nguyên tắc tương tác với công cụ và nguồn kiến thức
- Hướng dẫn đạo đức cho việc tạo nội dung
- Hướng dẫn xử lý các chủ đề chính trị, tài chính, pháp lý và y tế
- Các ví dụ cụ thể cho các loại truy vấn phổ biến
- Hướng dẫn trích dẫn và tránh vi phạm bản quyền
Những lo ngại của cộng đồng:
- Hiệu quả của cửa sổ ngữ cảnh (24K token được sử dụng cho hướng dẫn)
- Tác động đến quyền riêng tư khi sử dụng công cụ
- Tính nhất quán trong việc tuân theo hướng dẫn của người dùng
- Cân bằng giữa hướng dẫn rõ ràng và hành vi đã học
Kỹ Thuật Token Caching
Mặc dù có lo ngại về độ dài của prompt chiếm dụng không gian cửa sổ ngữ cảnh quý giá, một số người bình luận chỉ ra rằng Anthropic có thể sử dụng các kỹ thuật lưu trữ token để giảm thiểu vấn đề này. Phương pháp này cho phép hệ thống tránh phải xử lý lại toàn bộ prompt trong mỗi tương tác với người dùng.
Một người bình luận đã dẫn liên kết đến tài liệu của Anthropic về lưu trữ prompt, giải thích rằng kỹ thuật này đã được sử dụng rộng rãi. Những người khác đề cập đến KV (key-value) prefix caching như phương pháp cụ thể được sử dụng. Những kỹ thuật này cho phép AI duy trì hành vi được hướng dẫn mà không ảnh hưởng đến hiệu suất hoặc không gian ngữ cảnh cho các tương tác với người dùng.
Tính Cách và Hành Vi của Claude
Prompt hệ thống cung cấp những hiểu biết thú vị về cách tính cách và hành vi của Claude được thiết kế. Một số người dùng tự hỏi bao nhiêu phần trong tính cách đặc trưng của Claude đến từ prompt hệ thống so với LLM cơ bản và quá trình đào tạo của nó. Prompt đề cập đến Claude ở ngôi thứ ba, mô tả nó như một trợ lý thích giúp đỡ con người và xem vai trò của mình là một trợ lý thông minh và tốt bụng cho mọi người, với chiều sâu và sự khôn ngoan làm cho nó trở thành hơn cả một công cụ đơn thuần.
Cách tiếp cận này để xác định nhân cách của AI đặt ra câu hỏi liệu các nhân cách tương tự có thể được áp dụng cho các LLM khác bằng cách sử dụng các prompt tương tự - về cơ bản là tạo ra một chế độ Claude cho các mô hình khác.
Sử Dụng Công Cụ và Gọi Hàm
Prompt bị rò rỉ chứa hướng dẫn mở rộng về cách Claude nên sử dụng các công cụ và lệnh gọi hàm khác nhau. Một số người dùng lưu ý rằng những hướng dẫn này bao gồm các ví dụ về công cụ có thể truy cập dữ liệu người dùng, chẳng hạn như hồ sơ email và tài liệu Google Drive, làm dấy lên lo ngại về quyền riêng tư.
Một ví dụ trong prompt cho thấy Claude được hướng dẫn tìm hiểu nơi bạn làm việc bằng cách đọc hồ sơ Gmail của bạn khi phân tích các chiến lược đầu tư bị ảnh hưởng bởi hạn chế xuất khẩu chất bán dẫn. Mặc dù đây là phản hồi cho một truy vấn mơ hồ sử dụng chiến lược đầu tư của chúng ta, một số người dùng đặt câu hỏi liệu việc truy cập như vậy luôn có sự đồng ý rõ ràng từ người dùng hay không.
Các thành viên cộng đồng khác đề cập đến việc vô hiệu hóa tiện ích mở rộng và công cụ trong Claude vì họ nhận thấy rằng việc gọi hàm làm giảm hiệu suất của mô hình trong các tác vụ như lập trình. Cuộc thảo luận nhấn mạnh sự đánh đổi giữa khả năng nâng cao thông qua việc sử dụng công cụ và duy trì hiệu suất cốt lõi.
Tuân Thủ Hướng Dẫn
Một số người dùng bày tỏ sự thất vọng rằng mặc dù có prompt hệ thống mở rộng, Claude không phải lúc nào cũng tuân theo hướng dẫn của người dùng một cách nhất quán. Một người bình luận lưu ý rằng khi làm việc trên các dự án lập trình, Claude thường bỏ qua các chỉ dẫn cụ thể, chẳng hạn như cung cấp mã hoàn chỉnh mà không có đoạn mã nhỏ hoặc tránh tối ưu hóa và cấu trúc lại không được yêu cầu.
Nhận xét này cho thấy rằng ngay cả với các prompt hệ thống chi tiết, các LLM vẫn gặp khó khăn trong việc tuân theo hướng dẫn của người dùng một cách nhất quán, đặc biệt là trong các tác vụ phức tạp, nhiều bước như phát triển phần mềm.
Hướng Dẫn Ẩn Bổ Sung
Một người dùng báo cáo rằng Claude đôi khi tiết lộ các hướng dẫn hệ thống bổ sung trong quá trình tương tác, đặc biệt là sau khi sử dụng công cụ tìm kiếm. Những hướng dẫn này bao gồm nhắc nhở về việc không sao chép lời bài hát do bản quyền, tránh ảo giác, tương tác với các giả định một cách phù hợp và duy trì trung lập chính trị.
Những cái nhìn thoáng qua này cho thấy rằng prompt hệ thống đầy đủ có thể còn rộng lớn hơn những gì đã bị rò rỉ, với các lời nhắc ngữ cảnh bổ sung được kích hoạt trong các tình huống cụ thể.
Việc rò rỉ prompt hệ thống của Claude cung cấp một cửa sổ hiếm hoi vào công nghệ phức tạp đằng sau các trợ lý AI hiện đại. Trong khi một số người dùng bày tỏ sự thất vọng rằng nhiều hành vi của AI đến từ các hướng dẫn rõ ràng hơn là trí thông minh mới nổi, những người khác đánh giá cao tính minh bạch và hiểu biết sâu sắc về cách các hệ thống này được thiết kế để tương tác với con người.
Tham khảo: system_prompts/priority_scale.txt