Letta, nền tảng mã nguồn mở trước đây được biết đến với tên gọi MemGPT, đang nhận được sự chú ý cho các ứng dụng tiềm năng ngoài các trường hợp sử dụng AI thông thường. Các cuộc thảo luận cộng đồng cho thấy cách thức nền tảng tác nhân có trạng thái này có thể cung cấp hỗ trợ có ý nghĩa cho người cao tuổi gặp vấn đề về trí nhớ, trong khi các nhà phát triển đang tích cực làm việc trên các tính năng mới bao gồm tích hợp giọng nói và khả năng tương thích với MCP.
![]() |
---|
Logo hiện đại đại diện cho Letta, một framework mã nguồn mở sáng tạo nhằm nâng cao hỗ trợ trí nhớ cho người dùng |
Tích hợp giọng nói để hỗ trợ trí nhớ
Một trong những cuộc thảo luận hấp dẫn nhất xoay quanh Letta liên quan đến ứng dụng tiềm năng của nó như một công nghệ hỗ trợ cho người cao tuổi đang trải qua suy giảm trí nhớ. Một thành viên cộng đồng đã chia sẻ câu chuyện cá nhân về người cha của họ, người mà mặc dù vẫn duy trì được khả năng hoạt động như vận hành thiết bị nông nghiệp và thực hiện các phép tính toán, nhưng ngày càng gặp khó khăn với trí nhớ ngắn hạn - hỏi cùng một câu hỏi lặp đi lặp lại và quên các sự kiện gần đây.
Để đáp lại, đội ngũ phát triển của Letta đã xác nhận họ đang làm việc trên tích hợp giọng nói độ trễ thấp, điều này sẽ cho phép chế độ giọng nói nâng cao với khả năng ghi nhớ dài hạn. Điều này sẽ cho phép người dùng tạo ra các tác nhân có trạng thái được thiết kế đặc biệt để ghi lại ký ức và giúp gợi nhớ về các sự kiện, cuộc trò chuyện và hoạt động hàng ngày của một người.
Trợ lý trí nhớ hỗ trợ giọng nói sẽ hoạt động như một nhật ký hàng ngày, nơi người dùng có thể ghi âm các sự kiện bằng lời nói và sau đó truy xuất thông tin đó thông qua cuộc trò chuyện tự nhiên. Tất cả dữ liệu trí nhớ và trạng thái sẽ được lưu trữ trong PostgreSQL, có khả năng truy cập thông qua các ứng dụng khác như ứng dụng di động để duyệt qua các ký ức.
Tích hợp MCP đang được phát triển
Một phát triển quan trọng khác là việc Letta sắp tích hợp với Model Context Protocol (MCP). Nhóm Letta đã xác nhận họ đang làm việc để làm cho các tác nhân Letta hoạt động như các máy khách MCP, cho phép chúng dễ dàng kết nối với các máy chủ MCP như các công cụ. Tích hợp này dự kiến sẽ ra mắt trong vòng một tuần, theo bình luận của một nhà phát triển.
MCP gần đây đã đạt được sự chú ý đáng kể trong cộng đồng AI, với một số người mô tả nó đã đạt đến khối lượng tới hạn sau nhiều tháng tích lũy động lực. Giao thức này về cơ bản hoạt động như một kho lưu trữ các công cụ mà các tác nhân AI có thể truy cập, tương tự như các bộ sưu tập công cụ có sẵn như Composio.
Có lẽ mọi người đang hào hứng về triển vọng giải quyết vấn đề này để chúng ta có thể tập trung nhiều hơn vào việc làm cho các tác nhân hoạt động thay vì tất cả đều phải triển khai lại các bộ thu thập/phân tích dữ liệu giống nhau.
Việc tích hợp sẽ cho phép người dùng Letta tận dụng các công cụ bổ sung đang được phát triển cho hệ sinh thái MCP, có khả năng mở rộng các khả năng của tác nhân của họ mà không cần phải xây dựng lại các thành phần phổ biến.
Các Tính Năng Chính của Letta và Tùy Chọn Triển Khai
Phương thức cài đặt | Lệnh khởi động máy chủ | Cơ sở dữ liệu | Hỗ trợ di chuyển dữ liệu |
---|---|---|---|
pip install letta | letta server | SQLite | Không |
pip install letta | export LETTA_PG_URI=... + letta server | PostgreSQL | Có |
Cài đặt Docker | docker run ... (lệnh đầy đủ) | PostgreSQL | Có |
Lưu ý: Phương thức triển khai được khuyến nghị là thông qua Docker với PostgreSQL để hỗ trợ đầy đủ việc di chuyển dữ liệu giữa các phiên bản.
Thay đổi tên gọi và sự phát triển của nền tảng
Cộng đồng cũng lưu ý rằng Letta trước đây được biết đến với tên gọi MemGPT, được phát triển bởi một nhóm từ Berkeley. Một số người dùng thấy thú vị khi tên mới có sự tương đồng với Lethe, con sông quên lãng trong thần thoại Hy Lạp - một kết nối mỉa mai cho một nền tảng tập trung vào việc tăng cường trí nhớ.
Quan sát này đã làm dấy lên một cuộc thảo luận phụ thú vị về ngôn ngữ học và từ nguyên của các từ liên quan đến trí nhớ và nhân loại trong các ngôn ngữ khác nhau, bao gồm cả gốc tiếng Ả Rập cho các từ có nghĩa là con người và sự quên lãng.
Khi Letta tiếp tục phát triển, bản chất mã nguồn mở của nó (với sự đóng góp từ hơn một trăm nhà phát triển) và tập trung vào khả năng tác nhân có trạng thái đặt nó như một nền tảng đa năng cho các ứng dụng từ trợ lý cá nhân đến các công cụ hỗ trợ trí nhớ chuyên biệt. Khả năng duy trì bộ nhớ liên tục vượt quá giới hạn cửa sổ ngữ cảnh của LLM cho phép các tương tác tự nhiên, liên tục hơn, điều này có thể đặc biệt có giá trị trong bối cảnh công nghệ hỗ trợ.
Tham khảo: Letta: Một nền tảng tác nhân có trạng thái với bộ nhớ, lý luận và quản lý ngữ cảnh