Thư viện đã mất của Google: Cách HathiTrust và các tổ chức khác lấp đầy khoảng trống sách số

BigGo Editorial Team
Thư viện đã mất của Google: Cách HathiTrust và các tổ chức khác lấp đầy khoảng trống sách số

Năm 2011, dự án đầy tham vọng của Google nhằm số hóa 25 triệu cuốn sách và cung cấp cho công chúng đã vấp phải rào cản pháp lý, để lại một kho lưu trữ số khổng lồ bị khóa khỏi quyền truy cập công cộng. Tuy nhiên, cộng đồng công nghệ đã tìm ra những con đường thay thế để bảo tồn và truy cập sách số, với nhiều tổ chức đứng ra lấp đầy khoảng trống này.

HathiTrust nổi lên như một giải pháp thay thế quan trọng

HathiTrust , được thành lập bởi các thư viện học thuật tham gia vào những nỗ lực số hóa sách ban đầu, đã trở thành kho lưu trữ quan trọng cho nhiều cuốn sách mà Google đã quét. Theo thảo luận của cộng đồng, HathiTrust mang lại một số ưu điểm:

  • Quyền truy cập tốt hơn vào tài liệu thuộc phạm vi công cộng so với chế độ xem đoạn trích của Google Books
  • Đặc quyền truy cập dành cho sinh viên và nhà nghiên cứu tại các tổ chức thành viên
  • Xử lý cẩn thận các vấn đề bản quyền trong khi vẫn duy trì khả năng truy cập rộng rãi
  • Tích hợp với các nguồn tài nguyên máy tính học thuật phục vụ mục đích nghiên cứu

Nỗ lực bảo tồn số của Thư viện Quốc hội

Các cựu nhân viên của Thư viện Quốc hội đã chia sẻ những hiểu biết sâu sắc về sự phức tạp của các dự án bảo tồn số. Dự án Bảo tồn Số của họ, có từ năm 2001-2003, đã cho thấy một số thách thức:

  • Bảo tồn các định dạng phương tiện đa dạng, từ phim động đầu tiên của Edison đến bản ghi âm ngày D-Day
  • Các vấn đề quản lý quyền phức tạp
  • Thách thức kỹ thuật trong việc duy trì và lập tài liệu cho phần cứng số hóa
  • Tầm quan trọng của việc bảo tồn không chỉ nội dung mà còn cả các tài liệu liên quan như bìa album và chú thích

Tranh cãi về Internet Archive

Các cuộc thảo luận gần đây nhấn mạnh căng thẳng đang diễn ra giữa bảo tồn số và luật bản quyền. Cách tiếp cận cho mượn số của Internet Archive trong đại dịch đã làm dấy lên tranh luận đáng kể, với nhiều người cho rằng lập trường quyết liệt của họ có thể:

  • Tạo ra những bước lùi dài hạn cho các sáng kiến thư viện số
  • Có khả năng gây tổn hại đến triển vọng của các dự án bảo tồn số trong tương lai
  • Dẫn đến những thách thức pháp lý có thể ảnh hưởng đến các nỗ lực thư viện số khác

Tầm nhìn ban đầu của Larry Page

Thú vị là dự án số hóa sách của Google có nguồn gốc sâu xa từ khởi đầu của công ty. Dự án sinh viên năm 1996 của Larry Page , sau này trở thành Google , ban đầu được hình thành như một phần của nỗ lực tạo ra thư viện số toàn cầu. Dự án nhằm mục đích:

  • Lập bản đồ trích dẫn giữa các cuốn sách
  • Phân tích những cuốn sách được trích dẫn nhiều nhất
  • Cải thiện kết quả tìm kiếm thư viện bằng dữ liệu này
  • Có khả năng phục vụ như dữ liệu huấn luyện cho các mô hình ngôn ngữ ban đầu

Hiện trạng và triển vọng tương lai

Mặc dù tầm nhìn ban đầu của Google vẫn chưa thực hiện được, nhiều sáng kiến vẫn tiếp tục hướng tới bảo tồn và truy cập sách số:

  • Bộ sưu tập và sáng kiến nghiên cứu ngày càng phát triển của HathiTrust
  • Nỗ lực số hóa hợp tác của các tổ chức học thuật
  • Thảo luận về cải cách bản quyền, bao gồm đề xuất về thời hạn ngắn hơn và các điều khoản sử dụng hoặc mất quyền
  • Các công nghệ mới nổi như LLM tạo ra khả năng mới cho việc phân tích sách số

Cộng đồng tiếp tục thảo luận về sự cân bằng giữa bảo tồn, truy cập và quản lý quyền, đồng thời tìm cách ngăn chặn việc mất di sản văn hóa của chúng ta ở dạng số.