Sự ra mắt gần đây của Stable Diffusion 3.5 đã nhanh chóng thu hút sự tham gia của cộng đồng, với các nhà phát triển và nền tảng nhanh chóng triển khai hỗ trợ và tối ưu hóa cho mô hình mới. Khác với phiên bản tiền nhiệm SD 3.0 - vốn chỉ phát hành mô hình Medium ban đầu, SD 3.5 ra mắt với cả mô hình Large cơ bản và biến thể Turbo, đánh dấu một bước chuyển đổi quan trọng trong chiến lược triển khai.
Những phát triển chính
Hỗ trợ tức thì từ các nền tảng
ComfyUI đã công bố hỗ trợ đầy đủ cho SD 3.5 Large, thể hiện phản ứng nhanh chóng của cộng đồng đối với phiên bản mới. Nền tảng này đã công bố hướng dẫn triển khai chi tiết thông qua bài đăng trên blog, giúp các nhà phát triển dễ dàng tích hợp mô hình mới.
Các phiên bản được tối ưu hóa
Nhiều phiên bản tối ưu hóa đã xuất hiện để đáp ứng các trường hợp sử dụng khác nhau:
-
Phiên bản FP8 Scaled : Comfy.org đã phát hành phiên bản FP8 scaled của mô hình với mức sử dụng bộ nhớ thấp hơn. Đáng chú ý, mặc dù kích thước tệp của phiên bản này vẫn tương tự như mô hình FP16 cơ bản, nhưng nó đã tích hợp sẵn ba bộ mã hóa văn bản, loại bỏ nhu cầu phân phối riêng biệt.
-
Phiên bản NF4 nhỏ gọn : Một phiên bản bitsandbytes nf4 nhỏ hơn đã được cung cấp trên Hugging Face bởi sayakpaul, mang đến một giải pháp tiết kiệm tài nguyên hơn.
Các điều chỉnh LoRA ban đầu
Cộng đồng đã bắt đầu phát triển các mô hình LoRA chuyên biệt cho SD 3.5, với một số phiên bản tập trung vào các phong cách nghệ thuật khác nhau:
- Nghệ thuật đường nét Trung Quốc
- Nghệ thuật đường nét đỏ tuyến tính
- Thiết kế tương lai
Thông số kỹ thuật
Mô hình SD 3.5 Large cơ bản có 8 tỷ tham số, khiến nó trở thành mô hình mạnh mẽ nhất trong dòng Stable Diffusion. Đối với các tổ chức muốn triển khai công nghệ này, Stability AI đã cung cấp hướng dẫn tinh chỉnh toàn diện để giúp các nhà phát triển tùy chỉnh mô hình cho các trường hợp sử dụng cụ thể.
Cấp phép và khả năng tiếp cận
Mô hình vẫn có thể truy cập theo Giấy phép Cộng đồng của Stability AI, cho phép:
- Sử dụng phi thương mại miễn phí
- Sử dụng thương mại cho các đơn vị có doanh thu hàng năm dưới 1 triệu USD
- Quyền sở hữu đầy đủ đối với các sản phẩm được tạo ra
Bản phát hành này đại diện cho một bước tiến quan trọng trong việc làm cho công nghệ tạo hình ảnh AI tiên tiến trở nên dễ tiếp cận hơn, đồng thời cung cấp nhiều tùy chọn tối ưu hóa cho các cấu hình phần cứng và trường hợp sử dụng khác nhau.
Hình ảnh thể hiện một nhóm người đa dạng minh họa cho khả năng tiếp cận và sự tham gia của cộng đồng trong bản phát hành Stable Diffusion 35 |