Cách sử dụng và các tính năng chính của Stable Diffusion

Stable Diffusion là một công cụ chuyển đổi văn bản thành hình ảnh được phát hành bởi StabilityAI vào ngày 22 tháng 8 năm 2022. Hiện tại, hàng triệu người sử dụng nó để tạo ra những bức ảnh đẹp mắt chỉ trong vài giây.

Tương tự như các công cụ khác như DALL·E 2 của OpenAI và Midjourney, nhưng nó được phát hành miễn phí cho người dùng.

Ngoài ra, Stable Diffusion cho phép người dùng có thể tùy chỉnh hoặc xây dựng trên nền tảng. 

Bạn có thể làm gì với Stable Diffusion?

Chuyển đổi văn bản thành hình ảnh (txttoimg)

Đây là tính năng chính của Stable Diffusion. Bạn chỉ cần nhập một câu miêu tả hay gợi ý về hình ảnh, được gọi là “prompt”, và Stable Diffusion sẽ tạo ra một hình ảnh cho bạn!

Chuyển đổi hình ảnh sang Hình ảnh (imgtoimg)

Đây là một phương pháp quan trọng của Stable Diffusion. Bạn chỉ cần nhập vào một hình ảnh và một ‘prompt’ để Stable Diffusion sẽ tạo ra một hình ảnh mới cho bạn.

Chỉnh sửa với tính năng inpainting và outpainting

  • Inpainting: Tính năng này sẽ tạo nên một phần của hình ảnh mới, phủ lên một phần của hình ảnh ban đầu của bạn
  • Outpainting: Tính năng này sẽ giúp bạn thêm các chi tiết mới vào hình ảnh ban đầu

Tích hợp cho Photoshop, Blender và các phần mềm tương tự

Tất cả những công cụ trên sẽ sớm được tích hợp vào Stable Diffusion.

Sửa đổi hình ảnh bằng cách đưa ra hướng dẫn

InstructPix2Pix là một công cụ cho phép bạn có thể đưa ra những hướng dẫn để tạo ra một hình ảnh chính xác với mong muốn của bạn. Điều đó có nghĩa là bạn có thể xác định rõ ràng các phần nào của hình ảnh mà bạn muốn chỉnh sửa.

Chỉnh sửa video bằng cách đưa ra chỉ dẫn.

Sử dụng InstructPix2Pix, bạn cũng có thể chỉnh sửa video!

Cách sử dụng Stable Diffusion

Bạn có thể bắt đầu bằng cách sử dụng phiên bản trực tuyến để làm quen với tính năng của nó. Sau đó, bạn có thể cài đặt Stable Diffusion trên máy tính của mình.

Phiên bản trực tuyến

Chỉ cần truy cập vào trang web và bắt đầu tạo ra các hình ảnh!

StableUI của Aqualxx: Là một công cụ hoàn toàn miễn phí hỗ trợ bất kỳ độ phân giải nào, nhiều mô hình, chuyển đổi ảnh, khắc phục khuyết điểm và có một bộ sưu tập công khai. 

DreamStudio: Là sản phẩm của StabilityAI, nhà phát triển của Stable Diffusion. Trong khi Stable Diffusion là miễn phí, DreamStudio là một sản phẩm mất phí. Nó cũng có một phiên bản dùng thử miễn phí dành cho những người muốn sử dụng một trang web thay vì cài đặt SD trên máy tính của mình.

ArtBot của Dave Schumaker: Là một công cụ khác dựa trên Stable Horde. Hoạt động tốt trên thiết bị di động và có nhiều mô hình và tính năng như: Chuyển đổi ảnh, khắc phục khuyết điểm và có một bộ sưu tập công khai.

Ứng dụng di động

Dưới đây là những ứng dụng mà tôi đã từng thử qua và thực sự ấn tượng với chúng.

Draw Things: AI Generation

Ứng dụng này có giao diện đơn giản và trực quan. Đồng thời, nó đi kèm với tất cả các tính năng mà bạn muốn và có cả phiên bản cho Mac và iPad.

Diffusitron AI Art

Ứng dụng miễn phí có thể giúp người dùng tạo ra những hình ảnh chính xác và dễ dàng.

Cài đặt trên máy tính

Sau khi bạn đã làm quen với công cụ này và muốn trải nghiệm hết các tính năng tiên tiến nhất của nó thì bạn có thể cài đặt ứng dụng trên máy tính của mình 

“Stable Diffusion” là tên của công cụ chính thức được StabilityAI phát hành và đây là những lựa chọn tốt nhất để chạy Stable Diffusion trên máy tính của bạn:

  • AUTOMATIC1111’s Stable Diffusion WebUI
  • InvokeAI
  • Mochi Diffusion – được thiết kế cho Mac M1

Các mô hình

Các mô hình xác định điều gì mà AI biết

Mô hình mà bạn sử dụng sẽ quyết định những gì mà AI “biết” và có thể tạo ra.

Các mô hình hàng đầu như Stable Diffusion được phát triển trên các tập dữ liệu lớn và thường được cập nhật để cải thiện hiệu suất của chúng.

Dưới đây là những mô hình phổ biến nhất:

  • Stable Diffusion v2.1
  • Openjourney
  • Waifu Diffusion

Hãy nhớ rằng các model là PnP (plug and play).

Prompts

Bạn cần cung cấp cho công cụ những miêu tả hay gợi ý cụ thể để nó có thể tạo ra hình ảnh mà bạn muốn – đó được gọi là Prompt

Bạn có thể mô tả chi tiết với các câu dài, hoặc sử dụng các từ khoá và cụm từ ngắn.

Đây là một số nguồn tài nguyên tuyệt vời để tạo Prompt:

Lexica.art: Lexica là trang web có sẵn tập hợp hình ảnh và Prompt tương ứng. Gồm có:

  • Danh sách các nghệ sĩ đại diện cho Stable Diffusion 1.4: Danh sách tất cả các nghệ sĩ trong mô hình Stable Diffusion phiên bản 1.4, với các ví dụ về tạo ảnh.
  • Cơ sở dữ liệu nghệ sĩ của Arthive: 74.000 nghệ sĩ – không phải tất cả đều được đại diện trong Stable Diffusion, đây là nguồn cảm hứng hữu ích giúp bạn có thể tạo ảnh dễ dàng.

Bạn cũng có thể sử dụng các công cụ chuyển đổi hình ảnh sang văn bản (img2txt) để cố gắng phục hồi lại câu lệnh đã tạo ra hình ảnh:

  • Clip-Interrogator, do Pharma phát triển.
  • BLIP, do Salesforce phát triển.

Như vậy, qua bài viết này, tôi hy vọng bạn cũng hiểu sơ qua đôi điều về Stable Diffusions. Thế giới kiến thức về AI, hay cụ thể là các công cụ tạo ảnh từ text còn quá rộng lớn, vì vậy hãy đọc thêm các bài giải thích, chia sẻ khác của tôi để nắm rõ hơn về loại công nghệ mới này. 

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *