Cách viết Prompt phù hợp cho Stable Diffusion 

Stable Diffusion là một trình tạo nghệ thuật AI phổ biến, sử dụng các gợi ý văn bản để tạo ra hình ảnh. Công cụ này có thể tạo ra chính xác những gì bạn muốn với vài gợi ý (Prompt) mà bạn đưa cho nó. Tuy nhiên, với rất nhiều ý tưởng, việc đưa ra một prompt cụ thể thực sự không hề dễ dàng.

Hiều được điều đó, chúng tôi đã sưu tập các mẹo và thủ thuật khi tạo prompt giúp bạn có thể để đạt được hình ảnh mà mình mong muốn khi sử dụng Stable Diffusion.

Cách viết Prompt cho Stable Diffusion

Nếu bạn đã dùng qua các trình tạo ảnh AI, chẳng hạn như Stable Diffusion, DALL-E, hoặc MidJourney, bạn biết rằng để tạo ảnh bạn cần tạo 1 Prompt. Nội dung Prompt của bạn càng chuẩn thì ảnh được tạo ra sẽ như ý muốn và ngược lại.

Tuy nhiên, tạo ra 1 prompt để khớp được suy nghĩa của con người và máy là một điều không hề dễ dàng. Do đó dưới đây là vài cách sẽ giúp bạn có thể tối ưu các prompt trong quá trình tạo ảnh:

Sử dụng Prompt phủ định

Phiên bản mới nhất của Stable Diffusion tại thời điểm cập nhật này là phiên bản 2.1, cho phép bạn liệt kê các Prompt phủ định. Prompt phủ định tương tự như Prompt thông thường của bạn, nhưng thay vì mô tả những gì bạn muốn, bạn mô tả những gì bạn không muốn.

Hãy thử tạo bộ ảnh đầu tiên của bạn mà không có Prompt phủ định, sau đó thêm Prompt phủ định để loại bỏ các yếu tố bạn không thích.

Prompt càng cụ thể càng tốt

Stable Diffusion thường hoạt động tốt với những Prompt cụ thể, đặc biệt là so với MidJourney. Bạn cần cho nó biết chính xác những gì bạn muốn. Ví dụ bạn sử dụng Prompt: Cute cat.

Kết quả trả về là một loạt hình ảnh các chú mèo dễ thương. Nhưng nếu bạn muốn kết quả cụ thể hơn là một chú mèo màu xám, mà không phải là tập hợp các loại mèo có những bộ lông khác nhau? Vậy thì, bạn cần chỉ định rõ ràng điều đó. Hãy sử dụng “Cute grey cat” thay cho Prompt ban đầu.

Bây giờ, Stable Diffusion sẽ trả về cho bạn tất cả các bức ảnh mèo xám cho bạn. Bạn có thể thêm vào mô tả về những gì bạn muốn, bao gồm việc trang trí cho các con mèo trong các hình ảnh.

Thêm từ khoá vào Prompt để cụ thể hoá phong cách của kết quả

Bạn nên chỉ định phong cách của bức ảnh mà bạn muốn. Chúng ta có thể lấy ví dụ ban đầu với Prompt “Cute grey cat”. Giả sử bạn muốn một số con mèo xám dễ thương, nhưng cũng muốn chúng trông như một bức tranh sơn dầu. Vậy hãy thêm “bức tranh sơn dầu” là từ khóa tiếp theo trong prompt của bạn, vì vậy Prompt mới sẽ là: “Cute Grey Cat, acrylic painting.”

Bạn nên bắt đầu với ít từ khóa nhất để tiếp cận với điều bạn muốn, sau đó hãy thêm nhiều hơn để chọn ra một phong cách mà bạn đang tìm kiếm. Stable Diffusion có sẵn hàng chục phong cách nghệ thuật khác nhau, từ bản vẽ bằng bút chì đến mô hình đất sét đến phát hiện 3D từ Unreal Engine.

Tạo Prompt với tên nghệ sĩ cụ thể để hướng dẫn Stable Diffusion

Stable Diffusion có khả năng mô phỏng các tác phẩm của các nghệ sĩ cụ thể nếu bạn muốn. Ví dụ sử dụng tên Pablo Picasso.

Bạn nên thử thêm “by (tên nghệ sĩ)” vào yêu cầu của mình để cho ra kết quả chính xác. Bạn cũng có thể kết hợp các nghệ sĩ khác nhau trong một Prompt. Thường thì Stable Diffusion sẽ kết hợp các phong cách tương ứng của họ để cho ra một kết quả phù hợp nhất. 

Mẹo: Nếu bạn đang sử dụng phiên bản GUI của Stable Diffusion cho Windows mà chúng tôi đã giới thiệu, nút “Roll” bên phải cửa sổ yêu cầu sẽ ngẫu nhiên thêm một nghệ sĩ vào yêu cầu của bạn. Đây là một cách tuyệt vời để khám phá các phong cách mới.

Tăng giá trị cho từ khóa

Nếu chỉ đơn thuần đưa từ khóa vào Prompt sẽ không đảm bảo kết quả đúng như bạn mong muốn. Nếu đưa đủ các từ khóa vào gợi ý nhưng chúng không được phân bổ đúng tỉ lệ, thì kết quả có thể sẽ không chính xác.

Stable Diffusion hỗ trợ trọng số cho các từ khóa trong gợi ý. Điều này có nghĩa là bạn có thể yêu cầu nó chú ý đến một số từ khóa cụ thể hơn (hoặc ít quan trọng hơn) để có được kết quả chính xác hơn.

Trong dòng lệnh của Stable Diffusion, bạn chỉ cần thêm một dấu hai chấm kèm theo một số thập phân vào từ khóa bạn muốn nhấn mạnh. Các số thập phân này là tỷ lệ phần trăm, vì vậy tổng của chúng phải bằng 1.

Quay trở lại với ví dụ “cute grey cat” (Chú mèo xám dễ thương), giả sử nó đang tạo ra những con mèo dễ thương nhưng không có nhiều hình ảnh kết quả với mèo màu xám. Bạn có thể sửa đổi Prompt thành “cute, grey cat:0.7” để nó tập trung vào từ khóa “grey cat”, sau đó tự động chuyển phần còn lại cho “cute”. Nếu muốn chính xác hơn, bạn có thể chỉ định trọng số cho mỗi từ khóa, ví dụ “Cute:0.10, Grey Cat:0.60, Unreal Engine rendering:0.30”.

Hầu hết các giao diện đồ họa (GUI) của Stable Diffusion hỗ trợ trọng số mà không yêu cầu bạn nhập tỷ lệ phần trăm. Thay vào đó, bạn có thể đặt ngoặc đơn để nhấn mạnh một thuật ngữ trong gợi ý và đặt ngoặc vuông để giảm sự quan trọng của một thuật ngữ. Ví dụ “cute, grey cat” bạn có thể đặt như sau:[cute], ((grey cat)).

Những nguồn cảm hứng khác

Stable Diffusion và các công cụ tạo nghệ thuật AI khác đã trải qua một đợt bùng nổ về mức độ phổ biến. Bạn có thể tìm thấy những công cụ AI này ở khắp mọi nơi.

Dưới đây là một vài nguồn tài nguyên để giúp kích thích cảm hứng của bạn nếu bạn không chắc chắn mình đang tìm kiếm thứ gì để tạo ra:

  • Lexica – Đây là một kho lưu trữ hình ảnh được tạo ra bằng Stable Diffusion và bộ Prompt tương ứng. Có thể tìm kiếm theo từ khóa.
  • Stable Diffusion Artist Style Studies – Công cụ này có sẵn một danh sách lớn các nghệ sĩ mà Stable Diffusion có thể nhận ra, cũng như các mô tả chung về phong cách nghệ thuật của họ.
  • Stable Diffusion Modifier Studies – Công cụ này có một danh sách các Prompt có thể được sử dụng với Stable Diffusion, tương tự như trang web của nghệ sĩ.
  • The AI Art Modifiers List – Đây là một bộ sưu tập ảnh trưng bày với một số từ khoá sử dụng trong câu hỏi của mình.
  • Top 500 Artists Represented in Stable Diffusion – Bộ sưu tập những hình ảnh đã có sẵn trong bộ dữ liệu của Stable Diffusion, từ đó bạn có thể xác định được nghệ sĩ nào được nhắc tới nhiều nhất trong dữ liệu của công cụ này. Nghệ sĩ nào được đại diện nhiều trong dữ liệu, Stable Diffusion sẽ phản hồi tốt hơn với tên của họ là một từ khóa.
  • The Stable Diffusion Subreddit – Cộng đồng Stable Diffusion trên Reddit có liên tục cập nhật các đề tài mới và các khám phá thú vị. Nếu bạn đang tìm kiếm cảm hứng hoặc những hướng dẫn có ích, thì đây là một nguồn tài nguyên hữu ích không thể bỏ qua.

Thay đổi các cài đặt quan trọng khác

Một prompt hợp lý là phần khó nhất khi sử dụng Stable Diffusion, tuy nhiên còn một số cài đặt khác sẽ thay đổi kết quả một cách đáng kể.

  • CFG: Xác định mức độ Stable Diffusion tuân theo gợi ý của bạn. Chỉ số càng cao sẽ dẫn đến việc nó tuân theo gợi ý nhiều hơn, trong khi con số càng thấp sẽ cho phép công cụ này có nhiều sự tự do sáng tạo ra kết quả hơn. Hãy thử điều chỉnh chỉ số này trước.
  • Sampling Method: Cách ảnh được chế tạo từ tạp âm thành hình ảnh. Hãy thử một vài phương pháp này. Euler_a, k_LMS và PLMS là những lựa chọn phổ biến.
  • Sampling Steps: Số lần một hình ảnh sẽ được gợi ý mẫu trước khi bạn nhận được kết quả cuối cùng.

Khi bạn dành nhiều thời gian hơn với Stable Diffusion, bạn sẽ có được cảm nhận tốt về cách nó phản hồi với những từ khác nhau và bạn sẽ nhanh chóng nhận ra rằng viết một prompt tốt là một nghệ thuật riêng của nó.