Hướng dẫn cài đặt và sử dụng Stable Diffusion cơ bản và miễn phí từ A đến Z

Hello mọi người, hôm nay a út sẽ đưa mọi người đến với con đường trở thành 1 “Aier” 🤣🤣🤣
Dưới đây là bài viết hướng dẫn từng bước cài đặt phần mềm tạo ảnh bằng AI Stable Diffusion 1 cách đơn giản và nhanh chóng nhất (tầm 15′).
Cài đặt và chạy thẳng trên Google Colab (hoàn toàn miễn phí) sau đó là bụp bụp ra các con ảnh cực kỳ ảo ma Canada (đôi khi là Bình Dương 😅 ).

Chuẩn bị:

Trước hết mọi người nên tạo 1 tài khoản google mới tinh, vì khi chạy Stable Diffusion trên google colab thì 1 số dữ liệu, file cài đặt cũng như các hình ảnh AI tạo ra sẽ đc xuất và lưu trữ trên ổ google Drive của account google mà bạn sử dụng.
Vậy nên tạo 1 account mới để thoải mái sử dụng ổ Drive mà ko sợ bị hết dung lượng.

PHẦN 1: CÀI ĐẶT

Bước 1:

Đầu tiên, bạn hãy truy cập vào địa chỉ này https://colab.research.google.com/drive/1yO2XcKyFItUiY-SKWzfVgnb2-ANjdbsl?usp=sharing

Đây là đường dẫn phần mềm để chạy trên google colab, giao diện sẽ như bên dưới, và đừng quên là bạn chọn đúng tài khoản google mới tạo để truy cập:

Bước 2:

Tiếp theo kéo xuống dưới 1 xíu các bạn sẽ thấy các Model có sẵn được liệt kê ra để chọn:

Model là gì? Model nôm na là các mô hình AI được tạo ra và đã qua quá trình huấn luyện để tạo ra hình ảnh. Mỗi Model được tạo ra và huấn luyện khác nhau sẽ cho ra những con ảnh khác nhau về phong cách, nét vẽ, chuyên môn, ánh sáng, màu sắc, mục đích sử dụng…
Lora về cơ bản thì nó cũng tương tự như Model nhưng chi tiết hơn và quy mô nhỏ hơn, chúng ta sẽ có bài viết chuyên sâu và cụ thể hơn về vấn đề này sau.
Các bạn hãy tham khảo các Model và hình ảnh nó tạo ra để hiểu rõ sự khác biệt.

Bản cài đặt mình sử dụng ở đây sẽ có sẵn 1 số Model phổ biển hay sử dụng, mình sẽ hướng dẫn mọi người tự thêm Model mà mình yêu thích ở bài viết khác.
Hiện tại, mình khuyến khích mọi người chọn 2 Model cơ bản như bên dưới để chạy trước (chọn càng nhiều Model thì sẽ phải chờ chương trình khởi động càng lâu)

Bước 3:

Vậy là xong phần setup, tiếp theo để chạy chương trình, các bạn nhìn lên thanh Menu bên trên cùng
chọn Thời gian chạy -> Thay đổi loại thời gian chạy -> Trình tăng tốc phần cứng chọn GPU (chỉ cần làm 1 lần ở lần chạy đầu tiên).

Rồi quay lại Menu chọn Thời gian chạy -> Chạy tất cả

Các bạn sẽ thấy 2 thông báo, hãy chọn Vẫn tiếp tụcVẫn Chạy

Tiếp đó google colab sẽ yêu cầu cho phép truy cập vào ổ google Drive của bạn, hãy chọn Kết nối với Google Drive

Chọn tài khoản và cho phép truy cập:

Sau đó các bạn sẽ thấy chương trình đang chạy, quá trình chạy tầm hơn 10 phút, nên các bạn để nguyên theo dõi, đừng tắt website đi nha

Bước 4: (Hoàn thành cài đặt)

Tầm hơn 10 phút cài đặt, các bạn hãy kéo xuống dưới cùng để theo dõi quá trình cài đặt cho tới khi thấy được đường link ___.gradio.live như hình bên dưới là hoàn tất, hãy nhấn vào link đó để qua tab mới và sử dụng phần mềm Stable Diffusion.

Lưu ý: các bạn cứ giữ nguyên tab website cài đặt bên google colab, đừng tắt đi nhé.

PHẦN 2: SỬ DỤNG

Giao diện phần mềm sẽ như bên dưới, và có 3 chức năng chính cơ bản chúng ta hay sử dụng đó là:

  • txt2img: text to image là chức năng chúng ta gõ chữ về các ý tưởng, mong muốn, yêu cầu vào và phần mềm sẽ tạo ra hình ảnh theo mô tả.
  • img2img: image to image là tạo ra hình ảnh dựa trên 1 hình ảnh có sẵn mà mình upload lên, bên cạnh đó kết hợp với mô tả được cung cấp.
  • Extras: là chức năng phóng to, làm nét các hình ảnh bị mờ hoặc có chất lượng thấp.

Gét goooo….
Trước tiên, các bạn nhấn vào mục “Stable Diffusion checkpoint” bên trên cùng và đổi sang sử dụng Model xxmix9realistic_v26.safetensors.

Sau khi chọn đợi 1 tí để nó load nha (tầm 2-3 phút)

Để vọc thì mình demo sử dụng txt2img trước cho mọi người test nha.

Mô tả mẫu cho hình ở trên:

Prompt:
ultra realistic close up portrait ((beautiful pale cyberpunk female with heavy black eyeliner)), blue eyes, shaved side haircut, hyper detail, cinematic lighting, magic neon, dark red city, Canon EOS R3, nikon, f/1.4, ISO 200, 1/160s, 8K, RAW, unedited, symmetrical balance, in-frame, 8K
Negative Prompt
painting, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, deformed, ugly, blurry, bad anatomy, bad proportions, extra limbs, cloned face, skinny, glitchy, double torso, extra arms, extra hands, mangled fingers, missing lips, ugly face, distorted face, extra legs, anime


Các thông số cở bản cần lưu ý:

  • Dòng chữ ở trên gọi là Prompt là mô tả, yêu cầu, chi tiết về hình ảnh mình muốn tạo ra.
  • Dòng chữ ở dưới là Negative Prompt là những chi tiết, thành phần chúng ta không muốn xuất hiện trong hình.
  • Sampling steps: là số bước để AI tạo ra hình ảnh, steps càng nhiều thì thời gian sẽ lâu hơn xíu.
  • Width: chiều dài.
  • Height: chiều cao.
  • CFG Scale: là mức độ quan trọng của Prompt mô tả ở trên, Scale càng lớn thì nó càng bám sát và chặt chẽ theo lời mô tả, còn Scale càng thấp thì sức sáng tạo của Ai càng cao nha.
  • Batch count: là số lượng hình ảnh được tạo ra, ví dụ nhập 4 thì Ai sẽ tạo ra 4 hình ảnh khác nhau.

1 số ví dụ khác:

Prompt:
Beautiful Goddess Aphrodite, A David Gaillet style heroine, perfect face, beautiful eyes with perfect-circle irises, intricate skimpy robe, amethyst luxury, long hair, flirty gaze, alluring pose, decolletage, top model, detailed face, digital painting, artwork by Carne Griffiths and Wadim Kashin, by Jeremy Mann, golden ratio, abstract art style, intricate complex watercolor painting, beautiful and stunning, Super detailed full figure, sf, intricate artwork masterpiece, ominous, matte painting movie poster, golden ratio, intricate, epic
Negative Prompt
two faces, duplicate, coppy, multi, two, disfigured, kitsch, ugly, oversaturated, grain, low-res, Deformed, blurry, bad anatomy, disfigured, poorly drawn face, mutation, mutated, extra limb, ugly, poorly drawn hands, missing limb, blurry, floating limbs, disconnected limbs, malformed hands, blur, out of focus, long neck, long body, ugly, disgusting, poorly drawn, childish, mutilated, mangled, old ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft

Ví dụ với Model RevAnimated:

Prompt:
Splash art, Alberto Seveso art, luminism, portrait of a beautiful cute chibi fox ,anime kawaii ,cute drawing , moon, large round reflective eyes, long hair , fantasy dress ,magic, photorealistic, Hyperdetailed 3d, fantasy scene , smooth lighting, vibrant colors, cartoon illustration, fine details, smooth, professional photography, Alexander Jansson, Beeple, Cyril Rolando, hyperrealism, maximalism, photorealism, dynamic lighting, volumetric lighting, Octane Render, colorful, complex, epic, golden ratio, intricate
Negative Prompt
2 heads, elongated body, 2 faces, cropped image, out of frame, draft, deformed hands, signature, watermark, twisted fingers, double image, long neck, extra limb, ugly, poorly drawn hands, missing limb, ugly, over saturated, grain, blurry, bad anatomy, disfigured, poorly drawn face, mutation, disconnected limbs, out of focus, long body, disgusting, poorly drawn, mutilated, mangled, extra fingers, gross proportions, missing arms, mutated hands, mutilated hands, cloned face, missing legs

Cuối cùng:

Sau khi sử dụng xong phần mềm, mọi người đừng quên trở lại tab cũ bên Google Colab để ngưng kết nối với server, vì chúng ta đang sử dụng phiên bản free của google nên cần tiết kiệm tài nguyên.

Thêm 1 cái cuối cùng:

Các hình ảnh mọi người tạo ra trên Stable Diffusion đều được lưu lại trên ổ Google Drive:
My Drive > SD-ChiaSeDamMe > stable-diffusion-webui > outputs

Cuối cùng của cuối cùng:

Leave a Reply

Your email address will not be published. Required fields are marked *