ถ้าสเปคคอมแรง ก็จะส่งผลให้เจนรูป Stable Diffusion ได้เร็ว สำหรับ Google Colab ให้ GPU Ram มากถึง 15GB
และเท่าที่ผมได้ใช้งานมา การที่มี GPU Ram (หรือ Vram) มากถึง 15GB ทำให้เจนรูปได้เร็วมากๆ ดีเพียงพอสำหรับการใช้งานพื้นฐาน
แนะนำอ่านรีวิว > รีวิว Stable Diffusion บน Colab ทำรูป AI สุดคุ้ม
ทดสอบเจนรูปด้วย Colab
เซ็ตค่าตามนี้
- Sampling DPM++ 2M Karras
- Sampling steps 20
- Wight 512 Hight 512
- CFG Scale 5
โมเดลที่ใช้คือ MagMix V5 ไม่น่ามีผลต่อความเร็ว
ผลที่ได้
เฉพาะเจนรูปครั้งแรก จะรอนานเป็นนาที แต่เจนรูปครั้งถัดๆไปจะได้รูปเร็วสุด 6 วินาที
กรณีที่ใช้ Hires. fix จะใช้เวลาประมาณ 50 วินาที
การใช้งานจริง ไม่น่ามีใครใช้รูปขนาด 512 นะ เพราะรูปมันเล็กมาก อยากน้อยต้องใช้ Hires. fix และ Upscale X2 จะได้รูปขนาด 1024 ถ้าอัพลงโซเชียลก็ถือว่าชัดอยู่นะ
ต่อมาลองเปลี่ยน Image Size เป็น Wight 512 Hight 768 จะได้สัดส่วนภาพเป็น 2:3 เหมาะกับภาพแนวพอร์ทเทรตมากๆ
ผลที่ได้
ใช้เวลา 14 วินาที
แต่ถ้าใช้ Hires fix ใช้เวลา 55 วินาที รอนานเกือบสองนาที แต่ได้ภาพขนาด 1024×1536 เป็นภาพที่ใหญ่ และมีความชัดพอสมควร
การใช้งานจริง ผมจะปรับ Step เป็น 40 ผลที่ได้
– ใช้เวลา 14 วินาที
– Hires. fix ใช้เวลา 1 นาที 40 วินาที
การเพิ่ม Step ส่งผลเพิ่มเวลาเป็นเท่าตัว
ทดสอบกับขนาดภาพต่างๆ
640 x 960
– ใช้เวลา 30 วินาที
– Hires. fix X2 แล้ว error
– Hires. fix X1.5 ใช้เวลา 1.28 นาที
– Hires. fix X1.7 ใช้เวลา 2 นาที
X1.7 ได้รูปขนาด 1088×1632
720 x 1152
– ใช้เวลา 42 วินาที
– Hires. fix X1.5 ใช้เวลา 2.13 นาที
ส่วนตัวไม่แนะนำให้เจนภาพขนาด 720 x 1152 (หรือเป็นภาพขนาดใหญ่กว่านี้) เพราะมีโอกาสทำภาพเพี้ยนสูงมาก หัวงอก รูปร่างบิดเบี้ยว เป็นต้น
แนะนำให้ใช้ขนาด 512 x 768 กับ 640 x 960 โอกาสภาพเพี้ยนคือมีน้อยกว่ามากๆ
อย่างไรก็ตาม ทำภาพขนาดใหญ่ด้วย Stable Diffusion WebUI มันมีหลายเทคนิคหลายวิธี ติดตามเว็บ maahalai นะ จะมีรีวิวออกมาเรื่อยๆ