MagMix V7 เป็นการอัพเดทครั้งใหญ่ของโมเดลตัวนี้เลยก็ว่าได้ เพราะเป็นครั้งแรกที่ผมเทรนข้อมูลมาผสมด้วย
โมเดล MagMix รุ่นที่ผ่านมา เป็นงาน Merge ล้วนๆ เพื่อให้ได้โมเดลที่ถนัดใช้งาน
รอบนี้ต่างตรงที่ปรับหน้านางแบบ AI ให้สวยเหมือนสาวไทยมากขึ้น เพราะโมเดลต้นแบบ หน้าจะเป็นญี่ปุ่น เกาหลี จีน เพราะส่วนใหญ่เป็นคนต่างชาติทำ ชาติไหนทำเขาก็เอาหน้านางแบบของเขาเป็นต้นแบบ
แต่สำหรับ MagMix V7 หน้าจะออกมาเหมือนคนไทยมากขึ้น หน้าดูคม เหมาะกับ AI ที่เป็นงานถ่ายแบบ
แต่สำหรับรุ่น Beta ผมวางกรอบพัฒนาไว้ประมาณ 1-2 เดือน ถึงจะปล่อยให้โหลดฟรีที่ Civitai.com
ยกเว้นผู้สนับสนุน จะได้ร่วมพัฒนา และร่วมทดสอบโมเดลนี้ก่อนใคร
วิธีเข้าร่วมโปรเจค MagMix V7 Beta (มี 2 วิธี)
วิธีที่ 1
สนับสนุนภาพถ่าย สำหรับใช้เทรน (รายละเอียดด้านล่าง)
วิธีที่ 2
สนับสนุนค่าเทรน Google Colab 344 บาท
📌 ผู้เข้าร่วมจะได้รับ
– สิทธิเข้าห้อง MagMix Project (ในดิส)
– ไฟล์ MagMix V7 Beta
– ไฟล์ Lora ชุดพิเศษ
**สำหรับไฟล์ Lora จะให้เฉพาะผู้เข้าร่วมเท่านั้น ทำเสร็จก็ไม่แจกฟรี แต่ยังไม่ได้ทันทีนะ รอให้มีคนส่งข้อมูลมาให้เทรนก่อน
ติดต่อแอดมิน
ไอจี @magnumx.me
เฟสบุ๊ค Khanes Athiratanakran
รายละเอียดการส่งรูป
- ส่งรูปถ่ายสถานที่ท่องเที่ยว / สถานที่สำคัญๆ
- ต้องเป็นรูปที่ถ่ายด้วยตัวเองเท่านั้น
- ภาพควรที่มีความคมชัด หลีกเลี่ยงการถ่ายภาพในช่วงฟ้าครึ้ม
- ถ่ายรูปในอัตราส่วน 1:1 (จัตุรัส) และย่อรูปเป็นขนาด 768x768px
- ตั้งชื่อไฟล์ตามลำดับ เช่น Udon-01, Udon-02, Udon-03..
- อัพโหลดขึ้น Google Drive และส่งลิ้งค์มาให้แอดมิน
รูปแบบของภาพ
– รูปหลัก เป็นจุดสำคัญของสถานที่นั้นๆ จำนวน 5 รูป
– รูปรอง มุมไกล้เคียงกับภาพหลัก 5 รูป
– รูปเสริม มุมอื่นๆของสถานที่นั้นๆ 10 รูป
**ทุกรูปห้ามถ่ายเหมือนกันเป๊ะ ปรับมุมถ่ายบ้าง
จุดเด่นโมเดล MagMix V7 beta
1. หน้าคมสวยแบบคนไทย
เป็นจุดเด่นของโมเดลตัวนี้เลย แต่รุ่น Beta นี้หน้าสวยคมมาก ข้อดีก็คือเจนรูปมากี่ครั้งๆ ส่วนใหญ่ก็จะได้แต่คนสวยๆ
ใช้แค่คำว่า Woman ไม่ต้องเติมศัพท์เสริมอะไรมากมาย ก็จะได้ผู้หญิงที่สวยคมกันทุกคน
แต่ด้วยความที่คาแรคเตอร์นางแบบ MagMix V7 มันชัดเจนมาก
ทำให้มีปัญหากับการใช้ Lora ที่เป็นหน้าคน ทำให้ดูเหมือนต้นฉบับเท่าไหร่ จุดนี้กำลังคิดอยู่ว่าจะแก้ไขหรือพัฒนาต่อยังไง
2. เหมือนภาพถ่ายคนจริงๆ
การที่หน้านางแบบ ดูคล้ายคนไทย ทำให้ภาพ AI ดูเหมือนคนจริงๆมากขึ้น หน้าคนมีหลากหลาย ไม่ใช่แค่เกาหลี ญี่ปุ่น
จริงๆหลายๆโมเดล เดี๋ยวนี้มันทำแนวสมจริงกันอยู่แล้ว พอเพิ่มคาแรคเตอร์เข้าไป ก็จะเหมือนคนจริงๆมากขึ้น
3. อาจจะมีอะไรไทยๆมากขึ้น
ทั้งนี้ขึ้นอยู่กับว่ามี “ผู้สนับสนุนภาพถ่าย” มากน้อยแค่ไหน แต่ที่แน่ๆ จะมีข้อมูลที่เกี่ยวกับจังหวัดอุดรธานี ใส่ลงไปในโมเดล
แต่ถ้าลงไปล้วออกมาไม่ดี อาจจะไม่รวมในโมเดล แต่ทำเป็น Lora แยกออกมา ให้กับผู้สนับสนุนแทน
การตั้งค่าโมเดล และสูตร Prompt
1 แนะนำให้ใช้คำว่า (highly detailed body, highly detailed face:1.2) อยู่ในชุด Prompt ที่คุณใช้
เช่น
(highly detailed body, highly detailed face:1.2)
, Woman, (dress), (rim light, dreamy:1.3), outdoor
จริงๆลองสรรหาคำอื่นๆ มาแทนสูตรนี้ก็ได้นะ
2. สำหรับ Negative Prompt สั้นๆคำเดียว
(worst quality:1.8),
แต่ถ้าชอบสีจัดจ้าน ดูมีชีวิตชีวาเหมือนภาพถ่ายที่ตกแต่งแล้ว
ให้ใช้ Negative Prompt
paintings, sketches, (worst quality:2), (monochrome:1.2), (grayscale:1.2)
3. กำหนดค่า ประมาณนี้
Step 20
Text Guidance 4
Sampler DDIM
ในส่วนของ Sampler ปกติผมจะใช้ 2M Karras ตลอด แต่เหตุผลที่เปลี่ยนมาใช้ DDIM เพราะชอบความนุ่มนวล และเป็น Sampler ที่เจนรูปได้เร็วพอๆกัน
ข้อระวัง ต้องปรับ Text Guidance ต่ำๆนะ ไม่งั้นภาพแตก
4. หลังจากเจนรูปเสร็จแล้ว จำเป็นต้องทำ Hires Fix หรืออย่างน้อยๆ คุณต้องใช้ ControlNet Tile เพื่อให้ภาพดูสวยสมบูรณ์มากขึ้น
Draw Things วิธีใช้ Hi-res Fix ขยายภาพคมชัด
Draw Things ทำดีเทล ControlNet Tile + Inpaint
สำหรับสูตรการตั้งค่าและ Prompt ชุดนี้ ผมใช้ใน Draw Things
ถ้าคุณใช้ Stable Diffusion WebUI การทำ Hires Fix มันจะให้ผลที่แตกต่างกับ Draw Things
ลองหาสูตรที่เหมาะสมนะ อาจจะเปลี่ยน Sampler และปรับ Text Guidance มากขึ้น
ตัวอย่างงาน MagMix V7 Beta และ Prompt
(Highly Detailed:1.2), Woman, (camisole, jeans), light pink wavy hair, (rim light, dreamy:1.3), outdoor
(Highly Detailed:1.2), Woman, (medium-short dark brown hair), double eyelid, (wedding dress), Stairs with Red Carpet, outdoor, (rim light:1.3)
(Highly Detailed:1.2), Woman, look at viewer, (tank top, skirt), view from below , cityscape, street, (rim light:1.3)
(Highly Detailed:1.2), Woman, look at viewer, (tank top, skirt), neon city, neon light, neon sign, public, crowd, dynamic lighting,
จุดที่จะพัฒนาต่อ
โมเดลตัวนี้ผมเทรนข้อมูลมาผสมรอบที่ 5 และมีการปรับสูตรผสมอีก 10 รอบ นี่เพิ่งเริ่มต้นนะ ทำได้ไม่กี่วันเอง
แต่ยังมีจุดที่ต้องแก้อีกเยอะ ทั้งหน้านางแบบ และข้อมูลที่จะเพิ่มลงไป โดยเฉพาะการใช้งานร่วมกับ Lora หน้าคน ยังทำได้ไม่ดี
อันนี้ตัวอย่าง Lora เหมือนได้นางแบบหน้าใหม่ไปเลย เพราะมันไม่เหมือนตัวจริง
ถ้ามองว่าเป็นข้อดีก็ดี ผมจะลองแก้ดู ถ้าแก้ไม่ได้ก็จะปล่อยไปเลย ส่วนตัวชอบหน้านางแบบทรงนี้
ฉะนั้นกว่าจะถึงจุดที่ปล่อยดาวน์โหลดฟรีได้ จะใช้เวลาค่อนข้างนาน ผมตีกรอบไว้ไม่เกิน 2 เดือน
จริงๆอยากให้เสร็จเร็วกว่านี้ แต่ต้องทำงานอื่นไปด้วย