HƯỚNG DẪN TRAIN LORA KHUÔN MẶT CỰC DỄ HIỂU TRÊN SHAKKER AI

HƯỚNG DẪN TRAIN LORA KHUÔN MẶT CỰC DỄ HIỂU TRÊN SHAKKER AI


Hướng Dẫn Train Lora Khuôn Mặt Cực Dễ Hiểu Trên Shakker Ai

(Giải thích thuật ngữ theo ví dụ thực tế và một số Tip quan trọng)

HƯỚNG DẪN TRAIN LORA KHUÔN MẶT CỰC DỄ HIỂU TRÊN SHAKKER AI



1. ✅Mục tiêu khi train LoRA khuôn mặt

🔹Dùng AI nhận diện đúng khuôn mặt trong nhiều bối cảnh, ánh sáng, góc chụp khác nhau.

🔹Giữ được sự linh hoạt, tái tạo đúng khuôn mặt mà không bị “đóng khung" hay overfit.

2. 📸Chọn ảnh input cho đạt chuẩn

Nên chn t 6 đến 20 nh, đủ góc: chính din, nghiêng, chếch, ngóc chp trên dưới...

nh phi:

🔹Rõ nét khuôn mặt, không che, không filter nặng

🔹Độ phân giải cao, chi tiết chân thực

🔹Ánh sáng tự nhiên hoặc studio đều và nhẹ

🔹Background đơn giản, ít chi tiết, ít màu sắc loạn

⚠️Nếu background rối mắt, quá nhiều chi tiết và màu sắc thì nên xóa font trước khi train

3. 📊Viết caption cho ảnh

🔹Càng chi tiết càng tốt, để AI nhận diện đúng khuôn mặt:

"Portrait of a young Asian woman with a small face, natural skin texture, long black hair, DSLR photo, soft lighting, Canon 85mm lens, f1.8 aperture"

🔹Cố gắng giữ cấu trúc caption ổn định cho từng ảnh, chỉ thay góc chụp, ánh sáng, biểu cảm...

4. 🚀Thông số train đề xuất (theo số ảnh)

🔹6–10 ảnh: Repeat 35–40, Epoch 4–6

🔹10–20 ảnh: Repeat 25–35, Epoch 6–8

🔹Trên 20 ảnh: Repeat và Epoch tuỳ chỉnh theo số lượng ảnh

📍Ảnh ít → tăng Repeat để học sâu từng ảnh. Giảm Epoch để tránh AI sáng tạo quá đà.

📍Ảnh nhiều → tăng Epoch để học tổng quát hơn. Giảm Repeat xuống để tránh cho AI bị nhồi quá nhiều chi tiết -> dễ overfit.

📚Ví dụ thực tế: Lớp học vẽ chân dung thầy giáo

Thầy giáo yêu cầu học sinh vẽ chân dung thầy đang ngồi.

Mỗi buổi học, học sinh vẽ 10 lần (Repeat = 10)

Sau mỗi buổi, thầy đổi hướng mặt hoặc tư thế chút xíu, dữ liệu về khuôn mặt thầy được gia tăng: ví dụ góc này có nốt ruồi, có sẹo,.... Khi đó học sinh đã có những dữ liệu về khuôn mặt thầy ở những buổi học trước và được bổ sung thêm những dữ liệu mới.

🔹Sau 5 buổi (Epoch = 5), học sinh đã nhìn thấy nhiều góc cạnh, chi tiết ẩn như: nốt ruồi, vết bớt, ánh sáng nghiêng...

🔹Dần dần, vẽ được chân dung rất đúng với khuôn mặt thầy

🔄Đó là cách AI học qua Repeat & Epoch khi train LoRA.

📝Dim & Alpha – Tổ chức trí nhớ AI (trong phần Advanced settings)

Học sinh vẽ xong, mỗi lần nhìn thấy chi tiết khuôn mặt, họ lại viết vào sổ tay.

🔹Dim = Số trang trong sổ tay

✔️(càng nhiều trang, càng ghi được nhiều chi tiết)

🔹Alpha = Số lần học sinh mở sổ ra đọc lại trước khi vẽ (càng xem kỹ, vẽ càng chi tiết)

👉Dim cao + Alpha cao → AI nhớ nhiều, vẽ chi tiết.

👉Dim thấp + Alpha thấp → Vẽ sơ sài, như người đãng trí.

📌Lưu ý khi chọn Dim và Alpha khi train LoRA khuôn mặt

🔹Vì LoRA khuôn mặt thường kết hợp với các LoRA khác (ví dụ: trang phục, tư thế, bối cảnh...), nên cần cân nhắc kỹ khi chọn Dim và Alpha.

🔹Nếu để chỉ số Dim quá cao, → LoRA sẽ nặng, khó kết hợp với các LoRA khác hoặc checkpoint khác.

✅Gợi ý:

🔹Nếu không cần quá chi tiết về khuôn mặt, cứ để mặc định Dim/Alpha = 32/32 là ổn.

🔹Nếu cần cực kỳ chi tiết (ví dụ: focus texture da, ánh sáng, biểu cảm nhẹ) → có thể tăng Dim/Alpha lên cao (64/64 hoặc 64/128), → nhưng khi tạo ảnh phải chọn LoRA còn lại thật nhẹ và hạ weight xuống 0.6–0.8 để cân bằng.

🔹Khuyên các bạn nếu không chắc chắn thì không nên chọn Alpha > Dim nhé

📌Tagging Algorithm (Thuật toán gán nhãn)

Là công c AI t động to caption (mô t) cho tng nh đầu vào trước khi train.

Các la chn ph biến:

🔹BLIP: ngắn gọn, đơn giản, phù hợp đa số trường hợp.

🔹Deepbooru: gán nhiều tag chi tiết, phù hợp ảnh anime hoặc ảnh phức tạp.

🔹Joy2 / Llava: gán rất sâu, dễ “tưởng tượng quá đà” → nên kiểm tra lại thủ công.

🔹No Caption: bỏ qua bước gán tag.

🔹Trigger words only: chỉ dùng khi bạn thực sự hiểu về cách mô tả hình ảnh bằng tag/caption

✅Gợi ý: Dùng BLIP hoặc Joy2, sau đó kiểm tra/sửa tay nếu cần.

📌Threshold (Ngưỡng lọc tag)

🔹Là mức độ tự tin của AI để quyết định có nên gán một tag không.

🔹Threshold càng thấp → nhiều tag hơn, kể cả tag yếu.

🔹Threshold cao → ít tag hơn, dễ bỏ sót đặc điểm nhỏ.

✅Gợi ý nên để từ 0.3 – 0.5 để không bị thiếu tag.

📌Trigger Words

🔹Là nơi nhập tay các tag bắt buộc, ví dụ: "asian woman, ao dai, soft lighting"...

🔹Khi bấm gán tag, AI sẽ gộp thêm những từ này vào caption dù có thấy hay không.

🔹Cực kỳ hữu ích khi muốn giữ tag cố định như tên nhân vật, style, trang phục, bối cảnh...hoặc muốn chi tiết hóa thuộc tính nào đó.

📍Nói dễ hiểu:

Trigger Words = tag tự tay thêm vào caption trước khi train

💡Tip gắn tag giúp ảnh chân thực hơn

🔹Để giúp AI hiểu đúng về bối cảnh ảnh thật và ánh sáng tự nhiên, nên gắn thêm một số từ khóa sau khi tagging:

🎯Gợi ý một số tag hữu ích:

🔹dslr photo, realistic lighting, natural skin texture, natural background

🔹shot with canon 85mm lens, f1.8 aperture, professional photo, studio portrait

🔹asian face, small face, natural expression, subtle smile, gentle look, realistic photography

✅Những tag này giúp AI:

🔹Nhận diện chất lượng ảnh thật

🔹Giữ ánh sáng và tone màu tự nhiên khi gen ảnh mới

🔹Tái hiện biểu cảm tự nhiên, ánh mắt có "hồn"

📌Mẹo thêm khi gen ảnh sau này:

👉Khi tag hoặc viết prompt, nên mô tả biểu cảm khuôn mặt thật trong ảnh, ví dụ:

🔹subtle smile, bright eyes, soft expression, confident look...

🔹Những từ này giúp AI gen ra ảnh có cảm xúc rõ ràng, không bị đơ, vô hồn.

👉Kết hợp với thông số lens/tiêu cự (ví dụ: Canon 85mm lens, f1.8 aperture) sẽ giúp tăng chiều sâu, độ tự nhiên và ánh sáng ảnh thực tế.

⚠️Lỗi cần tránh khi train LoRA khuôn mặt

🔹Dùng quá ít ảnh (1–2) → AI bị “học vẹt"

🔹Ảnh che mặt, nhiều filter, background loạn

🔹Prompt viết sơ sài ("Asian girl smiling")

🔹Repeat cao + Epoch cao → Overfit: nhòe mờ, biến dạng hoặc gen cứ y chang data một cách thô cứng

📈Kiểm tra sau khi train

🔹Test trên 2–3 checkpoint khác nhau

🔹Dùng prompt đơn giản xem AI có tái tạo đúng khuôn mặt không, ví dụ: "portrait of a young Asian woman, dslr photo, natural lighting" hoặc "realistic close-up photo of an Asian girl, subtle smile, soft background"

🔹Nếu AI vẫn nhận ra mặt đúng → OK, LoRA thành công

📘Các bạn chịu khó đọc và tư duy một chút xíu thì với các LoRA khác cũng train dễ dàng thôi. Bài mình viết cũng cực kỳ chi tiết rồi, xin đừng yêu cầu làm VIDEO (mình không có thời gian và cũng không muốn làm) – Hãy dùng tư duy học tập chứ đừng dùng tư duy "TÀU NHANH". 🚀

📘Sau khi các bạn đọc xong bài này, mình hy vọng các bạn sẽ có những sản phẩm tốt - Đừng tải lên những nội dung chất lượng thấp, cũng đừng đổ lỗi cho nền tảng AI chưa đủ tốt để làm việc cẩu thả. AI là công cụ để tạo ra những điều phi thường - nhưng chỉ khi chúng ta đặt ra tiêu chuẩn cao cho chính mình.

🎯Chúc các bạn thành công!

 

HƯỚNG DẪN TRAIN LORA KHUÔN MẶT CỰC DỄ HIỂU TRÊN SHAKKER AI

HƯỚNG DẪN TRAIN LORA KHUÔN MẶT CỰC DỄ HIỂU TRÊN SHAKKER AI

HƯỚNG DẪN TRAIN LORA KHUÔN MẶT CỰC DỄ HIỂU TRÊN SHAKKER AI


Tác giả: Phạm Thanh Bình

Đăng nhận xét (0)
Mới hơn Cũ hơn