(Giải thích thuật ngữ theo ví dụ thực tế và một số Tip quan trọng)
1. Mục tiêu khi train LoRA
khuôn mặt
Dùng AI nhận
diện đúng khuôn mặt trong nhiều bối cảnh, ánh sáng, góc chụp khác nhau.
Giữ được sự
linh hoạt, tái tạo đúng khuôn mặt mà không bị “đóng khung" hay overfit.
2. Chọn ảnh input cho
đạt chuẩn
➤ Nên chọn từ 6 đến 20 ảnh, đủ góc: chính diện, nghiêng, chếch, ngóc chụp trên dưới...
➤ Ảnh phải:
Rõ nét khuôn
mặt, không che, không filter nặng
Độ phân giải
cao, chi tiết chân thực
Ánh sáng tự
nhiên hoặc studio đều và nhẹ
Background đơn
giản, ít chi tiết, ít màu sắc loạn
Nếu background rối mắt, quá
nhiều chi tiết và màu sắc thì nên xóa font trước khi train
3. Viết caption cho
ảnh
Càng chi tiết
càng tốt, để AI nhận diện đúng khuôn mặt:
"Portrait of a young Asian woman with a small face, natural
skin texture, long black hair, DSLR photo, soft lighting, Canon 85mm lens, f1.8
aperture"
Cố gắng giữ
cấu trúc caption ổn định cho từng ảnh, chỉ thay góc chụp, ánh sáng, biểu cảm...
4. Thông số train đề
xuất (theo số ảnh)
6–10 ảnh:
Repeat 35–40, Epoch 4–6
10–20 ảnh:
Repeat 25–35, Epoch 6–8
Trên 20 ảnh:
Repeat và Epoch tuỳ chỉnh theo số lượng ảnh
Ảnh ít → tăng
Repeat để học sâu từng ảnh. Giảm Epoch để tránh AI sáng tạo quá đà.
Ảnh nhiều →
tăng Epoch để học tổng quát hơn. Giảm Repeat xuống để tránh cho AI bị nhồi quá
nhiều chi tiết -> dễ overfit.
Ví dụ thực tế:
Lớp học vẽ chân dung thầy giáo
Thầy giáo yêu cầu học sinh vẽ chân dung thầy đang ngồi.
Mỗi buổi học, học sinh vẽ 10 lần (Repeat = 10)
Sau mỗi buổi, thầy đổi hướng mặt hoặc tư thế chút xíu, dữ liệu
về khuôn mặt thầy được gia tăng: ví dụ góc này có nốt ruồi, có sẹo,.... Khi đó
học sinh đã có những dữ liệu về khuôn mặt thầy ở những buổi học trước và được
bổ sung thêm những dữ liệu mới.
Sau 5 buổi
(Epoch = 5), học sinh đã nhìn thấy nhiều góc cạnh, chi tiết ẩn như: nốt ruồi,
vết bớt, ánh sáng nghiêng...
Dần dần, vẽ
được chân dung rất đúng với khuôn mặt thầy
Đó là cách AI
học qua Repeat & Epoch khi train LoRA.
Dim &
Alpha – Tổ chức trí nhớ AI (trong phần Advanced settings)
Học sinh vẽ xong, mỗi lần nhìn thấy chi tiết khuôn mặt, họ lại
viết vào sổ tay.
Dim = Số trang
trong sổ tay
(càng nhiều trang, càng ghi được
nhiều chi tiết)
Alpha = Số lần
học sinh mở sổ ra đọc lại trước khi vẽ (càng xem kỹ, vẽ càng chi tiết)
Dim cao +
Alpha cao → AI nhớ nhiều, vẽ chi tiết.
Dim thấp +
Alpha thấp → Vẽ sơ sài, như người đãng trí.
Lưu ý khi chọn
Dim và Alpha khi train LoRA khuôn mặt
Vì LoRA khuôn
mặt thường kết hợp với các LoRA khác (ví dụ: trang phục, tư thế, bối cảnh...),
nên cần cân nhắc kỹ khi chọn Dim và Alpha.
Nếu để chỉ số
Dim quá cao, → LoRA sẽ nặng, khó kết hợp với các LoRA khác hoặc checkpoint
khác.
Gợi ý:
Nếu không cần
quá chi tiết về khuôn mặt, cứ để mặc định Dim/Alpha = 32/32 là ổn.
Nếu cần cực kỳ
chi tiết (ví dụ: focus texture da, ánh sáng, biểu cảm nhẹ) → có thể tăng
Dim/Alpha lên cao (64/64 hoặc 64/128), → nhưng khi tạo ảnh phải chọn LoRA còn
lại thật nhẹ và hạ weight xuống 0.6–0.8 để cân bằng.
Khuyên các bạn
nếu không chắc chắn thì không nên chọn Alpha > Dim nhé
Tagging
Algorithm (Thuật toán gán nhãn)
➤ Là công cụ AI tự động tạo caption (mô tả) cho từng ảnh đầu vào trước khi train.
➤ Các lựa chọn phổ biến:
BLIP: ngắn gọn,
đơn giản, phù hợp đa số trường hợp.
Deepbooru: gán
nhiều tag chi tiết, phù hợp ảnh anime hoặc ảnh phức tạp.
Joy2 / Llava:
gán rất sâu, dễ “tưởng tượng quá đà” → nên kiểm tra lại thủ công.
No Caption: bỏ
qua bước gán tag.
Trigger words
only: chỉ dùng khi bạn thực sự hiểu về cách mô tả hình ảnh bằng tag/caption
Gợi ý: Dùng BLIP hoặc Joy2, sau
đó kiểm tra/sửa tay nếu cần.
Threshold
(Ngưỡng lọc tag)
Là mức độ tự
tin của AI để quyết định có nên gán một tag không.
Threshold càng
thấp → nhiều tag hơn, kể cả tag yếu.
Threshold cao
→ ít tag hơn, dễ bỏ sót đặc điểm nhỏ.
Gợi ý nên để từ 0.3 – 0.5 để
không bị thiếu tag.
Trigger Words
Là nơi nhập
tay các tag bắt buộc, ví dụ: "asian woman, ao dai, soft lighting"...
Khi bấm gán
tag, AI sẽ gộp thêm những từ này vào caption dù có thấy hay không.
Cực kỳ hữu ích
khi muốn giữ tag cố định như tên nhân vật, style, trang phục, bối cảnh...hoặc
muốn chi tiết hóa thuộc tính nào đó.
Nói dễ hiểu:
Trigger Words = tag tự tay thêm vào caption trước khi train
Tip gắn tag
giúp ảnh chân thực hơn
Để giúp AI
hiểu đúng về bối cảnh ảnh thật và ánh sáng tự nhiên, nên gắn thêm một số từ
khóa sau khi tagging:
Gợi ý một số
tag hữu ích:
dslr photo,
realistic lighting, natural skin texture, natural background
shot with
canon 85mm lens, f1.8 aperture, professional photo, studio portrait
asian face,
small face, natural expression, subtle smile, gentle look, realistic
photography
Những tag này giúp AI:
Nhận diện chất
lượng ảnh thật
Giữ ánh sáng
và tone màu tự nhiên khi gen ảnh mới
Tái hiện biểu
cảm tự nhiên, ánh mắt có "hồn"
Mẹo thêm khi
gen ảnh sau này:
Khi tag hoặc
viết prompt, nên mô tả biểu cảm khuôn mặt thật trong ảnh, ví dụ:
subtle smile,
bright eyes, soft expression, confident look...
Những từ này
giúp AI gen ra ảnh có cảm xúc rõ ràng, không bị đơ, vô hồn.
Kết hợp với
thông số lens/tiêu cự (ví dụ: Canon 85mm lens, f1.8 aperture) sẽ giúp tăng
chiều sâu, độ tự nhiên và ánh sáng ảnh thực tế.
Lỗi cần tránh khi train LoRA
khuôn mặt
Dùng quá ít
ảnh (1–2) → AI bị “học vẹt"
Ảnh che mặt,
nhiều filter, background loạn
Prompt viết sơ
sài ("Asian girl smiling")
Repeat cao +
Epoch cao → Overfit: nhòe mờ, biến dạng hoặc gen cứ y chang data một cách thô
cứng
Kiểm tra sau
khi train
Test trên 2–3
checkpoint khác nhau
Dùng prompt
đơn giản xem AI có tái tạo đúng khuôn mặt không, ví dụ: "portrait of a
young Asian woman, dslr photo, natural lighting" hoặc "realistic
close-up photo of an Asian girl, subtle smile, soft background"
Nếu AI vẫn
nhận ra mặt đúng → OK, LoRA thành công
Các bạn chịu
khó đọc và tư duy một chút xíu thì với các LoRA khác cũng train dễ dàng thôi.
Bài mình viết cũng cực kỳ chi tiết rồi, xin đừng yêu cầu làm VIDEO (mình không
có thời gian và cũng không muốn làm) – Hãy dùng tư duy học tập chứ đừng dùng tư
duy "TÀU NHANH".
Sau khi các
bạn đọc xong bài này, mình hy vọng các bạn sẽ có những sản phẩm tốt - Đừng tải
lên những nội dung chất lượng thấp, cũng đừng đổ lỗi cho nền tảng AI chưa đủ
tốt để làm việc cẩu thả. AI là công cụ để tạo ra những điều phi thường - nhưng
chỉ khi chúng ta đặt ra tiêu chuẩn cao cho chính mình.
Chúc các bạn
thành công!
Tác giả: Phạm Thanh
Bình