Chào các bạn, trong bài viết này mình sẽ hướng dẫn các bạn cách để chúng ta có thể cố định nhân vật, đồng nhất nhân vật khi vẽ hình AI.
Như các bạn cũng đã biết, việc vẽ hình với AI thì có rất nhiều công cụ AI hiện nay đã làm được: https://leonardo.ai/ , shakker , Copilot, Tensor AI, Chat GPT… bạn có thể xem hướng dẫn các công cụ vẽ hình tại đây.
Tuy nhiên, mỗi lần với mỗi câu lệnh thì AI lại cho chúng ta những hình ảnh gần như khác nhau dẫn đến khó để làm video được. Sau đây là cách chúng ta có thể cố định nhân vật.
Bài viết này hướng dẫn các bạn hai cách (ứng với việc sử dụng Chat GPT hoặc Gemini) để vẽ hình đồng nhất nhân vật:
Cách 1. Sử dụng Chat GPT và Leonardo
Bài viết này mình sử dụng Chat GPT (bản miễn phí cũng được nhé) để tạo câu lệnh và Leonardo (miễn phí) để tạo hình
Bước 1. Trong Chat GPT ta Cài đặt (dạy) để Chat GPT bắt đầu làm theo ý mình như sau:
Bây giờ, tôi và bạn sẽ cùng nhau trao đổi về một vấn đề duy nhất để vẽ hình nhân vật. Tôi sẽ đưa ra một cái tên, và mô tả sơ bộ bạn sẽ trả lại cho tôi câu lệnh (promt) hoàn chỉnh bao gồm các chi tiết trên gương mặt, chi tiết về trang phục bằng tiếng Anh để tôi có thể tạo ảnh bằng công cụ AI generator. Bạn đã hiểu và sẵn sàng chứ?Chat GPT sẽ trả lời chúng ta đồng ý:

Bước 2. Chẳng hạn ở đây tôi muốn vẽ hình nhân vật Hải Thượng Lãn Ông để làm một video về lịch sử Hải Thượng Lãn Ông, tôi ghi
Hải Thượng Lãn Ông, danh y nổi tiếng của Việt NamLập tức Chat GPT cho mô tả
A highly detailed and realistic portrait of Hải Thượng Lãn Ông (Lê Hữu Trác), the famous Vietnamese physician from the 18th century. He is depicted as an elderly man with a long, flowing white beard, deep and wise eyes that reflect his vast medical knowledge. His face has gentle wrinkles, showing both wisdom and compassion. He wears a traditional Vietnamese scholar’s robe in deep blue or brown, made of soft silk, with intricate embroidery. On his head, he dons a khăn vấn (Vietnamese scholar’s turban). His hands gently hold an ancient medical book or a brush for writing medical records. The background is a serene, classical Vietnamese setting, possibly a traditional wooden house with medicinal herbs around. Soft, warm lighting enhances the historical and scholarly atmosphere
Bước 3. Sao chép câu lệnh này rồi vào các công cụ vẽ hình, chẳng hạn ở đây tôi chọn leonardo.ai
Trong Leonardo dán câu lệnh đã copy vào, chọn tạo ảnh, cài đặt preset là Cinematic Kino, Style là Close-up, Tương phản Medium, tỉ lệ 16:9 rồi sau đó bấm Generate

ta được ảnh nhân vật như sau:

Bước 4. Bây giờ tôi bắt đầu tạo ra các tư thế khác nhau cho cùng nhân vật này, tôi sẽ yêu cầu Chat GPT bổ sung thêm vài tư thế khác nhau
Hãy liệt kê giúp tôi 5 tư thế của nhân vật Hải Thượng Lãn Ông vừa mô tả và các hành động mà tôi có thể thêm vào promt để làm cho ảnh sinh động hơnChat GPT cho 5 tư thế khác nhau như sau:


Đây là một số câu lệnh Chat GPT đưa
1. Ngồi trên ghế đọc sách y học cổ truyền
Mô tả: Hải Thượng Lãn Ông ngồi trên một chiếc ghế gỗ cổ, tay cầm một cuốn sách y học cổ truyền, mắt chăm chú đọc, khuôn mặt trầm tư, ánh sáng dịu nhẹ hắt vào từ cửa sổ.
Thêm vào prompt: "Sitting on an antique wooden chair, carefully reading an ancient medical book, with a thoughtful expression, warm sunlight streaming in through a nearby window."
2. Cầm bút lông viết y thư
Mô tả: Ông ngồi trên bàn gỗ, tay cầm bút lông đang viết trên một cuộn giấy, xung quanh có nhiều sách y học và hộp mực tàu. Khuôn mặt tập trung, thể hiện sự chuyên tâm nghiên cứu.
Thêm vào prompt: "Seated at a wooden table, holding a calligraphy brush, carefully writing on an ancient scroll, surrounded by traditional medical books and inkstones, his face showing deep concentration."
3. Bắt mạch cho bệnh nhân
Mô tả: Ông đang nhẹ nhàng bắt mạch cho một bệnh nhân với vẻ mặt điềm tĩnh và đầy kinh nghiệm. Bệnh nhân ngồi trước mặt, nhìn ông với sự tin tưởng.
Thêm vào prompt: "Gently checking the pulse of a patient, his fingers resting on the patient’s wrist with great precision, his face calm and wise, radiating a sense of deep medical knowledge and compassion."
4. Đứng trước giá sách, tìm kiếm tài liệu y học
Mô tả: Ông đứng trước một giá sách lớn chứa nhiều cuốn sách cổ, tay lướt qua các cuốn sách như đang tìm kiếm một bài thuốc quan trọng.
Thêm vào prompt: "Standing before a large wooden bookshelf filled with ancient medical texts, his hand gently touching the spines of books as he searches for important knowledge, his eyes filled with wisdom and curiosity."
5. Chuẩn bị thuốc từ thảo dược
Mô tả: Ông đang bào chế thuốc từ thảo dược, nghiền thuốc trong cối đá hoặc phân loại dược liệu trên bàn gỗ. Xung quanh là nhiều loại cây thuốc quý.
Thêm vào prompt: "Carefully preparing traditional medicine, grinding herbs in a stone mortar, or sorting medicinal plants on a wooden table, surrounded by baskets of rare herbal ingredients, embodying the essence of traditional Vietnamese medicine."Bước 5. Bây giờ, chỉ cần trở lại công cụ vẽ ảnh (lúc nãy tôi dùng leonardo.ai, vẫn là câu lệnh cũ, tôi chỉ cần bổ sung thêm các promt này là sẽ tạo ra được các tư thế khác. Chẳng hạn như thêm vào cái số 5: Ông đang bào chế thuốc từ thảo dược, nghiền thuốc trong cối đá hoặc phân loại dược liệu trên bàn gỗ. Xung quanh là nhiều loại cây thuốc quý
Carefully preparing traditional medicine, grinding herbs in a stone mortar, or sorting medicinal plants on a wooden table, surrounded by baskets of rare herbal ingredients, embodying the essence of traditional Vietnamese medicineTổng hợp là được:
A highly detailed and realistic portrait of Hải Thượng Lãn Ông (Lê Hữu Trác), the famous Vietnamese physician from the 18th century. He is depicted as an elderly man with a long, flowing white beard, deep and wise eyes that reflect his vast medical knowledge. His face has gentle wrinkles, showing both wisdom and compassion. He wears a traditional Vietnamese scholar’s robe in deep blue or brown, made of soft silk, with intricate embroidery. On his head, he dons a khăn vấn (Vietnamese scholar’s turban). Carefully preparing traditional medicine, grinding herbs in a stone mortar, or sorting medicinal plants on a wooden table, surrounded by baskets of rare herbal ingredients, embodying the essence of traditional Vietnamese medicineKết quả ta được

rất giống ở trên rồi phải không các bạn.
Ngoài ra, các bạn cũng có thể copy câu lệnh cũ sang google dịch để xem có phần nào thừa không thì mình xóa bớt cũng được.
Mình làm thêm cái số 4 coi thử nha: Ông đứng trước một giá sách lớn chứa nhiều cuốn sách cổ, tay lướt qua các cuốn sách như đang tìm kiếm một bài thuốc quan trọng
....Standing before a large wooden bookshelf filled with ancient medical texts, his hand gently touching the spines of books as he searches for important knowledge, his eyes filled with wisdom and curiosity
Kết quả ta được rất giống luôn nè các bạn.

Đây là do mình chọn phong cách cận cảnh, nếu bạn muốn chọn đổi các ngoại cảnh xung quanh và không cận cảnh thì có thể điều chỉnh lại cài đặt trên các AI vẽ hình nhé
Cách 2. Sử dụng Gemini (khuyến nghị)
Mình đã sử dụng thử Gemini của google và kết quả quá tuyệt vời luôn các bạn, trang web: https://gemini.google.com/.
Chẳng hạn, mình muốn làm video về câu chuyện “Trí khôn của ta đây”, muốn vậy mình sẽ sử dụng AI để vẽ hình rồi sau đó đưa vào các công cụ để tạo video.
Ở đây, mình sẽ sử dụng Chat GPT hoặc bạn cũng có thể dùng Gemini để yêu cầu cho mình một câu lệnh vẽ người nông dân chất phác thật thà Việt Nam, mình có được câu lệnh như sau:
A Vietnamese farmer from a traditional folktale, standing confidently in a lush green rice field. He wears a simple brown áo bà ba (traditional Vietnamese farmer's outfit) with rolled-up sleeves, and a nón lá (Vietnamese conical hat) slightly tilted on his head. His face has a cunning and wise expression, with a slight smirk showing his intelligence. His hands are rough from labor, and he holds a thick rope in one hand, symbolizing his cleverness. The background is a bright, sunny countryside with golden rice fields. The art style is semi-realistic, with detailed textures and soft lighting to enhance the folklore settingMình đưa toàn bộ câu này vào trong Gemini, kết quả được như sau

Tiếp theo, kịch bản mình muốn xuất hiện thêm con trâu, vì câu chuyện Trí khôn của ta đây gồm 3 nhân vật là người nông dân- con trâu và con hổ. Mình chỉ cần yêu cầu:
This farmer is leading a buffalo in the field.Đại khái dịch là “người nông dân dắt theo con trâu trên đồng cỏ” và được kết quả là:

Bạn thấy không, hình ảnh người nông dẫn vẫn đảm bảo đồng nhất không vấn đề gì luôn nè
Tiếp tục, mình muốn thêm con hổ, mình yêu cầu tiếp
This farmer and his buffalo met a tiger in the field.Và kết quả Gemin vẫn đồng nhất nhân vật, mà có thêm con hổ cho mình rồi nè

Tiếp tục, theo kịch bản, mình muốn người nông dân nói chuyện với con hổ bàn về việc con hổ hỏi trí khôn của người nông dân ở đâu, khúc này mình muốn cận cảnh thì mình thêm chữ “close up” vào nha, cụ thể mình yêu cầu
Close-up of this farmer talking to a tigerGemini cho mình hình này, vẫn đảm bảo đồng nhất người nông dân và con hổ luôn nè

Còn đây là người nông dân trói con hổ vào gốc cây, mình dùng yêu cầu
This farmer tied this tiger to a tree by wrapping many ropes around it.(Mấy cái này mình toàn dùng Google dịch không thôi nha, mau lẹ mà, đại khái là (Người nông dân này đã trói con hổ vào cây bằng cách quấn nhiều sợi dây thừng quanh nó) kết quả được

Rất là khá luôn đúng không các bạn, đó là do mình dùng câu lệnh còn sơ sài, các bạn thử nghiên cứu dùng câu lệnh kĩ hơn có lẽ sẽ còn tốt hơn nữa đó
Chúc bạn thành công, có vấn đề gì các bạn comment vào bên dưới nha, mình sẽ luôn hỗ trợ.