Skip to content
  • Tiếng Việt
  • English

Nhóm sinh viên Khoa học máy tính có bài báo khoa học được đăng tại Hội nghị quốc tế MAPR2023

Bài báo:  “Evolving Prompts for Synthetic Image Generation with Genection with Genetic Algorithm”

Sinh viên thực hiện:

Trần Đình Khối - 26511482 - Khoa học máy tính - Tác giả chính

Bùi Viết Đạt - 20521162 - Khoa học Máy tính - Đồng tác giả

Giáo viên hướng dẫn: TS. Lương Ngọc Hoàng

Tóm tắt bài báo:

Khả năng tiếp cận đến các mô hình tạo hình ảnh từ văn bản (Text-to-image generation) ngày càng tăng trong những năm gần đây. Việc này đòi hỏi đến phải tìm kiếm những câu prompt thích hợp để tạo ra

hình ảnh chất lượng cao và thỏa mãn các tiêu chí của người dùng. Câu prompt là một kiểu nhập văn bản cụ thể được tạo ra bởi người dùng nhằm cung cấp cho hệ thống sinh tạo ảnh để hướng dẫn

việc sinh ra những hình ảnh tương ứng. Tuy nhiên, việc tạo các câu prompt phù hợp theo cách thủ công vẫn là một thách thức không hề nhỏ. Hiện tại đang có những phương pháp tiếp cận đến sự tự động tạo ra những câu prompt chất lượng cao bằng cách sử dụng các thuật toán tiến hóa (Evolutionary Algorithms) để phát triển một quần thể các câu prompt qua từng thế hệ cho đến khi có những câu prompt thích hợp có thể tạo ra những hình ảnh mong muốn. EvoGen framework, sử dụng thuật giải di truyền (Genetic Algorithms), là một framework tiến hóa và tối ưu câu prompt đáng mong chờ. Tuy nhiên, kết quả mà nó mang lại vẫn chưa mang tính nhất quán. Trong bài báo này, chúng tôi sử dụng cách triển khai một cách cài đặt thuật giải di truyền khác dành cho EvoGen. Với cơ chế bảo vệ những cá thể ưu tú, cách cài đặt này đảm bảo rằng

những câu prompt tốt sẽ không bị vô tình loại bỏ do tính ngẫu nhiên của các cơ chế của thuật toán di truyền. Hơn nữa, chúng tôi đồng thời thay đổi hàm thích nghi mới thành hàm mất mát cosine (cosine loss function) để đạt được sự hội tụ nhanh hơn và hướng dẫn hình ảnh tốt hơn

Chúng em xin gửi lời cám ơn đến Thầy Lương Ngọc Hoàng – Tiến sĩ Khoa Khoa học máy tính tại Trường Đại học Công nghệ Thông tin đã tận tình hướng dẫn và chỉ ra những mặt hạn chế của chúng em trong quá trình nghiên cứu và công bố bài báo khoa học quốc tế này.

Hội nghị MAPR 2023 (6-th International Conference on Multimedia Analysis and Pattern Recognition) là hội nghị quốc tế lần thứ 6 về phân tích đa phương tiện và nhận dạng mẫu. 

- Hội nghị là diễn đàn khoa học để giới học thuật, nghiên cứu trong và ngoài nước đến giao lưu, trao đổi kinh nghiệm. Hội nghị khuyến khích các nghiên cứu sinh, học viên cao học và những nhà khoa học trẻ tham gia báo cáo, trao đổi kết quả nghiên cứu và học tập của bản thân, và đặc biệt những kết quả nghiên cứu có tính ứng dụng thực tiễn.

- Ban tổ chức Hội nghị đã nhận được các tham luận của các nhà khoa học. Các tham luận tập trung vào các lĩnh vực: nhận dạng và học máy, phân tích nội dung đa phương tiện, sinh trắc học và phân tích ảnh y khoa, thị giác máy tính và Robot, phân tích - nhận dạng văn bản và các ứng dụng liên quan khác. 

- Để tạo điều kiện thúc đẩy và phát triển các hoạt động nghiên cứu tại Trường ĐH CNTT, Ban Tổ chức của Hội nghị mời các nhà nghiên cứu, giáo sư, giảng viên nhiều kinh nghiệm từ các trường đại học, viện nghiên cứu ưu tín, các công ty trong và ngoài nước có tiềm lực mạnh thuộc các lĩnh vực liên quan.

Thông tin chi tiết: https://www.facebook.com/UIT.Fanpage/posts/pfbid02cvXk8QNGiN31wo6bAHxvUd3aGM2PBtPrUBGL6QXacwyx37pMDQiQ6DXX2fB6K6sMl

Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin