Skip to content
  • Tiếng Việt
  • English

2 SINH VIÊN UIT LÀ ĐỒNG TÁC GIẢ CỦA BÀI BÁO KHOA HỌC ĐƯỢC ĐĂNG TẠI HỘI NGHỊ QUỐC TẾ RANK A TỔ CHỨC TẠI THỤY SỸ 

Bài báo: “SIW 2021: ICDAR Competition on Script Identification in the Wild” của sinh viên UIT đã được đăng tại hội nghị quốc tế Rank A tổ chức tại Thụy Sĩ. Bài báo do hai sinh viên Lê Quang Hưng và Nguyễn Quốc Cường là đồng tác giả dưới sự hỗ trợ của giáo viên hướng dẫn Ths. Đỗ Văn Tiến.

Bài báo trình bày tổng kết cuộc thi Nhận dạng các loại ngôn ngữ (Script Identification in the Wild - SIW2021) được tổ chức tại hội nghị ICDAR 2021. Mục tiêu của SIW2021 là đánh giá các phương pháp tiếp cận để giải quyết bài toán Script Identification thông qua một tập dữ liệu kích thước lớn gồm 13 ngôn ngữ được chia thành 2 loại chữ in và chữ viết tay. Cuộc thi bao gồm 3 task khác nhau phụ thuộc vào loại dữ liệu (chữ in hoặc chữ viết tay) sử dụng trong quá trình huấn luyện và kiểm thử. 19 nhóm nghiên cứu ở các trường đại học và doanh nghiệp đã tham gia vào SIW2021, có 6 nhóm vào đến vào chung kết và đã gửi khoảng 166 thuật toán để tính điểm. Các bài dự thi bao gồm nhiều giải pháp học sâu cũng như các phương pháp tiếp cận dựa trên kỹ thuật xử lý ảnh thông thường. Kết quả từ các nhóm nghiên cứu đã chứng minh độ chính xác vượt trội của các phương pháp học sâu so với các phương pháp thống kê truyền thống. Phương pháp tốt nhất thu được có độ chính xác phân loại lên đến 99% trong cả 3 task thực hiện trên 50 nghìn ảnh kiểm thử. Kết quả cho thấy vẫn còn nhiều điểm có thể cải tiến, đặc biệt là ở các mẫu chữ viết tay và các loại chữ đặc biệt.

Nhóm chúng tôi đã đề xuất phương pháp sử dụng mạng ResNet để phân loại chữ in/chữ viết tay, sau đó sẽ đưa qua mạng EfficientNet để phân loại ra 13 loại ngôn ngữ theo yêu cầu bài toán. Phương pháp mà nhóm đề xuất có độ chính xác lọt Top 4 ở vòng chung kết với độ chính xác phân loại hơn 97%.

The International Conference on Document Analysis and Recognition (ICDAR) là hội nghị quốc tế uy tín hàng đầu được xếp hạng A dành cho các nhà khoa học, nhà nghiên cứu về học máy và trí tuệ nhân tạo nhằm giải quyết các bài toán trong lĩnh vực phân tích và nhận dạng tài liệu trong ảnh như nhận dạng ký tự và biểu tượng, nhận dạng chữ in/viết tay, tài liệu cổ và thư viện số, phân tích và nhận dạng scene text trong camera và video,… Đây là lĩnh vực ngày càng có tầm quan trọng trong thời đại chuyển đổi số hiện nay. Hội nghị ICDAR lần thứ 16 năm 2021 sẽ được tổ chức lần đầu tiên tại Lausanne, Thụy Sỹ, do tình hình dịch Covid nên mọi người có thể chọn tham dự hội nghị bằng hai hình thức online hoặc on-site. https://icdar2021.org/

Thông tin chi tiết: https://www.facebook.com/UIT.Fanpage

Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin