Skip to content
  • Tiếng Việt
  • English

Nhóm sinh viên cao học có bài báo được nhận đăng tại IEEE IEEE Transactions on Image Processing

Chúc mừng nhóm sinh viên cao học có bài báo được nhận đăng tại IEEE Transactions on Image Processing (T-IP) là tạp chí quốc tế được xếp vào danh mục ISI uy tín, xếp hạng Q1

Bài báo: “Instance-level Few-shot Learining with Class Hierarchy Mining”

Sinh viên thực hiện:

Nguyễn Vũ Anh Khoa (Học viên cao học khóa 2021, MMLab)

Nguyễn Nhật Duy (Học viên cao học khóa 2018, MMLaB)

Tóm tắt bài báo: Hiện nay, các thuật toán máy học nói chung và deep learning nói riêng đang ngày càng phát triển và có rất nhiều ứng dụng trong xã hội. Phần lớn các thuật toán này đều dựa trên học có giám sát và yêu cầu nguồn dữ liệu “khổng lồ” để huấn luyện. Mặc dù vậy, việc xây dựng một bộ dữ liệu khổng lồ như vậy rất tốn kém chi phí xây dựng lẫn tài nguyên tính toán (CPU, GPU, bộ nhớ lưu trữ). 

Bài báo của các tác giả đi ngược lại xu hướng trên: làm sao để có thể huấn luyện tốt dưới điều kiện dữ liệu khan hiếm, mà vẫn đảm bảo được hiệu suất của mô hình. Bài toán few-shot learning (Học với ít mẫu) được ra đời để giải quyết tình huống trên. Tuy nhiên, hầu hết các thuật toán trong few-shot hiện nay ít chú ý đến việc khai thác mối quan hệ giữa các lớp đối tượng trong tập dữ liệu để tối ưu các đặc trưng rút trích từ mô hình. Các lớp đối tượng (ví dụ: chó-mèo, xe hơi-xe buýt,…) đều có các thông tin, đặc trưng liên quan với nhau về mặt thị giác. Việc khai thác các thông tin liên quan này một cách hiệu quả sẽ giúp mô hình dễ dàng xác định được các đối tượng mới. Để dễ hiểu, ta có thể lấy ví dụ: lớp chim (bird) có thể mang nhiều đặc trưng của các lớp khác như “lông giống gấu”, “sải cánh giống máy bay”. 

Trong công trình này, nhóm tác giả đã tạo các thông tin siêu lớp đối tượng (superclass) nhằm mô tả mối liên quan giữa các lớp đối tượng dựa trên thông tin phân tầng (hierarchical information) từ các đặc trưng thị giác. Hơn thế nữa, bằng việc đề xuất mô hình học sâu và cách huấn luyện hiệu quả để khai thác đặc trưng liên quan này, công trình đã đạt được hiệu quả cao khi so với các nghiên cứu trước đó trong bộ dữ liệu chuẩn MS-COCO, một bộ dữ liệu rất nổi tiếng trong cộng đồng nghiên cứu.

Kết quả nghiên cứu này là kết quả làm việc không ngừng nghỉ của nhóm nghiên cứu tại Phòng thí nghiệm Truyền thông đa phương tiện (MMLab) và hợp tác với Tam V. Nguyen, Associate Professor of Computer Science, University of Dayton (USA) và Thanh-Toan Do, Senior Lecturer tại the Department of Data Science and AI, Faculty of Information Technology, Monash University (Australia).

IEEE Transactions on Image Processing (T-IP) là tạp chí quốc tế được xếp vào danh mục ISI uy tín, xếp hạng Q1 trong 25 năm liên tiếp đến nay với các chỉ số Impact Factor 11.0 (năm 2023) và HIndex lên đến 296. Tạp chí T-IP là tạp chí hàng đầu về lý thuyết, thuật toán và các mô hình máy học liên quan đến mảng thị giác máy tính, xử lý hình ảnh, học sâu... Có thể nói, T-IP là một trong những tạp chí có quy trình kiểm duyệt và đánh giá khắt khe bậc nhất hiện nay trong.

Thông tin chi tiết: https://www.facebook.com/UIT.Fanpage/posts/pfbid02fH9YE2eTfdJFQUqit16cJyYFR3NnKHd2h8mkoxztSu3grtvA2VnXzPeXwYsqWH5ql

Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin