Chúc mừng sinh viên ngành Khoa học Dữ liệu - UIT được chấp nhận đăng tại tạp chí quốc tế uy tin ISI/Q1 với chỉ số ảnh hưởng cao

T6, 19/08/2022 - 10:08

Khoa Khoa học và Kỹ thuật Thông tin xin được chúc mừng nhóm sinh viên ngành Khoa học Dữ liệu, khoa Khoa học và Kỹ thuật Thông tin đã có bài báo khoa học được chấp nhận đăng tại tạp chí quốc tế uy tín ISI (theo Web of Science), Q1 (theo Scimago) Neural Computing & Applications với chỉ số ảnh hưởng cao Impact Factor (IF) = 5.102.

Xin được chúc mừng nhóm sinh viên:

- Trần Quốc Khánh – 18520908 – KHDL2018 (Tác giả chính)

- Nguyễn Trọng Ân – 18520434 – KHDL2018

- Hoàng Gia Phú – 19520215– KHDL2019

- Lưu Đức Cảnh – 19521272 – KHDL2019

Giảng viên hướng dẫn:

- ThS. Nguyễn Văn Kiệt

- TS. Đỗ Trọng Hợp

Tên bài báo khoa học: “Vietnamese Hate and Offensive Detection using PhoBERT-CNN and Social Media Streaming Data”

Tóm tắt bài báo:

Sự phát triển của cách mạng công nghiệp 4.0 đã và đang dần thay đổi cuộc sống của con người theo từng ngày, nhất là với sự phát triển mạnh mẽ của mạng xã hội. Khi đó, an toàn không gian mạng là một vấn đề ảnh hưởng trực tiếp tới đời sống của người sử dụng đặc biệt là đối tượng như trẻ em hay những người dễ bị tổn thương.

Như đã đề cập, việc lượng lớn bình luận có nội dung xúc phạm, phản cảm hiện diện và sinh ra liên tục trên mạng xã hội làm ảnh hưởng sâu sắc tới người dùng. Đặc biệt, trong bối cảnh Chính Phủ đang từng bước mở cửa lại nền kinh tế hướng tới “bình thường mới” sống chung với COVID-19. Điều này khiến cho các cơ quan, tổ chức ra sức không chỉ dựa vào đội ngũ kiểm duyệt hay sự ý thức của người dùng, mà thay vào đó là một giải pháp hiệu quả, tiết kiệm và có khả năng xử lý lượng lớn nội dung tiêu cực này.

Trong bối cảnh cấp thiết đó, giải pháp của chúng tôi đề xuất có tiềm năng ứng dụng rất lớn trong môi trường mạng xã hội tại Việt Nam. Từ việc nghiên cứu mô hình, kết quả nghiên cứu của chúng tôi có thể ứng dụng vào việc phân loại liên tục và hàng loạt bình luận trực tiếp từ các trang mạng xã hội tại Việt Nam. Bên cạnh đó, giải pháp từ mô hình còn có thể ứng dụng vào các cơ quan, tổ chức có nhu cầu tương tự tại các trang thông tin truyền thông của mình. Từ đó, giải pháp giúp nâng cao sự kiểm duyệt toàn diện bình luận xúc phạm, thù địch trên không gian mạng tại Việt Nam.

Cụ thể, giải pháp của nhóm đề xuất gồm hai đóng góp chính: đề xuất phương pháp mới và hiệu quả để giải quyết bài toán phát hiện ngôn ngữ xúc phạm tiếng Việt dựa trên mô hình PhoBERT-CNN; xây dựng các ứng dụng phân loại trực tiếp, liên tục nội dung từ kho dữ liệu lớn của mạng xã hội video Youtube để chứng minh tính ứng dụng của đề tài. Bên cạnh đó, nghiên cứu cũng có những đóng góp bổ sung liên quan đến bài toán, chẳng hạn như việc triển khai các kỹ thuật tiền xử lý cho dữ liệu truyền thông xã hội và các kỹ thuật tăng cường dữ liệu phù hợp, giúp cải thiện đáng kể hiệu suất của các mô hình.

Một lần nữa, xin chúc mừng và trân trọng cảm ơn sự cố gắng của các bạn.