Skip to content

Chúc mừng sinh viên ngành Khoa học Dữ liệu Dữ liệu - UIT được chấp nhận đăng tại tạp chí Quốc tế uy tin ISI/Q1 với chỉ số ảnh hưởng cao

Chúc mừng nhóm sinh viên ngành Khoa học Dữ liệu, khoa Khoa học và Kỹ thuật Thông tin đã có bài báo khoa học được chấp nhận đăng tại tạp chí quốc tế uy tín ISI (theo Web of Science), Q1 (theo Scimago) Neural Computing & Applications với chỉ số ảnh hưởng cao Impact Factor (IF) = 5.102.

Xin được chúc mừng:

 Nhóm sinh viên:

- Trần Quốc Khánh – 18520908 – KHDL2018 (Tác giả chính)

- Nguyễn Trọng Ân – 18520434 – KHDL2018

- Hoàng Gia Phú – 19520215– KHDL2019

- Lưu Đức Cảnh – 19521272 – KHDL2019

Giảng viên hướng dẫn:

- ThS. Nguyễn Văn Kiệt

- TS. Đỗ Trọng Hợp

  Tên bài báo khoa học: “Vietnamese Hate and Offensive Detection using PhoBERT-CNN and Social Media Streaming Data”

Tóm tắt bài báo:

Sự phát triển của cách mạng công nghiệp 4.0 đã và đang dần thay đổi cuộc sống của con người theo từng ngày, nhất là với sự phát triển mạnh mẽ của mạng xã hội. Khi đó, an toàn không gian mạng là một vấn đề ảnh hưởng trực tiếp tới đời sống của người sử dụng đặc biệt là đối tượng như trẻ em hay những người dễ bị tổn thương.

Như đã đề cập, việc lượng lớn bình luận có nội dung xúc phạm, phản cảm hiện diện và sinh ra liên tục trên mạng xã hội làm ảnh hưởng sâu sắc tới người dùng. Đặc biệt, trong bối cảnh Chính Phủ đang từng bước mở cửa lại nền kinh tế hướng tới “bình thường mới” sống chung với COVID-19. Điều này khiến cho các cơ quan, tổ chức ra sức không chỉ dựa vào đội ngũ kiểm duyệt hay sự ý thức của người dùng, mà thay vào đó là một giải pháp hiệu quả, tiết kiệm và có khả năng xử lý lượng lớn nội dung tiêu cực này.

Trong bối cảnh cấp thiết đó, giải pháp của chúng tôi đề xuất có tiềm năng ứng dụng rất lớn trong môi trường mạng xã hội tại Việt Nam. Từ việc nghiên cứu mô hình, kết quả nghiên cứu của chúng tôi có thể ứng dụng vào việc phân loại liên tục và hàng loạt bình luận trực tiếp từ các trang mạng xã hội tại Việt Nam. Bên cạnh đó, giải pháp từ mô hình còn có thể ứng dụng vào các cơ quan, tổ chức có nhu cầu tương tự tại các trang thông tin truyền thông của mình. Từ đó, giải pháp giúp nâng cao sự kiểm duyệt toàn diện bình luận xúc phạm, thù địch trên không gian mạng tại Việt Nam.

Cụ thể, giải pháp của nhóm đề xuất gồm hai đóng góp chính: đề xuất phương pháp mới và hiệu quả để giải quyết bài toán phát hiện ngôn ngữ xúc phạm tiếng Việt dựa trên mô hình PhoBERT-CNN; xây dựng các ứng dụng phân loại trực tiếp, liên tục nội dung từ kho dữ liệu lớn của mạng xã hội video Youtube để chứng minh tính ứng dụng của đề tài. Bên cạnh đó, nghiên cứu cũng có những đóng góp bổ sung liên quan đến bài toán, chẳng hạn như việc triển khai các kỹ thuật tiền xử lý cho dữ liệu truyền thông xã hội và các kỹ thuật tăng cường dữ liệu phù hợp, giúp cải thiện đáng kể hiệu suất của các mô hình.

Nhóm sinh viên xin gửi lời cảm ơn đến Thầy Nguyễn Văn Kiệt và Thầy Đỗ Trọng Hợp đã đồng hành cùng nhóm và tận tình hướng dẫn trong suốt quá trình học tập, nghiên cứu và công bố bài báo khoa học.

Nhóm tác giả xin gửi lời cảm ơn đến Khoa Khoa học và Kỹ thuật thông tin, Nhóm Xử lý Ngôn ngữ Tự nhiên UIT (NLP@UIT) và Câu lạc bộ Xử lý Ngôn ngữ và Tiếng nói tiếng Việt (VLSP) đã tạo điều kiện thuận lợi nhất cho các bạn hoàn thành nghiên cứu này.

Nhóm cũng xin chân thành cảm ơn quý thầy cô của Trường Đại học Công nghệ Thông tin – ĐHQG TP.HCM đã tận tâm, nhiệt huyết truyền đạt cho chúng tôi những kiến thức hữu ích cũng như các kỹ năng cần thiết để có thể đạt được những thành công nhất định sau này. Đây là một cơ hội tuyệt vời để chúng tôi có được nhiều kinh nghiệm trong các dự án xử lý dữ liệu thời gian thực, các kiến thức về cách thiết kế và phân tích các dự án trí tuệ nhân tạo/xử lý ngôn ngữ tự nhiên thực tế. Một lần nữa, xin chúc mừng và trân trọng cảm ơn sự cố gắng của các bạn.

Thông tin tạp chí:

Tạp chí Neural Computing and Applications được xuất bản bởi nhà xuất bản Springer. Springer là một nhà xuất bản khoa học, kỹ thuật và y tế hàng đầu trên toàn cầu, cung cấp cho các nhà nghiên cứu trong các học viện, tổ chức khoa học và bộ phận R&D của công ty những nội dung chất lượng thông qua thông tin, sản phẩm và dịch vụ sáng tạo. Springer là một phần của Springer Nature, một nhà xuất bản toàn cầu phục vụ và hỗ trợ cộng đồng nghiên cứu. Springer Nature hướng tới mục tiêu thúc đẩy sự khám phá bằng cách xuất bản khoa học sâu sắc và mạnh mẽ, hỗ trợ sự phát triển của các lĩnh vực nghiên cứu mới và làm cho các ý tưởng và kiến thức có thể tiếp cận trên khắp thế giới.

Neural Computing & Applications là một tạp chí quốc tế xuất bản các công trình nghiên cứu trong lĩnh vực ứng dụng thực tế của Neural Computing và các kỹ thuật liên quan như thuật toán di truyền, fuzzy logic và hệ thống neuro-fuzzy. Đây là tạp chí quốc tế uy tín nên quá trình xét duyệt khắt khe và chặt chẽ. Các bài báo được xuất bản sẽ là những đóng góp chất lượng cao, đại diện cho những nghiên cứu, phát triển hoặc ứng dụng mới và quan trọng có giá trị và giá trị sử dụng thực tế. Chúng sẽ được xem xét bởi các chuyên gia có trong lĩnh vực Học máy, Trí tuệ nhân tạo, Xử lý ngôn ngữ tự nhiên và các Hệ thống thông minh.

Đây là tạp chí khoa học quốc tế uy tín được xếp hạng Q1 (theo Scimago) trong danh mục ISI (theo Web of science) với hệ số ảnh hưởng cao Impact Factor (IF) = 5.102 (2021).

Thông tin chi tiết: https://www.facebook.com/154808901278325/posts/pfbid0328DDWVuC63PEX2RHqwec4hiCEFR9GsiKBv6rn6wDbr2wVkbG5bnusVAZsrjcdoNel/

Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin