Skip to content

Chúc mừng nhóm sinh viên viên ngành Khoa học Dữ liệu đăng bài báo tại Hội nghị Quốc tế về Xử lý Ngôn ngữ Tự nhiên PACLIC (Hạng B theo CORE2021)

Khoa Khoa học và Kỹ thuật Thông tin xin được chúc mừng nhóm sinh viên thuộc ngành Khoa học dữ liệu, Khóa 2018, Khoa Khoa học và Kỹ thuật Thông tin đã có bài báo được chấp nhận tại Hội nghị Quốc tế về Xử lý Ngôn ngữ Tự nhiên PACLIC 2021.

Bài báo: "Span Detection for Aspect-Based Sentiment Analysis in Vietnamese" do nhóm sinh viên Nguyễn Thị Thanh Kim, Huỳnh Khải Siếu, Phan Lực Lượng, Phạm Huỳnh Phúc

thực hiện dưới sự hướng dẫn của giảng viên ThS. Nguyễn Văn Kiệt, ThS. Nguyễn Đức Vũ

Mô tả bài báo: Phân tích cảm xúc dựa trên khía cạnh (aspect-based sentiment analysis) đóng một vai trò thiết yếu trong xử lý ngôn ngữ tự nhiên và trí tuệ nhân tạo. Tuy nhiên, các nhà nghiên cứu chỉ tập trung vào phát hiện khía cạnh và phân loại tình cảm mà bỏ qua nhiệm vụ quan trọng là nhận dạng khoảng ý kiến người dùng, vốn có tiềm năng ứng dụng thực tế rất lớn. Trong bài báo này, chúng tôi trình bày một tập dữ liệu tiếng Việt mới bao gồm 35,396 khoảng ý kiến được gán nhãn hoàn toàn thủ công với hơn 11,122 bình luận của người dùng nhằm phục vụ cho nhiệm vụ nhận dạng khoảng ý kiến trong phân tích cảm tính dựa trên khía cạnh. Bên cạnh đó, chúng tôi cũng đề xuất một hệ thống sử dụng BiLSTM-CRF cho nhiệm vụ nhận dạng khoảng ý kiến. Kết quả tốt nhất là 62.76 điểm F1 macro cho phát hiện ý kiến khía cạnh bằng cách sử dụng BiLSTM-CRF với đặc trưng được trích xuất từ nhúng kết hợp âm tiết, nhúng ký tự và nhúng theo ngữ cảnh XLM-RoBERTa. Bộ dữ liệu của chúng tôi được cung cấp miễn phí  phucj vụ cho các mục đích nghiên cứu.

Thông tin chi tiết: https://www.facebook.com/UIT.ISE/

Hải Băng - Cộng tác viên Truyền thông trường Đại học Công nghệ Thông tin