NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN
Tên luận án: Nghiên cứu cải tiến một số phương pháp phân tích quan điểm mức khía cạnh dựa trên học máy
Ngành: Hệ thống thông tin Mã số: 9 48 01 04
Họ và tên nghiên cứu sinh: NGUYỄN THỊ NGOC TÚ
Chức danh, học vị, họ và tên người hướng dẫn: PGS TS Nguyễn Việt Anh
Cơ sở đào tạo: Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Nội dung: nêu ngắn gọn những đóng góp mới về mặt học thuật, lý luận, những luận điểm mới rút ra được từ kết quả nghiên cứu, khảo sát của luận án
1- Đề xuất một hệ thống nối tiếp thực hiện ba nhiệm vụ trích rút khía cạnh, dự đoán điểm cảm xúc khía cạnh, ước lượng trọng số khía cạnh của bài toán phân tích quan điểm dựa trên khía cạnh. Nhiệm vụ trích rút khía cạnh được thực hiện thông qua đề xuất một phương pháp học bán giám sát dựa trên xác suất có điều kiện kết hợp thuật toán bootstraping. Phương pháp đề xuất có thể trích rút cả hai loại khía cạnh rõ ràng và khía cạnh ẩn, đồng thời cũng trích rút được các khía cạnh có tần suất thấp. Bộ phân lớp Naive Bayes thực hiện dự đoán điểm cảm xúc khía cạnh. Đối với nhiệm vụ ước lượng trọng số khía cạnh, một phương pháp dựa trên nội dung bài viết của người dùng và tính phổ quát trong toàn bộ kho ngữ liệu được đề xuất. Phương pháp đề xuất không yêu cầu phải biết điểm đánh giá cảm xúc của từng khía cạnh cũng như điểm đánh giá tổng thể của bài viết.
2- Đề xuất một phương pháp bán giám sát dựa trên biểu diễn Word2vec kết hợp độ đo hỗ trợ. Phương pháp dựa trên biểu diễn word2vec có thể giải quyết vấn đề ngữ nghĩa của từ phụ thuộc các ngữ cảnh khác nhau của chúng.
3- Đề xuất một phương pháp phân loại cảm xúc đa lớp bằng cách kết hợp các bộ phân loại cơ sở (SVM và mạng Bayes cổng OR) sử dụng lý thuyết Dempster-Shafer. Phương pháp đề xuất có hiệu quả tốt hơn so với hai phương pháp cơ sở và có thể giải quyết vấn đề tách các lớp gần nhau, vấn đề dữ liệu mất cân bằng trong bài toán phân loại đa lớp.