THÔNG TIN VỀ LUẬN ÁN TIẾN SĨ
1. Tên luận án: Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt.
2. Mã số: 9460110
3. Chuyên ngành: Cơ sở toán học cho tin học.
4. Họ và tên nghiên cứu sinh: Nguyên Văn Sơn
5. Người hướng dẫn khoa học:
1. PGS. TS Lê Thanh Hương
2. TS Nguyễn Chí Thành
6. Cơ sở đào tạo: Viện Khoa học và Công nghệ quân sự.
7. Tóm tắt những kết quả mới của luận án:
Luận án đã đạt được một số kêt quả mới cụ thể như sau:
– Đề xuất 2 kỹ thuật trích rút từ khóa dựa trên trọng số if-idf kết hợp với từ loại, và dựa trên kỹ thuật trích rút đặc trưng và mô hình mạng nơ ron truyền thẳng FFNN.
– Đề xuất 2 kỹ thuật phát hiện đoạn sao chép dựa trên thuật toán LDA kết hợp với thuật toán tìm tập phổ biến Apriori và kỹ thuật sử dụng mạng nơ ron học sâu LSTM.
– Xây dựng kho ngữ liệu đơn ngữ tiếng Việt cho bài toán phát hiện sao chép văn bản.