NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN
Tên luận án: Khai phá mẫu dãy có trọng số trong Cơ sở dữ liệu Dãy
Mã số: 9 48 01 04
Chuyên ngành: Hệ thống thông tin
Họ và tên NCS: Trần Huy Dương
Khóa đào tạo: 2016-2020
Chức danh, học vị, họ và tên người hướng dẫn:
1. TS. Nguyễn Trường Thắng
2. GS.TS. Vũ Đức Thi
Tên cơ sở đào tạo: Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Nội dung: Luận án nghiên cứu và đề xuất các thuật toán khai phá các mẫu dãy có trọng số trong các Cơ sở dữ liệu dãy có khoảng cách thời gian, Cơ sở dữ liệu dãy định lượng có khoảng cách thời gian. Các đóng đóng góp mới của luận án cụ thể như sau:
1. Đề xuất 01 thuật toán khai phá top-k mẫu dãy có trọng số với khoảng cách thời gian trong CSDL dãy có khoảng cách thời gian là TopKWFP. Thuật toán sử dụng chiến lược tăng dần ngưỡng hỗ trợ và chiến lược tạo mẫu dãy ứng viên hứa hẹn nhất nhờ vậy ngưỡng hỗ trợ sẽ tăng nhanh hơn và không gian tìm kiếm cũng sẽ được giảm xuống đáng kể.
2. Đề xuất 02 thuật toán khai phá mẫu dãy lợi ích cao với khoảng cách thời gian trên CSDL dãy định lượng có khoảng cách thời gian là UIPrefixSpan và HUISP. Trong đó thuật toán UIPrefixSpan sử dụng chiến lược 2 pha: pha 1 thực hiện sinh ra các mẫu ứng viên mẫu dãy lợi cao với khoảng cách thời gian, pha 2 thực hiện tính lại lợi ích thực của các mẫu ứng viên và tìm ra mẫu dãy lợi ích cao với khoảng cách thời gian. Thuật toán HUISP sửdụng một cấu trúc bảng là bảng lợi ích để duy trì ngưỡng cận trên và lợi ích thực của các mẫu dãy và một cấu trúc bảng chỉ mục để tăng tốc tìm kiếm khi xây dựng các CSDL chiếu trên CSDL dãy định lượng có khoảng cách thời gian.