NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN
Tên luận án: Tra cứu ảnh dựa vào nội dung với học biểu diễn và giảm chiều dữ liệu.
Ngành: Khoa học máy tính Mã số: 9 48 01 01
Họ và tên nghiên cứu sinh: AN HỒNG SƠN
Chức danh, học vị, họ và tên người hướng dẫn: PGS.TS. Nguyễn Hữu Quỳnh
Cơ sở đào tạo: Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Nội dung
Luận án đã đề xuất được hai phương pháp tra cứu ảnh dựa vào nội dung sử dụng phản hồi liên quan, gồm: phương pháp SDAIR (Sparse Discriminant Analysis for Image Retrieval) và phương pháp AIR (Autoencoders for Image Retrieval).
1. Phương pháp SDAIR kết hợp mô hình trích rút đặc trưng quan trọng dựa trên phương pháp RSLDA với mô hình phân lớp trong hệ thống tra cứu ảnh dựa vào nội dung nhằm cải tiến độ chính xác và thời gian truy vấn. Phương pháp này giải quyết được ba vấn đề: Thứ nhất, số lượng phản hồi mà người dùng cung cấp nhỏ hơn so với chiều của không gian đặc trưng. Thứ hai, số lượng mẫu phản hồi dương thường thấp hơn rất nhiều so với số lượng mẫu phản hồi âm. Thứ ba, số lớp quá nhỏ, mà có nghĩa rằng số các hướng chiếu bị giới hạn bởi số các lớp.
2. Phương pháp AIR dựa trên ba thành phần: Huấn luyện bán giám sát bằng mạng nơ ron tích chập autoencoder, trích rút đặc trưng ảnh và phân lớp SVM trong phản hồi liên quan nhằm cải tiến độ chính xác và thời gian truy vấn. Phương pháp này giải quyết được hai hạn chế: Thứ nhất, khả năng phân biệt kém của các phương pháp đã có. Thứ hai, giảm nhẹ vấn đề vanishing/exploding gradients và quá trình hội tụ nhanh.