TRANG THÔNG TIN LUẬN ÁN TIẾN SĨ
Tên đề tài luận án tiến sĩ: Phát hiện một số sự kiện bất thường dựa trên hình ảnh sử dụng mô hình phân cấp
Chuyên ngành: Kỹ thuật máy tính
Mã số: 9.48.01.06
Họ và tên NCS: Vũ Hoài Nam
Người hướng dẫn khoa học: PGS. TS. Phạm Văn Cường
Cơ sở đào tạo: Học viện Công nghệ Bưu chính Viễn thông
NHỮNG KẾT QUẢ MỚI CỦA LUẬN ÁN:
Luận án nghiên cứu đề xuất mô hình học sâu phân cấp để cải thiện hiệu năng, tốc độ xửlý cho các hệ thống nhận dạng, phát hiện bất thường sử dụng Camera. Hệ thống giám sát thu thập hình ảnh từ các khu vực quan tâm, dữ liệu sau đó được xử lý bằng mô hình phân cấp. Dựa trên mục tiêu này, luận án có những đóng góp mới được thể hiện như sau:
1. Đề xuất được mô hình phân cấp tổng quát cho nhận dạng các sự kiện bất thường tỉnh. Sự kiện bất thường tĩnh là sự kiện bất thường không có tính chất chuyển động của đối tượng bắt thường. Mô hình phân cấp cải thiện hiệu năng và tốc độ xử lý so với các kỹ thuật khác cho bài toán nhận dạng sự kiện bất thường tỉnh. Các kết quả thực nghiệm với mô hình phân cấp cho hai bài toán nhận dạng phát hiện hố sụt và sạt lở đường chứng minh tính hiệu quả của mô hình phân cấp. Các nội dung được triển khai trong quá trình xây dựng mô hình phân cấp cho phát hiện đối tượng bất thường tĩnh là tiền đề để xây dựng mô hình phân cấp phát hiện bất thường động.
2. Đề xuất mô hình phân cấp tổng quát cho nhận dạng sự kiện bất thường động. Sự kiện bất thường động là sự kiện bất thường xảy ra nhưng có yếu tố chuyển động của đối tượng bắt thường. Bên cạnh những đặc điểm tĩnh của đối tượng bất thường, các đặc điểm chuyển động theo thời gian của đối tượng bất thường cũng là một trong những yếu tố quan trọng để phát hiện chính xác vị trí của đối tượng bất thường trong ảnh/video. Mô hình phân cấp cho nhận dạng, phát hiện đối tượng bất thường động được xây dựng dựa trên sự kết hợp của bộ trích xuất đặc trưng thời gian và bộ trích xuất đặc trưng không gian theo từng cấp độ cho phép nhận dạng chính xác hơn. Mô hình phân cấp cho độ chính xác cao hơn với tỉ lệ cảnh báo giả thấp, tốc độ xử lý nhanh hơn so với các mô hình khác. Độ chính xác của mô hình tới từ các cấp của mô hình phân cấp đã loại bỏ đi phần lớn các đối tượng không liên quan ở ánh nền, và bộ trích xuất đặc trưng thời gian mô hình hóa được đối tượng chuyển động trong video. Tốc độ xử lý nhanh hơn xuất phát từ việc các hình ảnh đối tượng đi tới các chặng lọc mạnh là hình ảnh đã được cắt ra từ video ảnh gốc với kích thước nhỏ. Mô hình phân cấp cho phát hiện sự kiện bất thường động được thử nghiệm với bài toán phát hiện lửa trong video. Những kết quả so sánh với các phương pháp khác cho thấy hiệu của của mô hình phân cấp với các đối tượng bất thường động.
3. Luận án xây dựng hai bộ dữ liệu làm tiêu chuẩn đánh giả các mô hình phát hiện nhận dạng sự kiện bất thường. Cụ thể, bộ dữ liệu LandslidePTIT được xây dựng cho bài toán phát hiện sạt lở trên đường sau mưa lũ. Bộ dữ liệu bao gồm 2963 ảnh chứa các loại sạt lở như đất, đá, bùn, sụt lún. Bộ dữ liệu FirePTIT bao gồm video chứa lửa trong khung hình phục vụ cho việc đánh giá mô hình phân cấp cho sự kiện bất thường động. Bộ dữ liệu bao gồm 1032 video được thu thập trực tiếp từ hệ thống giám sát bằng camera. Độ dải video thay đổi từ 16 giây đến 15 phút, chứa các đối tượng lửa ở kích thước, vị trí, và màu sắc khác nhau.
CÁC ỨNG DỤNG, KHẢ NĂNG ỨNG DỤNG TRONG THỰC TIÊN HOẶC NHỮNG VẪN ĐỂ CÒN BỎ NGỎ CẦN TIẾP TỤC NGHIÊN CỨU:
Nhận dạng phát hiện sự kiện bất thường là một trong những bài toán có ý nghĩa thực tiễn cao. Những kết quả bước đầu của luận án có thể được sử dụng làm tiền đề cho việc xây dựng các hệ thống cảnh báo sự kiện bất thường xảy ra trong thực tế. Về mặt khoa học, một số hướng tiếp cận tiếp theo có thể được triển khai để nâng cao hơn hiệu năng của mô hình phân tầng nhận dạng sự kiện bất thường:
1. Dựa trên những tiền đề nghiên cứu về nhận dạng sự kiện bất thường từ dữ liệu camera, mô hình phân cấp có thể được áp dụng để nhận dạng sự kiện bất thường trong trường hợp kết hợp dữ liệu từ camera và từ các cảm biến khác (cảm biến đeo).
2. Nghiên cứu nâng cấp bộ lọc yếu bằng việc tích hợp thông tin về ngữ cảnh. Nghiên cứu cách thức kết hợp thông tin ngữ cảnh vào mô hình phân cấp.
3. Nghiên cứu xây dựng mô hình phân cấp cho phép huấn luyện các chặng của mô hình phân cấp cùng lúc để giảm thời gian huấn luyện và công sức điều chỉnh các tham số tại các chặng của mô hình phân cấp.