Luận án Nghiên cứu một số kỹ thuật phân hạng trong tra cứu ảnh dựa vào nội dung Lưu

Luận án Nghiên cứu một số kỹ thuật phân hạng trong tra cứu ảnh dựa vào nội dung

Danh mục: , Người đăng: Liên Kim Nhà xuất bản: Tác giả: Ngôn ngữ: Tiếng Việt, Tiếng Anh Định dạng: , Lượt xem: 10 lượt Lượt tải: 0 lượt
Tài liệu, tư liệu này được chúng tôi sưu tầm từ nhiều nguồn và được chia sẻ với mục đích tham khảo, các bạn đọc nghiên cứu và muốn trích lục lại nội dung xin hãy liên hệ Tác giả, bản quyền và nội dung tài liệu thuộc về Tác Giả & Cơ sở Giáo dục, Xin cảm ơn !

Nội dung

Mở đầu

Tính cấp thiết của đề tài

Sự phát triển mạnh mẽ của Internet cho phép dễ dàng xây dựng, lưu trữ các cơ sở dữ liệu lớn. Một trong số đó là Flickr¹, YouTube, Facebook³, Twitter và toàn bộ mạng Internet. Yêu cầu khai thác một cách hiệu quả dữ liệu đa phương tiện trên thúc đẩy sự quan tâm của cộng đồng nghiên cứu [21]. Nhiều hệ thống tìm kiếm thông tin văn bản và ảnh như Google, Bing, Yahoo đã được phát triển mạnh mẽ trong những năm gần đây nhưng vẫn chưa đáp ứng được nhu cầu người dùng. Sự phát triển mạnh mẽ của dữ liệu đa phương tiện ngày càng trở thành một thách thức lớn. Khi kích thước của kho ảnh rất lớn cách tiếp cận tra cứu bằng từ khóa trở nên không khả thi dẫn tới các nghiên cứu khai thác tra cứu dựa trên nội dung dữ liệu ảnh.

Tra cứu ảnh dựa vào nội dung (Content-based image retrieval) hay gọi tắt là CBIR được giới thiệu bởi các nghiên cứu từ những năm 1980. CBIR đã được đã được nghiên cứu rộng rãi, nhiều phương pháp và hệ thống đã được phát triển để trích rút nội dung của ảnh bằng cách sử dụng các đặc trưng mức thấp. Dữ liệu trong CBIR được lấy trên cơ sở các nội dung mà nó trích rút bằng cách sử dụng các kỹ thuật trích rút đặc trưng mức thấp bên trong của mỗi ảnh (màu sắc, hình dạng, kết cấu, vv).

Tuy CBIR có nhiều tiến bộ song người dùng vẫn gặp khó khăn trong việc tìm kiếm thông tin liên quan từ tập dữ liệu ảnh lớn không đồng nhất về mặt nội dung và ngữ nghĩa. Điều này dẫn đến kết quả tìm kiếm chưa đạt được như mong muốn. Thông tin mà máy tính hiểu nội dung ảnh thường là các giá trị điểm ảnh, vector đặc trưng được trích rút theo các thủ tục,… còn con người hiểu về nội dung của ảnh thường là các khái niệm ngữ nghĩa. Do không có sự tương quan một cách chính xác giữa nội dung mà máy tính có được thông qua đặc trưng trực quan mức thấp với nội dung mà con người hiểu thông qua các khái niệm ngữ nghĩa mức cao dẫn đến khoảng trống ngữ nghĩa. Khoảng trống ngữ nghĩa định nghĩa theo Smeulders và cộng sự [94] như sau:

“Khoảng trống ngữ nghĩa là sự không tương đồng giữa thông tin ảnh, được trích rút từ dữ liệu trực quan so với diễn giải về dữ liệu ảnh đó bởi người dùng trong tình huống cụ thể”.

Khoảng trống ngữ nghĩa nằm giữa các đặc trưng trực quan mức thấp của các ảnh và các ngữ nghĩa mức cao mong muốn dự định suy ra từ các đặc trưng trực quan mức thấp. Nhiều nghiên cứu trong lĩnh vực CBIR đến nay vẫn đang cố gắng thu hẹp khoảng trống ngữ nghĩa này. Cụ thể, hơn ba thập kỉ qua nhiều hệ thống CBIR đã được phát triển, bao gồm QBIC [28], Photobook [80], MARS [79], [83], [90], PicHunter [17], VisualSEEK [96], Blobworld [11], MindReader [46], SIMPLI-city [110], FIRE [23], và các nghiên cứu khác [12], [41], [60], [115], [124].

Mục tiêu, phạm vi nghiên cứu của luận án

Thông thường một hệ thống tra cứu ảnh dựa vào nội dung được miêu tả như Hình 0.1 [62]. Các nội dung trực quan của các ảnh trong cơ sở dữ liệu được trích rút và miêu tả bởi các vector đặc trưng nhiều chiều. Các vector đặc trưng của các

ảnh trong cơ sở dữ liệu tạo nên một cơ sở dữ liệu đặc trưng. Để tra cứu các ảnh, thông tin truy vấn của người dùng đưa vào hệ thống tra cứu có thể là các ảnh mẫu hoặc vẽ phác thảo. Hệ thống sau đó sẽ biến đổi những mẫu này tương ứng với biểu diễn của các vector đặc trưng. Các độ tương tự hoặc các khoảng cách giữa các vector đặc trưng của ảnh truy vấn với các ảnh trong cơ sở dữ liệu được tính và tra cứu được thực hiện dựa trên một lược đồ chỉ số. Lược đồ chỉ số đưa ra một cách hiệu quả để tìm kiếm các ảnh trong cơ sở dữ liệu. Qua khảo sát nhiều nhiên  cứu CBIR, sự kết hợp đa đặc trưng chưa được xem xét một cách đầy đủ dẫn đến việc so sánh độ tương tự đạt hiệu quả chưa cao. Trong hệ thống này đánh chỉ số và tra cứu sử dụng kết hợp đa đặc trưng cũng cần được nghiên cứu để nâng cao hiệu quả tra cứu. Để nâng cao kết quả tra cứu chính xác ở đầu ra, luận án đưa ra các mục tiêu và giới hạn phạm vi nghiên cứu như sau.

Tải tài liệu

1.

Luận án Nghiên cứu một số kỹ thuật phân hạng trong tra cứu ảnh dựa vào nội dung

.zip
4.28 MB

Có thể bạn quan tâm