Lưu

Luận án Nghiên cứu phương pháp chuẩn hoá văn bản và nhận dạng thực thể định danh trong nhận dạng tiếng nói tiếng Việt

Danh mục: Luận văn - Luận án, Tài liệu tham khảo Người đăng: Ly Võ Thị Nhà xuất bản: Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam Tác giả: Nguyễn Thị Thu Hiền Ngôn ngữ: Tiếng Việt, Tiếng Anh Định dạng: DOCX, PDF, ZIP Lượt xem: 3 lượt Lượt tải: 0 lượt

Tải tài liệu Xem thử

Tài liệu, tư liệu này được chúng tôi sưu tầm từ nhiều nguồn và được chia sẻ với mục đích tham khảo, các bạn đọc nghiên cứu và muốn trích lục lại nội dung xin hãy liên hệ Tác giả, bản quyền và nội dung tài liệu thuộc về Tác Giả & Cơ sở Giáo dục, Xin cảm ơn !

Nội dung

NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN

Tên luận án: Nghiên cứu phương pháp chuẩn hoá văn bản và nhận dạng thực thể định danh trong nhận dạng tiếng nói tiếng Việt

Chuyên ngành: Hệ thống thông tin Mã số: 9 48 01 04

Họ và tên nghiên cứu sinh: Nguyễn Thị Thu Hiền

Chức danh, học vị, họ và tên người hướng dẫn 1: PGS.TS. Lương Chi Mai

Chức danh, học vị, họ và tên người hướng dẫn 2: TS. Nguyễn Thị Minh Huyền

Cơ sở đào tạo: Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam

Nội dung: luận án có những đóng góp mới như sau:

1 – Xây dựng các bộ dữ liệu ban đầu phục vụ cho thực nghiệm các mô hình chuẩn hoá và nhận dạng thực thể định danh cho văn bản đầu ra của hệ thống ASR tiếng Việt.

2 – Thiết kế mô hình Transformer Encoder – CRF cho bài toán khôi phục viết hoa và dấu câu cho văn bản đầu ra của ASR tiếng Việt. Đề xuất cách phân chia, hợp nhất các đoạn chồng lấn, giúp các từ xung quanh đoạn cắt có nhiều ngữ cảnh để nhận dạng chính xác.

3 – Đề xuất mô hình biểu diễn ngôn ngữ tiền huấn luyện cho văn bản tiếng Việt với tên gọi ViBERT dựa theo kiến trúc RoBERTa, giúp tăng hiệu quả áp dụng các thuật toán học sâu trong XLNNTN tiếng Việt.

4 – Xây dựng mô hình đường ống cho bài toán NER tiếng nói tiếng Việt. Nghiên cứu cho thấy tác động hiệu quả của mô hình ViBERT khi áp dụng cho nhiệm vụ NER trên văn bản đầu ra của ASR tiếng Việt. Đồng thời nghiên cứu cũng chứng tỏ được việc kết hợp mô hình CaPu vào chuẩn hóa văn bản đầu vào cho mô hình NER giúp cải thiện đáng kể hiệu suất của mô hình.

5 – Thiết kế mô hình E2E giải quyết bài toán NER cho tiếng nói tiếng Việt kết hợp các kỹ thuật chia sẻ tham số, kỹ thuật huấn luyện đa tác vụ. Bên cạnh việc cho thấy đạt hiệu suất tương đương mô hình đường ống, mô hình E2E còn có ưu thế trong triển khai trong thực tiễn.

Tải tài liệu

Luận án Nghiên cứu phương pháp chuẩn hoá văn bản và nhận dạng thực thể định danh trong nhận dạng tiếng nói tiếng Việt

.zip

4.61 MB

Tải tài liệu Xem thử

Luận án Nghiên cứu phương pháp chuẩn hoá văn bản và nhận dạng thực thể định danh trong nhận dạng tiếng nói tiếng Việt

Nội dung

Tải tài liệu

Luận án Nghiên cứu phương pháp chuẩn hoá văn bản và nhận dạng thực thể định danh trong nhận dạng tiếng nói tiếng Việt

Top tải nhiều

Luận án – Giáo dục kỹ năng quan sát cho trẻ mẫu giáo 5-6 tuổi qua trò chơi học tập

Luận Án Tiến Sĩ Kỹ Thuật Nhiệt – Hoàn Thiện Công Nghệ Bảo Quản Quả Vải, Nhãn Trong Môi Trường Lạnh Kết Hợp Bao Gói Khí Cải Biến Bằng Mô Hình Hô Hấp – Bay Hơi – Cân Bằng Năng Lượng

Luận Án Tiến Sĩ Khoa Học Giáo Dục – Giáo Dục Tính Tự Lập Dựa Trên Tiếp Cận Quyền Tham Gia Cho Trẻ Mẫu Giáo 3-4 Tuổi

Luận Án Tiến Sĩ Giáo Dục Học – Giải Pháp Nhằm Nâng Cao Mức Độ Hài Lòng Của Sinh Viên Khi Tham Gia Các Học Phần Giáo Dục Thể Chất Tại Trường Đại Học Sài Gòn

Luân Án Tiến Sĩ Giáo Dục Học – Xây Dựng Tiêu Chuẩn Tuyển Chọn Vận Động Viên Bóng Bàn 8 – 11 Tuổi Tại Tỉnh Long An

Luận Án Tiến Sĩ Khoa Học Giáo Dục – Khai Thác Sự Ngộ Nhận Để Phát Triển Tư Duy Phản Biện Cho Học Sinh Trong Dạy Học Môn Sinh Học Cấp Trung Học Phổ Thông

Có thể bạn quan tâm

Luận án Nghiên cứu đặc điểm dịch tễ lâm sàng, đa hình gen MTHFR và kết quả can thiệp dị tật khe hở môi và/hoặc vòm miệng ở trẻ em điều trị tại bệnh viện Răng Hàm Mặt Trung ương Hà Nội (2019- 2021)

Luận án Nghiên cứu năng lực cạnh tranh của các doanh nghiệp xuất khẩu tôm Tỉnh Kiên Giang

Luận án Nghiên cứu tác động của logistics đối với xuất khẩu hàng hóa của Việt Nam

Luận án Nghiên cứu tương quan giữa nồng độ nitow monoxit trong hơi thở và máu đối với độ nặng cửa ngưng thở tắc nghẽn khi ngủ

Luận án Nghiên cứu chế tạo vật liệu siêu đàn hồi hệ NiTi

Luận án Nghiên cứu nghèo đa chiều ở tỉnh Saravanh, nước Cộng hòa Dân chủ Nhân dân Lào

Luận án Nghiên cứu nuôi cấy tế bào cây nghệ đen (Curcuma zedoaria Roscoe) và khảo sát khả năng tích lũy một số hợp chất có hoạt tính sinh học của chúng

Luận án Nghiên cứu biến dị và khả năng di truyền một số tính trạng của Keo lá liềm (Acacia crassicarpa A. Cunn. ex Benth.) tại các tỉnh miền Trung

Luận án Cơ chế tự chủ tài chính trong giáo dục đại học ở Việt Nam: nghiên cứu trường hợp các trường nghệ thuật, thể dục thể thao công lập

Luận án Nghiên cứu năng lực cung ứng dịch vụ của doanh nghiệp logistics Việt Nam tại vùng kinh tế trọng điểm Bắc Bộ

Thông tin

Danh mục

Liên kết mạng xã hội