VNU-UET Repository

Phân loại câu hỏi sử dụng nhiều loại đặc trưng

Van Tu Nguyen and Anh Cuong Le and Ha Nam Nguyen (2016) Phân loại câu hỏi sử dụng nhiều loại đặc trưng. In: SW4PHD: the 2016 Scientific Workshop for PhD Students, 26 March 2016, Hanoi.

[img] PDF
460kB

Abstract

Phân loại câu hỏi là một thành phần quan trọng trong các hệ thống hỏi đáp tự động. Nhiệm vụ chính của phân loại câu hỏi là dự báo kiểu thực thể của câu trả lời của các câu hỏi viết bằng ngôn ngữ tự nhiên. Phân loại câu hỏi có thể được thực hiện bằng các tiếp cận khác nhau như: tiếp cận dựa trên luật, tiếp cận dựa trên học máy. Các đặc trưng khác nhau về từ vựng, cú pháp và ngữ nghĩa có thể được trích xuất tự động từ các câu hỏi để phục vụ việc phân loại. Trong nghiên cứu này chúng tôi kết hợp các đặc trưng về từ vựng, cú pháp, ngữ nghĩa trong phân loại câu hỏi. Chúng tôi đề xuất sử dụng mẫu câu hỏi (Question pattern) như là một đặc trưng mới để kết hợp với các đặc trưng khác trong phân loại câu hỏi. Chúng tôi cũng đề xuất sử dụng các tập đặc trưng khác nhau cho mỗi nhóm câu hỏi với các từ để hỏi khác nhau. Chúng tôi nhận thấy rằng khi sử dụng mẫu câu hỏi như là một đặc trưng và kết hợp với các đặc trưng từ vựng, cú pháp, ngữ nghĩa khác có thể cải thiện đáng kể độ chính xác của phân loại câu hỏi. Chúng tôi đã kiểm tra những đề xuất của mình bằng cách sử dụng bộ phân loại Support Vector Machine trên bộ dữ liệu TREC và đã đạt được độ chính xác phân loại câu hỏi cao hơn so với những nghiên cứu trước đó trên cùng nguyên tắc phân loại và tập dữ liệu.

Item Type:Conference or Workshop Item (Poster)
Subjects:Information Technology (IT)
Divisions:Faculty of Information Technology (FIT)
ID Code:1538
Deposited By: Dr Ngoc Thang Bui
Deposited On:23 May 2016 03:25
Last Modified:23 May 2016 03:26

Repository Staff Only: item control page