relation: https://eprints.uet.vnu.edu.vn/eprints/id/eprint/1538/ title: Phân loại câu hỏi sử dụng nhiều loại đặc trưng creator: Nguyen, Van Tu creator: Le, Anh Cuong creator: Nguyen, Ha Nam subject: Information Technology (IT) description: Phân loại câu hỏi là một thành phần quan trọng trong các hệ thống hỏi đáp tự động. Nhiệm vụ chính của phân loại câu hỏi là dự báo kiểu thực thể của câu trả lời của các câu hỏi viết bằng ngôn ngữ tự nhiên. Phân loại câu hỏi có thể được thực hiện bằng các tiếp cận khác nhau như: tiếp cận dựa trên luật, tiếp cận dựa trên học máy. Các đặc trưng khác nhau về từ vựng, cú pháp và ngữ nghĩa có thể được trích xuất tự động từ các câu hỏi để phục vụ việc phân loại. Trong nghiên cứu này chúng tôi kết hợp các đặc trưng về từ vựng, cú pháp, ngữ nghĩa trong phân loại câu hỏi. Chúng tôi đề xuất sử dụng mẫu câu hỏi (Question pattern) như là một đặc trưng mới để kết hợp với các đặc trưng khác trong phân loại câu hỏi. Chúng tôi cũng đề xuất sử dụng các tập đặc trưng khác nhau cho mỗi nhóm câu hỏi với các từ để hỏi khác nhau. Chúng tôi nhận thấy rằng khi sử dụng mẫu câu hỏi như là một đặc trưng và kết hợp với các đặc trưng từ vựng, cú pháp, ngữ nghĩa khác có thể cải thiện đáng kể độ chính xác của phân loại câu hỏi. Chúng tôi đã kiểm tra những đề xuất của mình bằng cách sử dụng bộ phân loại Support Vector Machine trên bộ dữ liệu TREC và đã đạt được độ chính xác phân loại câu hỏi cao hơn so với những nghiên cứu trước đó trên cùng nguyên tắc phân loại và tập dữ liệu. date: 2016-03-26 type: Conference or Workshop Item type: PeerReviewed format: application/pdf language: en identifier: https://eprints.uet.vnu.edu.vn/eprints/id/eprint/1538/1/posters_Hoi%20thao%20NCS%203.2016.pdf identifier: Nguyen, Van Tu and Le, Anh Cuong and Nguyen, Ha Nam (2016) Phân loại câu hỏi sử dụng nhiều loại đặc trưng. In: SW4PHD: the 2016 Scientific Workshop for PhD Students, 26 March 2016, Hanoi.