eprintid: 2756 rev_number: 9 eprint_status: archive userid: 274 dir: disk0/00/00/27/56 datestamp: 2017-12-11 09:48:40 lastmod: 2017-12-11 09:48:40 status_changed: 2017-12-11 09:48:40 type: article metadata_visibility: show creators_name: Nguyen, Xuan Nam creators_name: Nguyen, Dai Tho creators_id: namnx228@gmail.com creators_id: nguyendaitho@vnu.edu.vn corp_creators: University of Engineering and Technology, Vietnam National University, Hanoi title: Một phương pháp trích rút đặc trưng tổng quát hóa trong phát hiện thâm nhập mạng dựa trên bất thường ispublished: inpress subjects: IT divisions: fac_fit note: Phiên bản tiếng Anh của bài báo này "Intrusion Detection Using a More General Feature Extraction Method for Payload-based Anomaly One-Class Classifier" đã được trình bày tại hội thảo lần thứ II Một số vấn đề chọn lọc về an toàn thông tin (SOIS 2017), qua phản biện được giải thưởng "Best Paper Award", được Cục An toàn thông tin của Bộ Thông tin và Truyền thông lựa chọn để dịch sang tiếng Việt đưa vào chuyên san Khoa học Công nghệ của Bộ Thông tin và Truyền thông số cuối năm 2017. abstract: Bài báo này đề xuất một phương pháp trích rút đặc trưng trong phân lớp dữ liệu tổng quát hơn so với một hệ thống phát hiện thâm nhập mạng dựa trên bất thường có tên là McPAD đã được đề xuất trước đây. Vấn đề đặt ra là số đặc trưng được trích rút tăng lên có thể làm tăng độ phức tạp và giảm độ chính xác của phương pháp phân lớp tổng quát hóa. Vì vậy, phương pháp lựa chọn đặc trưng Chi-Square được sử dụng để lọc ra chỉ những đặc trưng tốt nhất. Chúng tôi đã làm nhiều thí nghiệm với bộ dữ liệu là các tấn công HTTP thật để đánh giá hiệu năng của phương pháp trích rút đặc trưng tổng quát hóa kết hợp lọc Chi-Square. Kết quả cho thấy bộ phân lớp của chúng tôi có thể nhanh chóng phát hiện các gói tin tấn công với tỷ lệ dương tính thật rất cao trong khi duy trì tỷ lệ dương tính giả ở mức rất thấp. Ngoài ra, kết quả cũng cho thấy hiệu năng bộ phân lớp của chúng tôi vượt trội hơn so với McPAD. date: 2017-12 date_type: published publisher: Bộ Thông tin và Truyền thông official_url: http://ictvietnam.vn/BaoIn.htm?volid=c2705338-0fc3-42dd-916d-4664b5071aec contact_email: nguyendaitho@vnu.edu.vn full_text_status: public publication: Chuyên san Các công trình nghiên cứu, phát triển và ứng dụng Công nghệ thông tin và Truyền thông refereed: TRUE referencetext: [1] A. Blum and L. Pat, "Selection of relevant features and examples in machine learning," Artificial Intelligence, pp. 245-271, 1997. [2] Dash and Liu, "Feature selection for classification," Intelligent Data Analysis, vol. 1, no. 1-4, pp. 131-156, 1997. [3] S. Dhillon, S. Mallela and R. Kumar, "A divisive information-theoretic feature clustering algorithm for text classification," Journal of Machine Learning Research, p. 1265–1287, 2003. [4] R. O. Duda, P. E. Hart and D. G. Stork, "Pattern Classification," Wiley, 2000. [5] D. Koller and S. Sahami, "Toward Optimal Feature Selection," In Proceedings of the Thirteenth International Conference on Machine Learning (ICML), pp. 284-292, 1996. [6] E. Leopold and j. Kindermann, "Text categorization with support vector machines," How to represent texts in input space? Machine Learning, p. 423–444, 2002. [7] H. Liu and H. Motoda, "Computational Methods of Feature Selection," Chapman and Hall/CRC Press, p. 2007. [8] H. Ogura, H. Amano and K. Kondo, "Feature selection with a measure of deviations from Poisson in text categorization," Expert Systems with Applications, p. pages 6826–6832, 2009. [9] K. Pearson, "On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling," Philosophical Magazine, p. 157–175, 1900. [10] H. Peng, F. Long and C. Ding, "Feature selection based on mutual information: criteria of Max-Dependency, Max-Relevance, and Min-Redundancy," IEEE Transactions on Pattern Analysis and Machine Intelligence, p. 1226–1238, 2005. [11] R. Perdisci, D. Ariu, P. Fogla, G. Giacinto and W. Lee, "McPAD : A Multiple Classifier System for Accurate Payload-based Anomaly Detection," Computer Networks, Special Issue on Traffic Classification and Its Applications to Modern Networks, pp. 864-881, 2009. [12] J. Tax, "One-Class Classification, Concept Learning in the Absence of Counter Examples," PhD thesis, Delft University of Technology, 2001. [13] K. Wang and S. Stolfo, "Anomalous payload-based network intrusion detection," In Recent Advances in Intrusion Detection (RAID), 2004. [14] K. Wang and S. Stolfo, "Anomalous payload-based worm detection and signature generation," In Recent Advances in Intrusion Detection (RAID), 2005. [15] Y. Yang and J. O. Pedersen, "A comparative study on feature selection in text categorization," Proceedings of the 14th International Conference on Machine Learning (ICML '97), p. 412–420 , 1997. citation: Nguyen, Xuan Nam and Nguyen, Dai Tho (2017) Một phương pháp trích rút đặc trưng tổng quát hóa trong phát hiện thâm nhập mạng dựa trên bất thường. Chuyên san Các công trình nghiên cứu, phát triển và ứng dụng Công nghệ thông tin và Truyền thông . (In Press) document_url: https://eprints.uet.vnu.edu.vn/eprints/id/eprint/2756/1/NguyenXuanNam_NguyenDaiTho_finalVersion.pdf