KHAI THÁC CÁC MẪU TUẦN TỰ ĐÓNG HIỆU QUẢ SỬ DỤNG CÂY TIỀN TỐ
Main Article Content
Tóm tắt
Khai thác mẫu tuần tự đóng là một trong những công việc quan trọng trong lãnh vực khai thác dữ liệu. Khai thác mẫu tuần tự đóng được đề xuất để giải quyết các vấn đề tiêu hao bộ nhớ và thời gian khai thác trong khai thác mẫu tuần tự từ cơ sở dữ liệu chuỗi cụ thể như khi khai thác với chuỗi tuần tự phổ biến dài sẽ chứa một tổ hợp lớn các chuỗi con phổ biến hoặc khi sử dụng các ngưỡng hỗ trợ rất thấp để khai thác các mẫu tuần tự thì số lượng mẫu tuần tự rất lớn và tốn nhiều thời gian để khai phá hơn. Vì vậy, việc sử dụng mối quan hệ cha con trên cấu trúc cây tiền tố để cải tiến hiệu suất của quá trình khai thác mẫu tuần tự từ cơ sở dữ liệu chuỗi cũng là một phương pháp quan trọng trong khái thác dữ liệu. Bằng cách sử dụng mối quan hệ cha con trên cấu trúc cây tiền tồ, bài viết này đưa ra một thuật toán hiệu quả cho việc khai phá các mẫu tuần tự đóng từ cơ sở dữ liệu chuỗi. Các kết quả trong phần thực nghiệm cho thấy hiệu suất thời gian chạy của thuật toán đề xuất rất lớn và số lượng các mẫu tuần tự cũng giảm đáng kể.