การใช้ sequential pattern mining ด้วย Weka

จากการที่มีผู้เข้าร่วมอบรมการขุดเหมืองข้อมูลด้วย Weka ได้มาสอบถามถึงการใช้เทคนิค sequential pattern mining ใน Weka ผมเลยขอนำมาอธิบายใน blog นี้ดังนี้ครับ
1. ดาวน์โหลดไฟล์โปรแกรม Weka ที่มี version มากกว่า 3.6.1  ซึ่งมีการสร้างขึ้นมาหลังจากวันที่ 02/07/2009 สามารถดาวน์โหลดได้ตาม link นี้นะครับ
http://www.cs.waikato.ac.nz/~ml/weka/snapshots/stable-3-6.zip
download snapshot weka software
download snapshot weka software















2. เมื่อดาวน์โหลดไฟล์มาได้แล้วให้ทำการ unzip ไฟล์ที่ได้ออกมา และเปลี่ยนไดเร็กทอรีไปยังไอเร็กทอรีที่ได้ทำการ unzip ออกมา
3. ใช้คำสั่ง java -jar weka.jar และเลือกเมนู Weka Explorer จะหน้าต่างจะปรากฏขึ้นมาให้เห็น
4. ดาวน์โหลดไฟล์ตัวอย่าง สำหรับการหา sequential pattern ซึ่งภายในไฟล์จะเป็นแบบนี้
@relation sequential_test_set
@attribute day {1, 2, 3}
@attribute ‘power consumption’ {power=base, power=peak}
@attribute ‘wind speed’ {wind=calm, wind=breeze}
@data
1,power=base,wind=calm
1,power=peak,wind=breeze
2,power=base,wind=calm
2,power=peak,wind=breeze
3,power=base,wind=calm
3,power=peak,wind=breeze
จากไฟล์ตัวอย่างที่แสดงนี้ถ้าเขียนให้อยู่ในรูปของ sequence จะได้เป็น
Sequence ID sequence item
1 {power=base,wind=calm},{power=peak,wind=breeze}
2 {power=base,wind=calm},{power=peak,wind=breeze}
3 {power=base,wind=calm},{power=peak,wind=breeze}
ในการสร้าง sequence แบบในตารางจะใช้การ group transaction ตามแอตทริบิวต์ day และแต่ละ sequence มีความยาวเท่ากับ 2
5. ในแท็บ Preprocess ให้เปิดไฟล์ที่ดาวน์โหลดได้เข้าไปใช้งาน
preprocess
หลังจากอ่านไฟล์เข้าไปใน Weka
















6. ไปที่แท็บ Associate และกดปุ่ม Choose เพื่อเลือกเทคนิค GeneralizedSequentialPatterns
เลือกเทคนิค GeneralizedSequentialPatterns ในแท็บ Associate
เลือกเทคนิค GeneralizedSequentialPatterns ในแท็บ Associate
















และเมื่อคลิกที่ GeneralizedSequentialPatterns จะปรากฏหน้าต่างสำหรับแก้ไขพารามิเตอร์ ซึ่งจะขอธิบายที่ๆ สำคัญๆ ดังนี้
  • dataSeqID : เป็นการระบุว่าแอตทริบิวต์ไหนที่จะใช้เป็น sequence ID
  • minSupport : ค่า support ต่ำสุดที่จะสนใจ sequence ต่างๆ
    GSP_parameter
    หน้าต่างแสดงค่าพารามิเตอร์ที่สามารถแก้ไขได้ของเทคนิค GSP











7. กดปุ่ม start ผลที่ได้จะเป็นดังในรูป
ผลการทำ sequential pattern mining ด้วย Weka
ผลการทำ sequential pattern mining ด้วย Weka















แหล่งข้อมูลเพิ่มเติม


แหล่งที่มาด้วยว่ามาจาก www.open-miner.com