2 ก.ค. 2020 เวลา 03:00 • ธุรกิจ
ตัวอย่างการใช้ Big Data เพื่อส่งเสริมการลงทุน
ช่วงนี้หลาย ๆ คนอาจจะได้ยินคำว่า Big Data หรือ Data Science กันบ่อย ๆ เนื่องจากเรากำลังอยู่ในยุคที่มีการเก็บข้อมูลเป็นจำนวนมากมหาศาล และการใช้ประโยชน์จากข้อมูลเพื่อพัฒนาหรือตอบโจทย์ทางธุรกิจในด้านต่าง ๆ ก็กำลังเป็นที่แพร่หลายเช่นกัน
สำหรับใครที่กำลังสงสัยว่า Big Data สามารถถูกนำไปใช้ประโยชน์จริง ๆ ได้อย่างไร เรามีตัวอย่างการนำความรู้ทาง Big Data ไปใช้ประโยชน์ใน Finance Sector ให้ดูค่ะ
ส่งเสริมการออมเงินของสมาชิก กบข. ด้วย Big Data
โดยตัวอย่างการพัฒนาแบบจำลองเชิงพยากรณ์ (Predictive Model) ที่เรานำเสนอในบทความนี้ มาจากโมเดลจริงที่ทาง Government Big Data Institute (GBDi) ร่วมมือกับสถาบันการเงินที่บริหารกองทุนบำเหน็จบำนาญข้าราชการ (กบข.) ทำขึ้น
กบข. นั้นเป็นสถาบันบริหารเงินออมของข้าราชการเพื่อการเกษียณที่มีความยั่งยืน และมีเป้าหมายในการใช้ข้อมูลที่มีอยู่และความรู้ทาง Data Science เพื่อศึกษาวิจัยด้านการลงทุนในแง่ของเงินออมของสมาชิกเพื่อช่วยให้ กบข. สามารถส่งเสริมและสนับสนุนสมาชิกในการลงทุนที่เหมาะสม และผลักดัน กบข. ให้เป็นองค์กรที่ขับเคลื่อนด้วยข้อมูล (Data Driven Organization) อย่างแท้จริง
หนึ่งในเป้าหมายหลักด้านการส่งเสริมการออมเงินของสมาชิก กบข.นั้นก็คือ ทาง กบข. ต้องการให้สมาชิกมีความสนใจมาเพิ่มการลงทุนในกองทุนบำเหน็จบำนาญข้าราชการ (pension fund) ให้มากขึ้น เพื่อที่ว่าสมาชิกจะได้มีเงินออมที่พอใช้หลังเกษียณ
เราจึงเริ่มจากการใช้ความรู้ทาง Data science มาช่วยในการวิเคราะห์ว่าสมาชิกคนไหนอยู่ในกลุ่มที่มีโอกาสจะมาเพิ่มเงินลงทุนใน pension fund ที่มากกว่า (Potential group) เพื่อที่เราจะได้สามารถเจาะกลุ่มสมาชิกได้ถูกกลุ่ม และเพิ่มประสิทธิภาพในการคิดแผนการตลาดต่าง ๆ ได้ โดยมีขั้นตอนในการดำเนินงานดังนี้
"การพัฒนาแบบจำลองเชิงพยากรณ์ (Predictive Model) สามารถช่วยให้กองทุนบำเหน็จบำนาญข้าราชการ (กบข.) ส่งเสริมและสนับสนุนสมาชิกในการลงทุนที่เหมาะสม ขับเคลื่อนด้วยข้อมูล (Data Driven Organization) อย่างแท้จริง ออกแบบแคมเปญหรือกิจกรรมต่าง ๆ เพื่อส่งเสริมทางการตลาดได้อย่างตรงจุดและได้ผลที่มากยิ่งขึ้น"
ศึกษาการจำแนกกลุ่มของข้อมูล หาผู้ที่มีแนวโน้มการออมเงินเพิ่ม
ขั้นแรก จะเริ่มจากการจัดเตรียมข้อมูลสมาชิก จัดการความถูกต้อง และความเป็นระเบียบของข้อมูลและทำ Feature Engineering เพื่อให้โมเดลการทำนายมีประสิทธิภาพ เช่น การวิเคราะห์เพื่อดูว่าข้อมูลใดที่ควรนำมาเป็นตัวแปร (input feature) ที่จะใช้ในโมเดล โดยข้อมูลที่ใช้สำหรับการสร้างโมเดล จะประกอบไปด้วยหลายส่วน ได้แก่
ข้อมูลทางประชากร (Demographic data) เช่น เพศ อายุ รายได้
ข้อมูลทางภูมิศาสตร์ (Geographic data) เช่น จังหวัดหรือภูมิภาคที่อาศัย
ข้อมูลเชิงจิตวิทยา (Psychographic data) เช่น ไลฟ์สไตล์ ความชอบในสินค้า
ข้อมูลทางพฤติกรรม (Behavioral data) เช่น พฤติกรรมการใช้งานของสินค้าและบริการ
หลังจากขั้นตอนการจัดเตรียมข้อมูล เราจะนำข้อมูลเข้าสู่โมเดลเพื่อทำการเรียนรู้ โดยมีวัตถุประสงค์เพื่อจำแนกสมาชิก กบข. ออกเป็น
กลุ่มที่มีแนวโน้มว่าจะมาเพิ่มเงินออมสูง
กลุ่มที่มีแนวโน้มว่าจะออมเงินเพิ่มปานกลาง
และกลุ่มที่มีแนวโน้มว่าจะออมเงินเพิ่มต่ำ
โดยเกณฑ์ที่ใช้ในการจำแนกกลุ่มนี้ก็คือ ค่าความน่าจะเป็นที่ได้มาจากโมเดลนั่นเอง
ซึ่งโมเดลทางคณิตศาสตร์ที่สามารถนำมาใช้เพื่อจำแนกแนวโน้มการออมเงินเพิ่มของสมาชิก (Classification model) นั้นมีอยู่หลายโมเดลด้วยกัน อาทิเช่น Logistic regression, Naive Bayes classifier, Least squares support vector machines, Random forests, Neural networks ฯลฯ โดยหลังจากที่ทดลองใช้ข้อมูลจากสมาชิก กบข. กับหลาย ๆ โมเดลแล้ว ผลที่ได้พบว่าอัลกอริทึม Extreme Gradient Boosting (XGBoost) เป็นอัลกอริทึมที่มีประสิทธิภาพสูงที่สุดในการสร้างโมเดลสำหรับจำแนกสมาชิกด้านเงินออมของ กบข. ซึ่ง XGBoost นั้นก็เป็นโมเดลทำนายพื้นฐานที่ได้รับความนิยมอย่างมากและถูกใช้ในการแข่งขันวิเคราะห์ข้อมูลอย่างแพร่หลายโดยเฉพาะในเว็บไซต์ชุมชนวิเคราะห์ข้อมูลอย่าง Kaggle (“XGBoost – ML winning solutions (incomplete list)”, 2016)
หลักการทำงานของ XGBoost จะมีลักษณะการนำเอา Decision Tree มาเทรนต่อกันหลาย ๆ ต้น โดยที่แต่ละ Decision tree จะเรียนรู้จาก error ของต้นก่อนหน้า ดังนั้น ความแม่นยำในการทำนายจะสูงขึ้นเรื่อย ๆ และโมเดลจะหยุดเรียนรู้เมื่อไม่เหลือแพทเทิร์นของ error ก่อนหน้าให้เรียนรู้อีก ซึ่งเราเรียกโมเดลลักษณะแบบนี้ว่า Ensemble Learning หรือหมายถึงการใช้หลาย ๆ โมเดลมาประกอบกันเป็นหนึ่งโมเดลเพื่อเพิ่มประสิทธิภาพในการทำนายนั่นเอง
หากต้องการศึกษาข้อมูลเกี่ยวกับ Decision Tree เพิ่มเติม
สามารถรับชมวีดีโอได้ที่ https://youtu.be/wUGGLJF_gA8
จากโมเดลคณิตศาสตร์ สู่แคมเปญส่งเสริมการออม
หลังจากที่เราทราบแล้วว่าสมาชิกคนใดมีโอกาสที่จะออมเงินในกองทุนกับ กบข. เพิ่มมากหรือน้อยแล้วนั้น กบข. ก็จะสามารถออกแบบแคมเปญหรือกิจกรรมต่าง ๆ เพื่อส่งเสริมทางการตลาดได้อย่างตรงจุดและได้ผลที่มากยิ่งขึ้น ตัวอย่างเช่น ข้อความที่ กบข. จะส่งออกให้แก่สมาชิกแต่ละกลุ่มผ่านทาง SMS, E-mail, Line message, Mobile application หรือช่องทางต่าง ๆ เพื่อชักชวนหรือให้ความรู้นั้น อาจเป็นข้อความที่ต่างกันตามกลุ่มที่จำแนกไว้ โดยอาจโฆษณาผลิตภัณฑ์ A ให้กับสมาชิกที่มีแนวโน้มในการออมเงินเพิ่มสูง และส่งแคมเปญ B ให้แก่กลุ่มสมาชิกที่โมเดลทำนายว่ามีแนวโน้มที่จะมาออมเงินเพิ่มต่ำ เพื่อเป็นการกระตุ้นให้สมาชิกกลุ่มนี้หันมาสนใจในการออมเงินที่มากยิ่งขึ้น ซึ่งนอกจากประโยชน์ในแง่ของการตลาดที่มีประสิทธิภาพมากขึ้นแล้วนั้น การทำการตลาดแบบเจาะกลุ่มคนที่เราสนใจ (Focus group) ยังสามารถช่วยประหยัดเวลาและค่าใช้จ่ายได้อย่างมากอีกด้วย
หากต้องการรับชมตัวอย่างเพิ่มเติมในเรื่องของการใช้ Big Data สำหรับ Finance Sector ในรูปแบบของวีดีโอ
สามารถเข้าไปดูได้ที่ https://youtu.be/G54XC_i9Gao
อ่านบทความที่น่าสนใจเกี่ยวกับ Big Data ได้ที่
#BigDataThailand #BigData #DataScience #MachineLearning #Classification #Finance #Government #PensionFund #UseCase
โฆษณา