- เพราะว่าทุกวันนี้มีคนซื้อขาย data ยกตัวอย่างเช่น Peter Thiel (ผู้เขียนหนังสือ Zero to One, ผู้ก่อตั้ง Paypal) เข้าไปก่อตั้งบริษัทนึงชื่อว่า Palantir Technologies อยู่ใน Silicon Valley เป็น data broker เก็บข้อมูลลูกค้าหลายๆ คน แล้วเอาไปขายต่อ มูลค่าของ data ตอนนี้มากกว่าน้ำมัน มูลค่าตลาดของบริษัทนี้พอๆ กับ Twitter แต่เราจะไม่เคยได้ยินชื่อบริษัทพวกนี้เลย เพราะว่าบริษัทค่อนข้างเป็น Grey Industry อยู่ เลยเป็นที่มาว่าทำไม data ถึงสำคัญ เพราะว่ามีคนมาซื้อขายกัน มันเริ่มมีมูลค่าในตัวมันเอง
- ยกตัวอย่างง่ายๆ เช่น เบอร์โทรศัพท์ เวลามีคนโทรมาขายประกัน บริษัทพวกนั้นอาจจะมีการซื้อขาย data กัน แต่เราอาจจะไม่รู้
- หลายๆ บริษัทเก็บข้อมูลและพยายามหาคนมาช่วยวิเคราะห์ เพราะเชื่อว่า data ถ้าเราสามารถใช้มันได้อย่างถูกต้อง จะสามารถช่วยไกด์ธุรกิจเราได้ อย่าง Data Science คือสกิลการเปลี่ยน data ให้กลายเป็น insight ที่เหมือนกับเข็มทิศที่จะช่วยนำทางว่าธุรกิจของเราจะไปทางไหนดี
- สมัยก่อนถ้าเราไม่มี data เราจะใช้นักการตลาดแบบ hunt หรือใช้สัญชาตญาณ แต่ทุกวันนี้ถ้าเรามี data มันจะช่วยคอนเฟิร์มหลายๆ อย่าง ว่าที่เราทำมันน่าจะ success หรือว่าน่าจะ fail
- Data สามารถใช้ได้ในทุกธุรกิจไม่ว่าเราจะทำอะไร มีคนรู้จักทำร้านขายขนมที่เป็น SME เขามี data ขนมเก็บไว้ใน Excel แล้วก็พยายามจะ track ว่าใครจ่ายเงิน ใครซื้อสินค้าอะไรบ้าง พอเราเข้าไปช่วยดู data แล้วก็พบว่า data ที่เขาเก็บไว้ format มันยังไม่ถูกต้อง ถ้าเราเรียง format ให้ถูกต้องแยก table ให้ชัดเจนก็จะจัดการได้ง่ายขึ้น หาคำตอบอะไรได้ง่ายขึ้น เช่น อยากจะ sum มาเลยว่าวันนี้ลูกค้า 100 ออเดอร์ มีกี่คนที่จ่ายเงินให้เราแล้ว มีกี่คนที่ยัง pending อยู่ สินค้าตัวไหนที่ขายดี เราก็สามารถบอกได้ หรือว่าถ้าเรารู้ว่าสินค้า A กับสินค้า B มันขายได้คู่กันบ่อย เราก็ควรจะจัดโปรโมชั่นด้วยกันไหม
หรือว่าถ้าเป็นร้านค้าที่มีหน้าร้าน เราควรวางสินค้าสองชิ้นนั้นคู่กัน รวมไปถึงการอาจจะ forecast อนาคตได้ด้วยว่า ยอดขายตัวไหนจะเพิ่มขึ้นหรือว่าลดลง ขนาด SME เจ้าเล็กๆ ที่ขายขนมอาจจะมีแค่ไม่กี่ SKU ยังสามารถเก็บ data เพื่อที่จะเอาไปทำอะไรได้อีกเยอะแยะ เลยรู้สึกว่าทุกธุรกิจก็สามารถทำได้
- ระบบที่ดีคือระบบที่ data เป็นของเจ้าของธุรกิจ เจ้าของธุรกิจต้องมีสิทธิ์เข้าถึง data ได้เองเลย โดยไม่ต้องรอขอจากเจ้าของระบบ เพราะฉะนั้นเวลาเลือกใช้ระบบก็ต้องเลือกระบบที่ตัวเราเอง สามารถเข้าถึงได้อย่างง่ายๆ
- หลายๆ บริษัทที่อยากทำ digital/data transformation ต้องบอกว่าเรื่อง data เป็นเรื่องสำคัญ ถ้าองค์กรอยากเปลี่ยนไปทำพวกดิจิทัล แต่องค์กรหรือหน่วยงานส่วนใหญ่ยังหวง data อยู่เลย ไม่ยอมเปิดให้คนในองค์กรมาดึง data พอพนักงานในบริษัทเข้าไม่ถึง data เขาก็ไม่สามารถเอา data มาใช้ประโยชน์อะไรได้ มันก็ไม่เกิดเป็น digital transformation อันนี้ก็เป็นเรื่องของ policy หรือนโยบายด้วย สเต็ปใหญ่ๆ สเต็ปแรกขององค์กรเลยที่ควรทำคือ การเปิด data ในองค์กรให้พนักงานสามารถเข้าถึงได้
- คนที่ทำงานที่ Facebook มากกว่า 90% จะสามารถเขียน SQL ได้ทุกคน สามารถเขียน query ดึงข้อมูลออกมาใช้ประโยชน์ เพราะว่า value ของ Facebook คือทุกคนต้องเข้าถึง data แล้วใช้ data มาช่วยในการหา insight เพื่อช่วยในการตัดสินใจให้ดีขึ้น เขาเปิดเรื่อง data มาก และ Facebook ก็เป็นบริษัทอันดับต้นๆ ของโลก
======================
6. การใช้ Data ในองค์กร
======================
- บริษัทใหญ่ๆ พยายามจะหา tool ที่ใช้งานง่าย ไม่ต้องเขียนโค้ด พนักงานสามารถเข้ามา drag & drop เพื่อดึงตัวแปร ทำ pivot table และสามารถหา insight ได้เลยเบื้องต้น แต่ถึงจะมี tool แล้วก็ใช่ว่าพนักงานจะเข้ามาใช้ เพราะว่าการเปลี่ยนพฤติกรรมคนในองค์กรทำได้ยากมาก คนส่วนใหญ่สมัยก่อน เช่น ทีมการตลาดอยากจะได้ data ก็จะส่งอีเมลมาหาทีม data ทีม data ก็จะดึงข้อมูล หา insight แล้วก็ส่งเป็นรีพอร์ตกลับไป เป็น culture ที่เป็นแบบนี้มาหลายสิบปี หลายๆ องค์กรก็เป็นแบบนี้
เพราะฉะนั้นถึงเราจะมีเครื่องมือเป็น self service พนักงานทั่วไปก็จะไม่เข้ามาใช้อยู่ดี เพราะที่ผ่านมาเขาไม่เคยใช้มาก่อน ทำไมอยู่ดีๆ วันนี้ถึงจะต้องมาใช้ ผมเลยคิดว่าเรื่องพวกนี้เป็นเรื่องของความชอบส่วนบุคคลด้วย ถ้าคนคนนั้นมีความชอบ อยากจะเรียนรู้เรื่อง data คนกลุ่มนี้จะช่วยทำให้องค์กรเติบโตได้เร็ว เพราะพนักงานอยากเรียนรู้ด้วยตนเอง อยากจะใช้เรื่อง data
- ส่วน SME อาจจะไม่จำเป็นที่ทุกคนจะต้องเข้าถึง data อยู่ที่จุดประสงค์ ถ้าธุรกิจไม่ได้ใหญ่มาก เจ้าของธุรกิจอาจจะนั่งทำเองก็ได้เบื้องต้น เริ่มที่ตัวเจ้าของเป็นคนวิเคราะห์ข้อมูลเอง พอได้ insight อะไรแล้วก็ไปคุยกับพาร์ทเนอร์ แชร์ insight ให้กันและกัน น่าจะเป็นจุดเริ่มต้นที่ดี
- บางทีถ้าเราไม่เก่งอะไรเราอาจจะต้อง outsource ไปหาคนที่เก่งกว่า SME มีเครื่องมือที่สามารถ outsource ได้หลายอย่าง ไม่จำเป็นที่จะต้องเก่งทำเองทุกอย่าง ช่วงแรกอาจจะลองหาคนที่เก่งกว่า ไปหาบริษัทหรือ cloud service ที่เข้ามาตอบโจทย์ได้
- ขึ้นอยู่ที่ objective ว่าเราจะเอา data ไปทำอะไรด้วย สุดท้ายผมมองว่า data เป็นสกิลที่ทุกคนควรจะทำให้เป็นเบื้องต้น ไม่งั้นถ้าเราทำเองไม่เป็น สมมุติถ้าองค์กรเราไม่รู้เรื่อง data เลย เราก็จะไปจ้าง consult เข้ามาช่วย ซึ่งอาจจะใช้เงินเยอะมาก ทั้งๆ ที่ถ้าใช้พนักงานเราทำเองอาจจะถูกกว่าเยอะมาก ค่าราคาของความไม่รู้มันแพงมาก mark up margin ของบริษัท consult จะสูงมาก ถ้าเราสามารถปั้นคนในองค์กรให้ทำเรื่องพวกนี้ได้ เราจะเซฟเงินตรงนี้ไปได้อีกเยอะ
- อย่างที่ SCB ก็จะมีโครงการให้พนักงานที่สนใจเรื่อง data สามารถ re-locate กันได้เลยในองค์กร เช่น คนที่อยู่การตลาดแต่มีความสนใจเรื่อง data สามารถเข้าโครงการเพื่อ training และเปลี่ยนมาเป็น data analyst ได้ อันนี้คือนโยบายที่หลายๆ บริษัทควรจะมี คนๆ นึงไม่ควรจะทำได้แค่ตำแหน่งเดียวด้วยซ้ำ สุดท้ายคนนึงควรจะทำได้หลายๆ สกิล ก็จะช่วยทำให้องค์กรได้เติบโตได้ดีขึ้น
- แล้วการที่เราทำอะไรสำเร็จแล้ว ไม่ได้แปลว่ามันจะดีตลอดไปด้วย สมมุติเช่น เราลองทดสอบแล้วพบว่าสีเขียวดีกว่า พอเวลาผ่านไปสีฟ้าอาจจะดีกว่าก็ได้ นอกจากนี้เราอาจจะต้องลองปรับ font ให้ใหญ่ขึ้น ปรับภาพ พวกนี้เป็นศาสตร์เลยที่เรียกว่า CRO (Conversion Rate Optimization) เมืองนอกจะมีตำแหน่งที่โฟกัสเรื่องนี้เป็นหลักเลย ซึ่งในโลกของ Digital Marketing จะใช้พวกนี้ค่อนข้างเยอะ
- เบื้องหลังของพวกนี้ทั้งหมดคือ data เราเก็บ data มาเพื่อ validate สมมุติฐาน ข้อสันนิษฐานกับธุรกิจของเรา เราเลือกด้วย data เรา optimize process ด้วย data ที่เราเก็บมา
*2. Frequentist Probability vs. Bayesian Probability
- แบบที่สอง Bayesian Probability คือความเชื่อ สมมุติการเลือกตั้งสมัยหน้า คิดว่าใครจะมีโอกาสชนะ ระหว่างนาย A กับนาย B ถ้าถามคำถามนี้กับคนหลายคน เราจะได้คำตอบไม่เหมือนกันเลย ความน่าจะเป็นนี้ จะไม่เหมือนการโยนเหรียญหัวก้อยแล้ว ความน่าจะเป็นนี้มันคือความเชื่อของแต่ละคน (Personal Believe) และนี่คือนิยามที่สองที่อยากให้ทุกคนเข้าใจว่าความน่าจะเป็นคืออะไร
- ความน่าจะเป็นแบบที่สองคือ ความเชื่อของแต่ละคน ประเด็นคือความเชื่อตัวนี้มันควรจะเปลี่ยนได้ แต่บางคนเมื่อเชื่อบางอย่างแล้วก็ไม่มีวันเปลี่ยน แม้เราจะพยายามเอาข้อมูลใหม่ๆ มาพิสูจน์ แต่หลายๆ คนก็ยังไม่เปลี่ยนความเชื่อของตัวเอง ยึดติดกับสิ่งตัวเองเชื่อ สิ่งที่อยากจะบอกทุกคนคือถ้าวันนี้เราเก็บ data ขึ้นมาใหม่ แล้ว data ตัวนี้มันเริ่มสั่นคลอนความเชื่อของเรา ความน่าจะเป็นที่เราพูดเมื่อกี้มันน่าจะต้องเปลี่ยนได้ เช่น สมมุติเราเก็บข้อมูลใหม่ว่า เราพบว่านาย A มีการทุจริต มีการโกง แปลว่าข้อมูลใหม่ตัวนี้จะทำให้การตัดสินใจของเราเปลี่ยน ความน่าจะเป็นที่นาย A จะชนะการเลือกตั้งก็จะน้อยลง เพราะเราได้รับข้อมูลใหม่มา ความเชื่อควรจะเปลี่ยนได้ ความน่าจะเป็นก็เปลี่ยนได้เหมือนกัน base on data ที่เก็บมา
- ยกตัวอย่างให้เห็น use case เคยมีเรือลำนึงแล่นแล้วหายไปจากเรดาห์ ทีมกู้ภัยก็อยากจะรู้ว่าเราควรไปค้นหาแถวไหนดี เนื่องจากทะเลมันกว้างใหญ่มาก สิ่งที่เขาทำก็คือเขาค่อยๆ เก็บ data มา แล้วเขาก็ค่อยๆ เอามาอัพเดทโมเดล แสกนดูพื้นที่ทะเล ดูอุณหภูมิ ดูสภาพอากาศ มาอัพเดทตัวโมเดล จะได้ scope ลงมาว่า base on data แล้วเรือน่าจะไปจมอยู่ที่ไหน สุดท้ายแล้วตัวก็จะสามารถบอกบริเวณที่เรือน่าจะจมได้ แล้วก็ไปหาเจอด้วย ถ้าเราเก็บ data ที่มัน valid มันก็จะช่วยให้เราตัดสินใจได้ดีขึ้น
8. วิธีเพิ่มความรู้ด้าน Business สำหรับคนทำงานสาย Data
======================
- เริ่มจากการอ่านหนังสือดีๆ มีเล่มนึงที่ชอบมากชื่อ Business Made Simple - Donald Miller และอยากให้ลองอ่านเคสของแบรนด์ที่ประสบความสำเร็จ เวลาที่ทำแคมเปญแล้วเวิร์ค อยากให้ลองไปเรียนรู้ดู แต่การที่อันไหนเวิร์คในอดีตก็ไม่ได้หมายความว่าจะเวิร์คในอนาคต แต่มันก็จะให้ไอเดียเราเบื้องต้นว่ามันทำได้ยังไงบ้าง สุดท้ายก็คือเวลาเราไป implement จริง ต้องมีการทำ testing ที่ Data Analyst ทุกคนควรจะทำให้เป็น
- ถ้าเราเข้าใจว่า business มัน operate ยังไง ก็จะทำให้เราทำงานได้ง่ายขึ้น เหมือนในหนังสือ Business Made Simple มีการกล่าวไว้ว่า business ทำงานเหมือนเครื่องบิน ปีกสองข้างของเครื่องบินเหมือนเป็น product กับ service ถ้าปีกยิ่งใหญ่ก็คือ product กับ service เรายิ่งสตรองก็จะบินขึ้นได้ แต่เครื่องบินจะบินได้เร็วขนาดไหนมันก็ต้องมีเครื่องยนต์ก็คือ marketing กับ sales ส่วนตัวบอดี้ก็จะเป็น overhead cost (พวกค่าใช้จ่าย เงินเดือน ค่าใช้จ่ายที่ไม่ได้เกี่ยวข้องกับการผลิตสินค้า) ส่วนหางเครื่องบินก็จะเป็น cash flow ถ้าเราเข้าใจว่าเครื่องบินบินได้ยังไง business ทำงานยังไง เครื่องบินจะบินขึ้นได้หรือว่าจะตก มันขึ้นอยู่กับว่าเราจะบาลานซ์ทุกส่วนของเครื่องบินได้ยังไงบ้าง ที่เหลือ data science ก็คือการเข้าไป optimize แต่ละส่วนของเครื่องบิน ให้มันบินได้อย่าง smooth และไปถึงเป้าหมายได้เร็วที่สุด