5 พ.ค. 2020 เวลา 09:39
รีวิวเรียน Marketing Analytics (5/5) ใน Coursera
เรื่อง Regression Analysis
บทที่ห้าหรือบทสุดท้าย คือ เรื่องการวิเคราะห์การถดถอย (Regression analysis)
ท่านอาจารย์บอกว่าเราจะใช้เพื่อพยายามอธิบายพฤติกรรมของมนุษย์
ลองคิดว่าเราเดินในห้างสรรพสินค้าแล้วเห็นป้ายลดราคา แบรนด์ใช้หลักเกณฑ์อะไรว่าต้องลดราคาเท่าไหร่ และกี่โปรโมชั่น?
ตารางแรก
X = ยอดการใช้จ่ายของลูกค้า (ดอลลาร์)
Y = จำนวนโปรโมชั่น
1.42 = slope of the regression line หรือ coefficient of promotion ก็คือทุกครั้งที่โปรโมชั่น (แกน y) เพิ่ม +1 ยอดนี้ฝั่ง (แกน x) ก็จะขึ้น 1.42
Intercept = เอาไว้เรียกยอดของแกน y (ซึ่งในที่นี้คือจำนวนเงินดอลลาร์ที่ลูกค้าใช้จ่าย) เมื่อ x = 0
Regression Line = เส้นตรงสีดำยาวที่ลากขนานแกน y
จุดสีแดง = คือราคาที่ลูกค้าจ่ายเมื่อแบรนด์มีจำนวนโปรโมชั่นตามแกน y
จุดประสงค์คือต้องลดช่องว่างระหว่างเส้น regression line สีดำให้ตัดหรือใกล้เคียงกับจุดสีแดงให้จำนวนเยอะและมากที่สุด
สมการที่มี คือ y = 1.42x + 9.90
R-Squared
คือค่าตั้งแต่ 0-100% ที่บอกว่าเส้น regression line ของเรามันไปสัมพันธ์กับจุดสีแดงเยอะแค่ไหน ยิ่งเยอะ ค่ายิ่งสูง แปลว่ายิ่งสัมพันธ์กัน เช่น ตารางด้านซ้ายมือ R-Squared = 80% แปลว่าโปรโมชั่นส่งผลกับยอดขายมาก ๆ ในขณะที่ตารางทางขวามือ R-Squared = 0% แปลว่า ฝนตกไม่เกี่ยวข้องกันยอดขายเลย
ตารางนี้อาจจะงงนิดนึง ท่านอาจารย์บอกว่าทำให้ดูง่ายกับพวกเราแล้ว สังเกตแค่ช่องสีเขียวก่อน
R-Squared = 0.601 (ถือว่าน้อย)
P-value = ค่าความน่าเชื่อถือของ regression ยิ่งน้อยยิ่งดี ค่าที่ถือว่าน่าเชื่อถือคือควรจะต่ำกว่า 10% ถ้าค่าสูงมาก หรือที่แปลว่าไม่น่าเชื่อถือ จะเท่ากับว่า regression นี่อาจจะเปลี่ยนแปลงได้มากขึ้นไปด้วย
ตารางนี้ท่านอาจารย์มั่วขึ้นมาเอง (แบบมีหลักการ)
โดยมีสมการพระเจ้ามาให้ = a+b1*price paid+b2*feature+b3*display+error ท่านอาจารย์ให้ยึดตัวนี้ไว้ คิดซะว่าตัวแปรทั้งหมดมีแค่นี้
แล้วจะลองทำ regression ให้ดู เพื่อหาว่า a b1 b2 b3 แต่ละค่าเท่าไหร่บ้าง
ทำออกมาแล้วได้ค่าแบบในตาราง True Model แต่ค่า R-Squared สูงมากถึง 93% เลยลองตัด price ออก ค่า R เหลือ 18% คำถามคือตัวแปรมันเหมือนกันหมดเลย ทำไมในสองตารางพอแทนค่าออกมาแล้วมันได้ค่าที่ต่างกัน
ท่านอาจารย์กำลังจะพาทำความรู้จักกับ Omitted Variable Bias
ซึ่งสรุปง่าย ๆ เหมือนเป็นการสังเกตเหมือนกัน คือต้องดูให้ดีว่าค่าที่เราใส่ควรจะมีตัวแปรไหนเพิ่มเข้ามาอีก หรือควรจะเอาตัวแปรไหนออกหรือไม่ อย่างเช่นตางรางเมื่อกี้คือ price มันกระทบกับทั้งฝั่ง feature display และกระทบทั้ง sale พอใส่ price ไปคำนวณ regression ด้วย ค่าเลยเกินออกมา พอเอา price ออกเลยได้ค่าที่ confident มากขึ้น
อีกตัวอย่างคือมีบทความบอกว่า ผู้ชายที่ยิ่งสูงยิ่งได้เงินเดือนเยอะ!
พอลองมาทำ regression เพื่อพิสูจน์แล้วพบว่าก็เป็นแบบนั้นจริง ๆ คนที่สูงได้เงินเยอะ (ตามตารางด้านซ้าย)
แต่พอใส่ตัวแปรด้านเพศเข้าไปด้วย คือ แยกชายหญิง กลับพบว่าประเด็นไม่ได้อยู่ที่ความสูง แต่อยู่ที่ gender gap ระหว่างผู้ชายและผู้หญิง คือผู้ชายจะสูงกว่าผู้หญิงเป็นปกติอยู่แล้ว และได้ค่าจ้างที่มากกว่า
Price Elasticity คือ % ยอดขายที่เปลี่ยนจาก % ราคาที่เปลี่ยน ใช้เพื่อดูผลกระทบยอดขายจากราคาที่เปลี่ยนไป ท่านอาจารย์บอกว่ามัน no units คือวัดได้ทุกปีเพื่อดูว่ามันขึ้นลงอย่างไร
ไม่เข้าใจเลย……………… ท่านอาจารย์ ข้างงเรื่องนี้มาก ขอข้ามไปก่อน เดี๋ยวมาทำความเข้าใจเพิ่ม
สรุปคอร์ส
จุดประสงค์ก็คืออยากให้การวิเคราะห์ข่วยกระบวนการตัดสินใจทาง marketing ได้
หลังจบก็มีวีดิโอสัมภาษณ์สั้น ๆ ให้เราฟังเกี่ยวกับการใช้งานเครื่องมือที่สอนในคอร์สว่านำไปใช้จริงในองค์กรยังไงบ้าง

ดูเพิ่มเติมในซีรีส์

โฆษณา