โพสต์


11 ก.พ. เวลา 08:34Science & Tech

NOVA : Prediction By The Numbers (2018)

ประวัติย่อการพยากรณ์และความน่าจะเป็น

NOVA : Prediction By The Numbers (2018) เป็นหนังสารคดีที่พูดถึงประวัติการนำตัวเลขและค่าสถิติมาใช้ในการพยากรณ์ตั้งแต่อดีตจนถึงปัจจุบัน

ผมได้ดูสารคดีเรื่องนี้โดยบังเอิญจากการหาอะไรดูไปเรื่อยใน Netflix จนเมื่อดูจบและได้หาข้อมูลเพิ่มเติมจึงทราบว่าสารคดีชุด NOVA มีหลายตอน

.

.

เท่าที่เปิดดูแต่ละตอนจะเน้นไปในเรื่องเกี่ยวกับวงการวิทยาศาสตร์เป็นหลัก มีทั้งเรื่องปริศนาหลุมดำ เรื่องอวกาศและดวงดาว ไปจนถึงวิทยาศาสตร์กับมนุษย์ยุคโบราณ ฯลฯ

ในบทความนี้ผมจะสรุปย่อประวัติศาสตร์ของการพยากรณ์ด้วยตัวเลขจากสารคดี NOVA ตอน Prediction By The Numbers เพียงตอนเดียวเท่านั้น หากผู้อ่านสนใจเกี่ยวกับหัวข้ออื่นๆ สามารถรับชมสารคดีชุดนี้เพิ่มเติมได้จาก Netflix ( ผมคงดูจนครบทุกตอน เพราะชอบหนังสารคดีครับ )

มนุษย์สนใจศาสตร์ของการพยากรณ์มาเป็นเวลายาวนาน ในอดีตชาวโรมันใช้การพยากรณ์ผ่านการบินและเสียงร้องของนก ชาวจีนใช้การทำนายจากการเสี่ยงทายผ่านกระดูกและแท่งเหล็ก

.

.

ช่วงศตวรรษที่ 19 ชาวรัสเซียนำไก่มาใช้ในการทำนาย

เรียกได้ว่า แต่ละท้องถิ่นได้นำสิ่งของใกล้ตัวมาใช้เป็นตัวช่วยในการพยากรณ์ ยังไม่นับรวมศาสตร์ของการดูดวงด้วยฝ่ามือ การทำนายจากไฝบนใบหน้า รวมถึงการพยากรณ์ที่เกิดจากการสังเกตการเคลื่อนที่ของกลุ่มเมฆบนท้องฟ้า

.

.

ดูเหมือนว่ามนุษย์สามารถหยิบจับทุกอย่างบนโลกนี้มาสร้างเป็นคำพยากรณ์ได้ทั้งหมด

ในเอกสารเก่าแก่อายุนับร้อยปี มีการกล่าวถึงศาสตร์ที่น่าสนใจศาสตร์หนึ่ง เป็นศาสตร์ของการพยากรณ์ที่ใกล้เคียงกับหลักทางวิทยาศาสตร์อยู่บ้าง

หลักการที่เอกสารนั้นเขียนถึงใช้ชื่อว่า " พลังแห่งฝูงชน "

" พลังแห่งฝูงชน " คืออะไร ?

พลังแห่งฝูงชนคือการกล่าวถึงพลังในการทำนายร่วมกันของคนหมู่มาก ถ้าเราถามคนจำนวนมากถึงคำตอบของสิ่งใดสิ่งหนึ่ง ค่าเฉลี่ยของคำตอบที่ได้ มักจะใกล้เคียงกับคำตอบที่แท้จริง

ซึ่งผู้ผลิตสารคดีชุดนี้ได้ทำการทดลองทฤษฎีนี้ โดยเชิญนักสถิติหญิงชื่อ ทาวิเทีย วิลเลียมส์ มาทดลองเรื่องการทำนายของฝูงชน ทาวิเทียได้ทดลองโดยการนำลูกอมเจลลี่บีนใส่ไว้ในกระปุกพลาสติก และเธอได้เดินไปถามผู้คนในงานเทศกาลแห่งหนึ่ง จำนวน 135 คน ว่า

" พวกเขาคิดว่ามีลูกอมอยู่ในกระปุกกี่เม็ด ? "

.

.

เมื่อได้คำตอบทั้งหมดแล้ว ทาวิเทียได้นำคำตอบมาวิเคราะห์ค่าเฉลี่ยเพื่อหาข้อสรุปตามแนวทางของพลังแห่งฝูงชน

ตัวเลขของคำตอบที่น้อยที่สุดคือ 183 เม็ด

ขณะที่คำตอบที่มากที่สุดคือ 12,000 เม็ด

จะเห็นว่าค่าการกระจายของคำตอบที่น้อยสุดกับมากสุดต่างกันเป็นหมื่น

และเมื่อนำคำตอบของทุกคนมาหาค่าเฉลี่ยแล้ว พบว่าค่าเฉลี่ยของคำตอบ คือ 1,522 เม็ด ซึ่งเมื่อทาวิเทียนับลูกอมในกระปุกแล้ว คำตอบที่ถูกต้องของจำนวนลูกอม คือ 1,676 เม็ด ถือว่าค่าเฉลี่ยคำตอบของทุกคนที่ตอบมานั้น มีความคลาดเคลื่อนจากคำตอบที่ถูกต้องต่ำกว่า 10 เปอร์เซนต์

ซึ่งเป็นความคลาดเคลื่อนที่รับได้

อย่างไรก็ตามในฐานะนักสถิติ ทาวิเทียได้ให้ข้อจำกัดของทฤษฎีพลังแห่งฝูงชนไว้ว่า ตัวของมันเองมีข้อจำกัดที่ต้องระวังในการใช้ อยู่ 2 เรื่องคือ

หนึ่ง การทำนายของฝูงชนถูกทำลายจากปัจจัยภายนอกและถูกชี้นำได้ง่าย

สอง คำทำนายที่ได้ผลมักเป็นคำถามที่ต้องการคำตอบที่ชัดเจน เช่นเรื่องของจำนวนและตัวเลข

.

.

เธอยังตั้งข้อสังเกตอีกว่า กระบวนการของพลังแห่งฝูงชนมีความใกล้เคียงกับสิ่งที่นักสถิติทำ คือ ต้องมีการเก็บข้อมูลและนำข้อมูลเหล่านั้นมาวิเคราะห์ทางคณิตศาสตร์

ปัจจุบันศาสตร์ของการพยากรณ์จะเน้นไปที่เรื่องของการวิเคราะห์ทางสถิติเป็นหลัก ซึ่งคำที่ผู้คนมักจะได้ยินอยู่บ่อยๆเมื่อพูดถึงการพยากรณ์ด้วยสถิติคือ " ความน่าจะเป็น "

การกำเนิดของทฤษฎีความน่าจะเป็นนั้น มีจุดเริ่มต้นมาจากจดหมายตอบโต้ของนักคณิตศาสตร์ชาวฝรั่งเศส 2 คน คือ แบลช ปัสกาล และ ปิแอร์ เดอร์ แฟร์มาต์ ในช่วงทศวรรษที่ 1650

ทั้งสองคนได้พูดถึงปัญหาในเกมโยนเหรียญเกมหนึ่ง

โดยเกมนี้จะมีผู้เล่น 2 คน สมมติว่าคือ A และ B

ทั้งสองคนเล่นเกมโยนเหรียญกัน โดยทั้ง A และ B จะต้องทายว่า การโยนเหรียญจำนวน 5 รอบนี้ ผลลัพธ์จะออกมาเป็น " หัว " หรือ " ก้อย " เมื่อทั้งคู่เลือกคำตอบแล้ว คำตอบนั้นจะถูกนำไปใช้กับการโยนเหรียญทั้ง 5 รอบ โดยแต่ละรอบมีการเดิมพันรอบละ 1 เหรียญ

จากตัวอย่างที่ยกมา สมมติให้ A เลือก " หัว " และ B เลือก "ก้อย " ผลปรากฎว่า การโยนใน 3 รอบแรกนั้น ออกหัว 2 ครั้ง ออกก้อย 1 ครั้ง

ทำให้ A นำ B อยู่ 2 ต่อ 1

แล้วเกมก็หยุดชะงักในรอบที่ 3 คำถามที่นักคณิตศาสตร์ทั้งสองคนโต้ตอบกันนั้นเกี่ยวเนื่องกับอีก 2 เกมที่ยังไม่เกิดขึ้น คำถามของพวกเขาคือ จะมีเงื่อนไขใดในการแบ่งเงินที่จะทำให้ทั้งสองคนได้รับเงินอย่างยุติธรรมในอีก 2 เกมที่เหลือ

ซึ่งปิแอร์ เดอร์ แฟร์มาต์ ได้ให้คำตอบที่น่าสนใจและนั่นก็เป็นครั้งแรกที่โลกได้รู้จักกับทฤษฎีความน่าจะเป็น ปิแอร์ เสนอว่าเราต้องจินตนาการถึงผลลัพธ์ที่จะเกิดขึ้นในอนาคตแล้วนำมาจัดหมู่ของผลลัพธ์ที่เป็นไปได้ทั้งหมด

.

.

ซึ่งในกรณีนี้คือ โอกาสของผลลัพธ์จากการโยนเหรียญ 2 ครั้ง ซึ่งมีความเป็นไปได้ทั้งหมด 4 ชุด คือ

หัว-หัว , หัว-ก้อย , ก้อย-หัว , ก้อย-ก้อย

จะเห็นว่าจากผลลัพธ์ที่สามารถเกิดขึ้นได้ทั้งหมด B จะชนะในกรณีเดียว คือ เหรียญต้องออก " ก้อย " ทั้งสองรอบ ดังนั้นถ้าต้องการให้มีการแบ่งเงินอย่างยุติธรรมใน 2 รอบที่เหลือ ควรแบ่งเงินในอัตรา สาม ต่อ หนึ่ง ส่วน (คำนวณจากโอกาสที่ A จะชนะมีสามส่วน และโอกาสที่ B จะชนะมีหนึ่งส่วน)

การค้นพบในครั้งนี้ถือเป็นเรื่องใหม่มากในยุคนั้น

และข้อความในจดหมายโต้ตอบครั้งนี้ได้กลายมาเป็นรากฐานของทฤษฎีความน่าจะเป็นในเวลาต่อมา

ถ้าจะมีสถานที่ใดในโลกนี้ที่จะเป็นตัวอย่างที่ชัดเจนที่สุดของการนำทฤษฎีความน่าจะเป็นมาใช้ประโยชน์ หนึ่งในสถานที่นั้นคงต้องเป็นเมืองคาสิโนอย่าง " ลาสเวกัส "

คาสิโนใช้ประโยชน์จากการเปลี่ยนค่าความน่าจะเป็นเพียงเล็กน้อยเพื่อให้ตนเองได้ประโยชน์ เมื่อมีผู้เล่นมากพอ

สารคดียกตัวอย่างเกมรูเล็ต ซึ่งกติกาเกมนี้คือ การทายว่าลูกรูเล็ตจะหยุดบนถาดหมุนที่สีใด ซึ่งถาดหมุนจะมีตัวเลข 1- 36 อยู่ในนั้น เลขแต่ละตัวจะมีสีแดงและสีดำอย่างละครึ่ง ดูเหมือนว่าเกมนี้ก็เป็นเกมยุติธรรมดี เพราะโอกาสที่ลูกจะตกสีแดงหรือสีดำอยู่ที่ 50-50

แต่ถ้าไม่ได้ใช้ประโยชน์จากความน่าจะเป็นก็คงไม่ใช่คาสิโน พวกเขาได้เพิ่มสีเขียวเข้าไปในถาดหมุนอีกหนึ่งช่อง หากลูกรูเล็ตตกลงไปที่สีเขียว ไม่ว่าจะเลือกแดงหรือดำ ผู้พนันต้องเสียเงินพนันให้กับคาสิโน

.

.

นี่คือการพลิกโอกาสที่ลูกจะตกที่สีแดง หรือ สีดำ ลงเพียงนิดหน่อย แต่ทำให้คาสิโนมีความได้เปรียบในการทำเงินได้อีกมหาศาล จะเห็นว่ากฎตรงนี้ทำให้โอกาสที่คาสิโนจะได้เงินเพิ่มขึ้นมา และนั่นคือหนึ่งในเหตุผลที่ว่าทำไมคาสิโนจึงไม่มีวันขาดทุนจากเกมพนัน

ศาสตร์ของการพยากรณ์ด้วยตัวเลขยังถูกนำมาใช้กับการทดลองทางวิทยาศาตร์ เมื่อนักวิทยาศาสตร์ตั้งสมมติฐานใดๆขึ้นมา สิ่งที่เขาจะต้องทำเพื่อพิสูจน์สมมติฐานนั้นก็คือ การทดลอง

พวกเขาต้องทดลองและนำค่าทางสถิติมาประมวลผลเพื่อพิสูจน์สมมติฐาน

ช่วงทศวรรษที่ 1920-1930 โรนัลด์ เอ ฟิชเชอร์ นักวิทยาสาตร์ชาวอังกฤษได้เสนอแนวทางในการออกแบบการทดลองโดยนำสถิติและความน่าจะเป็นเข้ามาประยุกต์

ฟิชเชอร์ เสนอแนวคิดโดยอ้างตัวอย่างการทดลองแยกชาของผู้หญิงคนหนึ่ง โดยมีสมมติฐานว่าเธอคือผู้เชี่ยวชาญที่สามารถระบุได้ว่าชาถ้วยไหนคือชาที่ใส่นม หรือ ชาถ้วยไหนคือนมที่ใส่ชา ( อันนี้เป็นตัวอย่างที่เขายกมานะครับ ชาใส่นมคือ ชาที่นำนมมาผสมภายหลัง ส่วนนมใส่ชา คือ นมที่นำชามาผสมภายหลัง )

ฟิชเชอร์ ได้พิจารณาวิธีที่จะใช้ทดสอบเรื่องนี้โดยเขาระบุว่า หากให้เธอดื่มชาเพียงถ้วยเดียว ถึงเธอจะตอบถูกก็เป็นไปได้ว่าเธออาจจะแค่เดาถูก ดังนั้นเพื่อให้เกิดความชัดเจนในการพิสูจน์ความสามารถของเธอ ต้องใช้ชาทั้งหมด 8 ถ้วย โดยชา 8 ถ้วยนั้นจะเป็นชาที่เทนมใส่ 4 ถ้วย และเป็นนมที่เทชาใส่ 4 ถ้วย

.

.

จากนั้นผู้ทดลองต้องทำการสลับชาทั้งสองประเภทให้อยู่ปะปนกัน หากผู้หญิงที่เป็นผู้เชี่ยวชาญสามารถแยกชาแต่ละประเภทออกมาได้อย่างถูกต้อง

จะถือว่าเธอคือผู้เชี่ยวชาญ

คำถามคือ ทำไมต้องมีชา 8 ถ้วย ?

เหตุผลก็เพราะชา 8 ถ้วย สามารถสร้างผลลัพธ์ที่แตกต่างกันได้ทั้งหมด 70 วิธี ซึ่งหากเธอแยกถูก นั่นหมายความว่าเธอเลือกถูกจากโอกาส หนึ่งในเจ็ดสิบ หรือคิดเป็นความน่าจะเป็นที่เธอจะเลือกถูกที่ 1.40 เปอร์เซนต์

ต่อมาแนวความคิดของฟิชเชอร์ ได้ถูกนำมาต่อยอดทางคณิตศาสตร์ในเรื่องของค่า P-Value(ค่าความน่าจะเป็น) ซึ่งเป็นค่าที่เราใช้ตัดสินผลลัพธ์ที่สันนิษฐาน ว่าเป็นแค่ความบังเอิญหรือผลลัพธ์ที่ใช้อ้างอิงได้ ซึ่งเกณฑ์มาตรฐานทางสถิติควรมีค่า P-Value น้อยกว่า 0.05 หรือมีความน่าจะเป็นที่น้อยกว่า 5 เปอร์เซนต์ คิดง่ายๆก็คือมีโอกาสเกิดขึ้นได้ หนึ่ง ใน ยี่สิบ

เราเรียกผลการทดสอบประเภทนี้ว่า " มีนัยยะสำคัญทางสถิติ " ( Statistically Significant) กรณีการทายน้ำชาของฟิชเชอร์ มีความน่าจะเป็นอยู่ที่ 1.4 เปอร์เซนต์ ถือว่าอยู่ในเกณฑ์นี้ด้วยเช่นกัน

อย่างไรก็ดีค่านี้เป็นเพียงเครื่องมือในการสืบหาเท่านั้น มันไม่ได้เป็นตัวตัดสิน เพราะแม้ค่าทางสถิติจะมีนัยยะสำคัญทางสถิติสูง แต่ก็ไม่ได้หมายความว่าผลลัพธ์นั้นจะสะท้อนความเป็นจริงโดยสมบูรณ์ สิ่งที่นักสถิติต้องตระหนักคือ ผลลัพธ์ที่มีค่านัยยะสำคัญทางสถิติเป็นผลลัพธ์ที่น่าสนใจให้ตรวจสอบและค้นคว้าต่อไป ไม่ใช่เลิกศึกษา

กรณีคลาสสิคที่สารคดียกมา คือ เรื่องของการสำรวจโพลในการเลือกตั้งประธานาธิบดีของสหรัฐอเมริกาในปี 2016 ที่โพลทุกสำนักล้วนฟันธงว่าฮิลลารี่ คลินตัน จะชนะการเลือกตั้ง แต่เมื่อผลการเลือกตั้งออกมาปรากฎว่า โดนัล ทรัมป์ ชนะการเลือกตั้งไปอย่างสูสี

ทั้งๆที่เช้าวันเลือกตั้งผลสำรวจให้โอกาสที่ฮิลลารี่ คลินตัน จะชนะการเลือกตั้งสูงถึง 70 เปอร์เซนต์ ซึ่งผลที่เกิดขึ้นถือเป็นความบกพร่องอันเกิดจากการเลือกกลุ่มประชากรในการสำรวจที่คลาดเคลื่อนไปใน 3 รัฐ คือ เพนซิลเวเนีย , วิสคอนซิน และ มิชิแกน ทำให้การประเมินคะแนนนิยมของทรัมป์ต่ำกว่าความเป็นจริงและนำไปสู่ความผิดพลาดของผลสำรวจ

จริงๆแล้วในกรณีนี้ไม่ถือว่าโพลผิดพลาด เพียงแต่เป็นการตีความหมายของค่าความน่าจะเป็นที่ละเลยโอกาสอันน้อยนิดที่สามารถเกิดขึ้นได้

เมื่อผลสำรวจบอกว่าโอกาสที่ฮิลลารี่ คลินตัน จะชนะการเลือกตั้งคือ 70 เปอร์เซนต์ นั่นหมายความว่าทรัมป์มีโอกาสชนะการเลือกตั้ง 30 เปอร์เซนต์ ซึ่งโอกาส 30 เปอร์เซนต์นี้แม้ดูเหมือนไม่มาก

แต่เกณฑ์ว่ามากหรือน้อยนี้ไม่ได้อยู่ที่ตัวเลข แต่ขึ้นอยู่กับสถานการณ์ที่เราประเมิน

คนอาจไม่ใส่ใจที่จะพกร่มออกจากบ้าน หากกรมอุตุฯแจ้งว่ามีโอกาส 30 เปอร์เซนต์ ที่ฝนจะตก แต่หากเปลี่ยนมาเป็นโอกาสที่เครื่องบินลำที่เรากำลังจะขึ้นมีโอกาสตก 30 เปอร์เซนต์ ( มีโอกาสตก 3 ใน 10 ครั้ง )

เราจะกล้าขึ้นเครืองบินลำนั้นไหม ?

จะเห็นว่าผู้คนสนใจต่อ30 เปอร์เซนต์ ของกรณีเครื่องบินมากกว่ากรณีฝนตก นั่นเป็นเพราะสถานการณ์ที่ประเมินมีผลลัพธ์ของความเสียหายต่างกัน

30 เปอร์เซนต์ แม้เป็นโอกาสที่น้อย แต่มันก็มีโอกาสเกิดขึ้นได้

สถิติแห่งการพยากรณ์ในยุดปัจจุบันได้พัฒนาไปมาก เป็นผลมาจากการใช้คอมพิวเตอร์ในการช่วยคำนวณและสร้างแบบจำลองทำให้การวิเคราะห์เกิดความแม่นยำมากขึ้น

.

.

เราใช้ประโยชน์จากมันในหลายเรื่องไม่ว่าจะเป็น การคำนวณการเคลื่อนที่ของดวงดาว การลงจอดของยานอวกาศในอวกาศ การวิเคราะห์เกมกีฬา ไปจนถึงเรื่องทางการแพทย์ เช่นการระบุตำแหน่งของมะเร็งผิวหนัง

.

.

มนุษย์ได้นำพาศาสตร์นี้มาไกลจากเดิมมาก...นี่คือยุคสมัยที่เรามีอำนาจในการทำนาย แต่นั่นยังไม่ใช่จุดสิ้นสุดของศาสตร์นี้ เพราะอนาคตเป็นสิ่งที่ไม่แน่นอน ดังนั้นคณิตศาสตร์และสถิติก็จะยังคงทำหน้าที่ของมันต่อไป ตราบเท่าที่มนุษย์ยังเดินตามหลังอนาคตของตนเอง

เครดิตข้อมูล :

สารคดี NetFlix : NOVA-Prediction By The Numbers (2018)

100
Savvy Investor
ยอดเยี่ยมมากครับ
12 ก.พ. เวลา 00:15
1
หนังหลายมิติ
ขอบคุณมากครับ :)
12 ก.พ. เวลา 12:54
11 ก.พ. เวลา 15:13
1
หนังหลายมิติ
ดูได้จาก Netflix ครับ
11 ก.พ. เวลา 15:52
1
เรื่องเล่าจากดาวนี้
พี่หนังหลายมิติเขียนดีมาก ๆ เลยค่ะ แบมอ่านแล้วได้ความรู้ใหม่ไปด้วยเลยค่ะ 👍
11 ก.พ. เวลา 14:43
1
หนังหลายมิติ
ขอบคุณนะแบม แอบหวั่นใจว่ามันจะเครียดไปหรือเปล่า 555
11 ก.พ. เวลา 15:53
1
เรื่องเล่าจากดาวนี้
ก็แอบเครียดอยู่บางช่วงบางตอนนะคะ แต่ไม่มากค่ะพี่หนังหลายมิติ สุดยอดมาก ๆ เลยค่ะ 💕
12 ก.พ. เวลา 04:20
ปันปัน
ปกติหนูก็ชอบดูใน Netflix 😅
11 ก.พ. เวลา 13:20
1
หนังหลายมิติ
มีเรื่องอะไรสนุกก็แนะนำได้นะครับ
11 ก.พ. เวลา 14:36
11 ก.พ. เวลา 13:02
1
หนังหลายมิติ
ขอบคุณครับ
11 ก.พ. เวลา 14:36
1
กำลังใจ อยู่ใกล้นิดเดียว
น่าดูมากเลยครับ พี่เขียนดีมากๆ 👍💕
11 ก.พ. เวลา 11:10
1
หนังหลายมิติ
ขอบคุณครับ
11 ก.พ. เวลา 11:42
1
Success Journey
น่าสนค่ะ ต้องไปดูบ้างแล้วค่า
11 ก.พ. เวลา 10:28
1
หนังหลายมิติ
ลองดูใน netflix เลยครับ
11 ก.พ. เวลา 11:42
Blockพูดได้byข้าวน้อยฯ
พี่หนังเขียนซะอยากดูเลย ชอบแบบได้คิดตาม
11 ก.พ. เวลา 09:19
1
หนังหลายมิติ
มีหลายตอนครับ น่าสนใจทั้งนั้น
11 ก.พ. เวลา 11:42
11 ก.พ. เวลา 09:02
1
หนังหลายมิติ
ขอบคุณเช่นกันครับ
11 ก.พ. เวลา 11:43
1
Feel Good
สุดอ่ะ
11 ก.พ. เวลา 08:57
1
หนังหลายมิติ
ข้อมูลน่าสนใจทั้งนั้นครับ
11 ก.พ. เวลา 11:43