12 ธ.ค. 2019 เวลา 00:50 • บันเทิง
Alphago(2017) : หมากตาที่ 78 และหนึ่งเกมแห่งชัยชนะของลี เซดอล (ตอนที่ 1)
Alphago(2017)คือหนังสารคดีที่ถ่ายทอดความเป็นมาของ " อัลฟ่าโกะ " (Alphago)ในช่วงของการพัฒนาโปรแกรมเพื่อเตรียมตัวเข้าแข่งขันกับนักกีฬาโกะมืออาชีพระดับ 9 ดั้ง อย่าง ลี เซดอล (Lee Sedol)ผู้มีดีกรีแชมป์โลก 18 สมัย
เริ่มตั้งแต่การทดลองสร้างปัญญาประดิษฐ์ในช่วงเริ่มต้น
DeepMild ซึ่งเป็นผู้พัฒนาโปรแกรมเลือกที่จะใช้เกมในการสร้างชุดคำสั่งของเอไอ เพราะเกมคือสถานการณ์จำลองของสภาพแวดล้อมที่เกิดขึ้นจริงและมีการนับแต้ม ดังนั้นมันจึงง่ายต่อการวัดผล
ในช่วงแรกทีมพัฒนาโปรแกรมใช้สถานการณ์ในเกม Break out สร้างชุดคำสั่งขึ้นมา เกมBreak outเป็นเกมที่ผู้เล่นต้องควบคุมไม้เพื่อตีบอลให้เด้งไปทำลายกำแพงสีรุ้ง เป้าหมายมีเพียงเท่านี้
เมื่อเริ่มเกมเอไอไม่รู้กฎ กติกาใดๆทั้งสิ้น
มันต้องเรียนรู้ไปเรื่อยๆผ่านการเล่น
เมื่อผ่านไป 100 เกม มันเริ่มเข้าใจกติกาการเล่น
ผ่านไป 300 เกม มันสามารถเล่นได้เก่งกว่าทุกคนบนโลกนี้
และเมื่อผ่านไป 500 เกม มันก็สร้างความตื่นตะลึงให้กับทีมพัฒนาโปรแกรม เมื่อเอไอสามารถเล่นเกมนี้ด้วยวิธีการที่ไม่มีใครคาดคิด
มันเล่นเกมBreak outโดยการทำลายกำแพงด้านข้างและส่งบอลขึ้นด้านบนเพื่อให้บอลเด้งกระดอนไปมาเพื่อทำลายกำแพงอย่างรวดเร็ว
การทำเช่นนี้เป็นวิธีที่มีประสิทธิภาพมาก
ทั้งหมดนี้มันเรียนรู้ด้วยตัวของมันเอง....
หลังจากนั้นทีมงานจึงมองหาเกมใหม่ๆเพื่อพัฒนาความสามารถของเอไอให้มากขึ้น ซึ่งเกมที่เหมาะที่สุด คือ " โกะ " (Go) เพราะในบรรดาเกมทั้งหลายที่มนุษย์คิดค้นขึ้นมานั้น โกะมีความซับซ้อนมากที่สุด
ในตารางเดิน ขนาด 19x19 ช่องนั้น มีจุดตัดทั้งหมด 361 จุด วิธีการเดินหมากแต่ละตามีมากกว่า 10 ยกกำลัง 768 วิธี ซึ่งมากกว่าจำนวนอะตอมในจักรวาลเสียอีก ด้วยความซับซ้อนระดับนี้ โกะจึงเหมาะที่จะใช้เป็นเกมการแข่งขันระหว่าง " ปัญญามนุษย์ " กับ " ปัญญาประดิษฐ์ "
อีกสิ่งหนึ่งที่ทำให้โกะน่าสนใจ คือ การวางหมากในเกมหมากล้อมนั้น ใช้มากกว่าการวางแผนจากสมอง
บ่อยครั้งนักเล่นโกะมืออาชีพวางหมากจากสัญชาตญาณของการหยั่งรู้ ดังนั้นหากเอไอสามารถเล่นโกะชนะมนุษย์ได้ นั่นหมายความว่าอย่างน้อยๆเอไอนั้นต้องมีญาณหยั่งรู้ในระดับที่ไม่ต่างจากมนุษย์
อัลฟ่าโกะ ถูกสร้างขึ้นจากกระบวนการหยั่งรู้นั้น
วิศวกรผู้พัฒนาโปรแกรมได้สร้างเครือข่ายประสาทเทียมระดับลึกให้กับอัลฟ่าโกะ และใส่บันทึกการเดินหมากจากผู้เล่นเก่งๆระดับสมัครเล่นลงไปกว่า 100,000 เกม เพื่อให้อัลฟ่าโกะเรียนรู้
จากนั้นก็ปล่อยให้โปรแกรมแข่งกับตัวมันเองไม่ต่ำกว่าหนึ่งล้านเกม
อัลฟ่าโกะฝึกฝนการเดินหมากและเรียนรู้จากความผิดพลาดของตนเอง
ถึงตอนนี้อัลฟ่าโกะพร้อมที่จะเล่นกับมืออาชีพแล้ว
ฟาน ฮุย เซียนโกะระดับสองดั้ง เจ้าของตำแหน่งแชมป์ยุโรป 3 สมัย ถูกเชิญมาที่ DeepMildในกรุงลอนดอนเพื่อเล่นโกะกับอัลฟ่าโกะ
ฟาน ฮุย พกความมั่นใจมาเต็มเปี่ยม เขาเชื่อว่าคอมพิวเตอร์ไม่มีทางที่จะเล่นโกะชนะมนุษย์ได้ ปรากฎว่าเขาคิดผิด....ผลจบลงด้วยสกอร์ 5-0
ฟาน ฮุยแพ้ทุกกระดาน นับเป็นครั้งแรกในประวัติศาสตร์ของมนุษย์ที่นักเล่นโกะมืออาชีพแพ้ให้กับคอมพิวเตอร์
ฟาน ฮุย แชมป์โกะยุโรป (รูปบน) และทีม DeepMind (รูปล่าง)
ความเก่งกาจของอัลฟ่าโกะ เกิดจากการสั่งสมประสบการณ์จากเกมนับล้านบวกกับกระบวนการทำงานหลักของมันซึ่งมีอยู่ 3 ส่วน คือ
1. Policy Network เป็นระบบฝึกเพื่อเรียนรู้รูปแบบและวิธีการเล่น เพื่อเลียนแบบการเล่นของมนุษย์
2. Value Network เป็นระบบประเมินสถานการณ์ในเกม เพื่อบอกความเป็นไปได้ที่จะชนะในการวางหมากลงบนแต่ละตำแหน่งของกระดาน
3. Tree Search คือส่วนที่จะคำนวณค่าตัวแปรต่างๆที่อาจเกิดขึ้นได้ในเกม และคาดการณ์ถึงสิ่งที่จะเกิดขึ้นต่อไป
องค์ประกอบสามส่วนนี้ทำงานสัมพันธ์กัน Policy Network ทำหน้าที่ในการสแกนรูปแบบหมากในเกมเพื่อหาตำแหน่งวางหมากที่เหมาะสม
จากนั้นTree Searchจะสร้างแผนผังต้นไม้แยกย่อยออกมาเพื่อหารูปแบบความผกผันที่เป็นไปได้และส่งต่อไปยัง Value Networkเพื่อประเมินโอกาสชนะในแต่ละตำแหน่ง
ทั้งสามองค์ประกอบเป็นจุดแข็งของอัลฟ่าโกะ มันคือฐานข้อมูลระดับ Big Data ที่ประมวลผลและเรียกใช้ได้ทุกเมื่อ
ดูเหมือนว่าอัลฟ่าโกะนั้นไม่มีจุดอ่อน แต่นักพัฒนาระบบก็ยังไม่วางใจ
การเล่นกับมืออาชีพระดับสูงสุดของโลกที่รูปแบบการเล่นไม่เหมือนใคร อาจทำให้อัลฟ่าโกะพลาดท่า
เพื่อปิดรอยรั่วที่อาจเกิดขึ้นได้...อัลฟ่าโกะต้องทดลองเล่นกับมนุษย์ เพื่อหาว่ายังมีจุดอ่อนตรงไหนอีกบ้าง ?
ฟาน ฮุย จึงถูกเชิญมาอีกครั้ง...ครั้งนี้เขาได้เข้ามาเป็นส่วนหนึ่งของทีมพัฒนาอัลฟ่าโกะ หน้าที่ของเขาคือ เล่นหมากล้อมกับอัลฟ่าโกะทั้งวันทั้งคืน เพื่อหาจุดอ่อนของมัน
แล้วเขาก็พบจุดอ่อนนั้นก่อนวันแข่งเพียงไม่กี่วัน
ฟาน ฮุย พบว่าอัลฟ่าโกะเดินหมากได้ยอดเยี่ยมมาก มันแข็งแกร่งเกินต้านทาน แต่มีบางสถานการณ์ที่ดูเหมือนว่าอัลฟ่าโกะจะเข้าใจผิด
เมื่อมันเจอสถานการณ์ที่ไม่มีอยู่ในฐานข้อมูล หรือรูปแบบการเดินที่มันไม่คุ้นเคย อัลฟ่าโกะจัดการกับข้อมูลแบบนี้ได้ไม่ดีนัก
บางครั้งมันหลงผิดคิดว่ามันไปต่อได้ ทั้งที่ความเป็นจริงมันกำลังพาตัวเองเข้าสู่มุมอับและอาจทำให้แพ้ได้ในที่สุด
แม้โอกาสที่จะเกิดเหตุการณ์แบบนี้มีน้อยมาก แต่จะประมาทผู้เล่นระดับลี เซดอลไม่ได้
ด้วยเวลาที่กระชั้นชิดทำให้นักพัฒนาไม่สามารถแก้ไขปัญหานี้ทัน แม้จะกังวลอยู่บ้าง...แต่พวกเขาก็ตัดสินใจที่จะส่งอัลฟ่าโกะเวอร์ชั่นนี้ลงแข่งขัน
สถานที่ถูกจัดที่เกาหลีใต้ บ้านเกิดของ ลี เซดอล
ก่อนวันแข่ง ลี เซดอล มั่นใจมาก
เขาบอกว่าฝีมือของเขาต่างจากฟาน ฮุย
และนี่ก็เพิ่งจะผ่านมาเพียงห้าเดือนเท่านั้น หลังจากที่อัลฟ่าโกะได้ลงแข่งกับฟานฮุย(ครั้งแรก) อัลฟ่าโกะคงพัฒนาไปได้ไม่มาก
เขาจะชนะด้วยสกอร์ 5-0 หรืออย่างแย่ที่สุดคือ 4-1
ในตอนนั้น ไม่มีใครรู้ถึงศักยภาพของอัลฟ่าโกะ
ทุกคนประเมินศักยภาพมันต่ำกว่าความเป็นจริง มีเพียงทีมDeepMildเท่านั้นที่เชื่อมั่นในโปรแกรมของเขา
เรื่องราวต่อจากนี้คือปฐมบทการต่อสู้ระหว่างมนุษย์กับเอไอที่ถูกบันทึกไว้ในประวัติศาสตร์
ลี เซดอล คือ ตัวแทนของมนุษยชาติ
อัลฟ่าโกะ คือ ตัวแทนฝั่งเอไอ
สถานการณ์ในห้าเกม...เกิดอะไรขึ้นบ้าง ?
และหัตถ์ เทวะ ซึ่งเกิดกับลี เซดอลในการเดินตาที่ 78 เป็นอย่างไร ?
โปรดติดตามต่อในตอนที่สองครับ
เครดิตข้อมูล :
สารคดีชุด AlphaGo(2017) สามารถรับชมได้ทาง Netflix
โฆษณา