[หนังหลายมิติ] Alphago(2017) : หมากตาที่ 78 และหนึ่งเกมแห่งชัยชนะของลี เซดอล (ตอนที่ 1) Alphago(2017)คือหนังสารคดีที่ถ่ายทอดความเป็นมาของ " อัลฟ่าโกะ " (Alphago)ในช่วงของการพัฒนาโปรแกรมเพื่อเตรียมตัวเข้าแข่งขันกับนั

สำรวจ
ลงทุน
คำถาม

มีบัญชีอยู่แล้ว?หรือ

•

12 ธ.ค. 2019 เวลา 00:50 • บันเทิง

Alphago(2017) : หมากตาที่ 78 และหนึ่งเกมแห่งชัยชนะของลี เซดอล (ตอนที่ 1)

Alphago(2017)คือหนังสารคดีที่ถ่ายทอดความเป็นมาของ " อัลฟ่าโกะ " (Alphago)ในช่วงของการพัฒนาโปรแกรมเพื่อเตรียมตัวเข้าแข่งขันกับนักกีฬาโกะมืออาชีพระดับ 9 ดั้ง อย่าง ลี เซดอล (Lee Sedol)ผู้มีดีกรีแชมป์โลก 18 สมัย

เริ่มตั้งแต่การทดลองสร้างปัญญาประดิษฐ์ในช่วงเริ่มต้น

DeepMild ซึ่งเป็นผู้พัฒนาโปรแกรมเลือกที่จะใช้เกมในการสร้างชุดคำสั่งของเอไอ เพราะเกมคือสถานการณ์จำลองของสภาพแวดล้อมที่เกิดขึ้นจริงและมีการนับแต้ม ดังนั้นมันจึงง่ายต่อการวัดผล

ในช่วงแรกทีมพัฒนาโปรแกรมใช้สถานการณ์ในเกม Break out สร้างชุดคำสั่งขึ้นมา เกมBreak outเป็นเกมที่ผู้เล่นต้องควบคุมไม้เพื่อตีบอลให้เด้งไปทำลายกำแพงสีรุ้ง เป้าหมายมีเพียงเท่านี้

เมื่อเริ่มเกมเอไอไม่รู้กฎ กติกาใดๆทั้งสิ้น

มันต้องเรียนรู้ไปเรื่อยๆผ่านการเล่น

เมื่อผ่านไป 100 เกม มันเริ่มเข้าใจกติกาการเล่น

ผ่านไป 300 เกม มันสามารถเล่นได้เก่งกว่าทุกคนบนโลกนี้

และเมื่อผ่านไป 500 เกม มันก็สร้างความตื่นตะลึงให้กับทีมพัฒนาโปรแกรม เมื่อเอไอสามารถเล่นเกมนี้ด้วยวิธีการที่ไม่มีใครคาดคิด

มันเล่นเกมBreak outโดยการทำลายกำแพงด้านข้างและส่งบอลขึ้นด้านบนเพื่อให้บอลเด้งกระดอนไปมาเพื่อทำลายกำแพงอย่างรวดเร็ว

การทำเช่นนี้เป็นวิธีที่มีประสิทธิภาพมาก

ทั้งหมดนี้มันเรียนรู้ด้วยตัวของมันเอง....

หลังจากนั้นทีมงานจึงมองหาเกมใหม่ๆเพื่อพัฒนาความสามารถของเอไอให้มากขึ้น ซึ่งเกมที่เหมาะที่สุด คือ " โกะ " (Go) เพราะในบรรดาเกมทั้งหลายที่มนุษย์คิดค้นขึ้นมานั้น โกะมีความซับซ้อนมากที่สุด

ในตารางเดิน ขนาด 19x19 ช่องนั้น มีจุดตัดทั้งหมด 361 จุด วิธีการเดินหมากแต่ละตามีมากกว่า 10 ยกกำลัง 768 วิธี ซึ่งมากกว่าจำนวนอะตอมในจักรวาลเสียอีก ด้วยความซับซ้อนระดับนี้ โกะจึงเหมาะที่จะใช้เป็นเกมการแข่งขันระหว่าง " ปัญญามนุษย์ " กับ " ปัญญาประดิษฐ์ "

อีกสิ่งหนึ่งที่ทำให้โกะน่าสนใจ คือ การวางหมากในเกมหมากล้อมนั้น ใช้มากกว่าการวางแผนจากสมอง

บ่อยครั้งนักเล่นโกะมืออาชีพวางหมากจากสัญชาตญาณของการหยั่งรู้ ดังนั้นหากเอไอสามารถเล่นโกะชนะมนุษย์ได้ นั่นหมายความว่าอย่างน้อยๆเอไอนั้นต้องมีญาณหยั่งรู้ในระดับที่ไม่ต่างจากมนุษย์

อัลฟ่าโกะ ถูกสร้างขึ้นจากกระบวนการหยั่งรู้นั้น

วิศวกรผู้พัฒนาโปรแกรมได้สร้างเครือข่ายประสาทเทียมระดับลึกให้กับอัลฟ่าโกะ และใส่บันทึกการเดินหมากจากผู้เล่นเก่งๆระดับสมัครเล่นลงไปกว่า 100,000 เกม เพื่อให้อัลฟ่าโกะเรียนรู้

จากนั้นก็ปล่อยให้โปรแกรมแข่งกับตัวมันเองไม่ต่ำกว่าหนึ่งล้านเกม

อัลฟ่าโกะฝึกฝนการเดินหมากและเรียนรู้จากความผิดพลาดของตนเอง

ถึงตอนนี้อัลฟ่าโกะพร้อมที่จะเล่นกับมืออาชีพแล้ว

ฟาน ฮุย เซียนโกะระดับสองดั้ง เจ้าของตำแหน่งแชมป์ยุโรป 3 สมัย ถูกเชิญมาที่ DeepMildในกรุงลอนดอนเพื่อเล่นโกะกับอัลฟ่าโกะ

ฟาน ฮุย พกความมั่นใจมาเต็มเปี่ยม เขาเชื่อว่าคอมพิวเตอร์ไม่มีทางที่จะเล่นโกะชนะมนุษย์ได้ ปรากฎว่าเขาคิดผิด....ผลจบลงด้วยสกอร์ 5-0

ฟาน ฮุยแพ้ทุกกระดาน นับเป็นครั้งแรกในประวัติศาสตร์ของมนุษย์ที่นักเล่นโกะมืออาชีพแพ้ให้กับคอมพิวเตอร์

ฟาน ฮุย แชมป์โกะยุโรป (รูปบน) และทีม DeepMind (รูปล่าง)

ความเก่งกาจของอัลฟ่าโกะ เกิดจากการสั่งสมประสบการณ์จากเกมนับล้านบวกกับกระบวนการทำงานหลักของมันซึ่งมีอยู่ 3 ส่วน คือ

1. Policy Network เป็นระบบฝึกเพื่อเรียนรู้รูปแบบและวิธีการเล่น เพื่อเลียนแบบการเล่นของมนุษย์

2. Value Network เป็นระบบประเมินสถานการณ์ในเกม เพื่อบอกความเป็นไปได้ที่จะชนะในการวางหมากลงบนแต่ละตำแหน่งของกระดาน

3. Tree Search คือส่วนที่จะคำนวณค่าตัวแปรต่างๆที่อาจเกิดขึ้นได้ในเกม และคาดการณ์ถึงสิ่งที่จะเกิดขึ้นต่อไป

องค์ประกอบสามส่วนนี้ทำงานสัมพันธ์กัน Policy Network ทำหน้าที่ในการสแกนรูปแบบหมากในเกมเพื่อหาตำแหน่งวางหมากที่เหมาะสม

จากนั้นTree Searchจะสร้างแผนผังต้นไม้แยกย่อยออกมาเพื่อหารูปแบบความผกผันที่เป็นไปได้และส่งต่อไปยัง Value Networkเพื่อประเมินโอกาสชนะในแต่ละตำแหน่ง

ทั้งสามองค์ประกอบเป็นจุดแข็งของอัลฟ่าโกะ มันคือฐานข้อมูลระดับ Big Data ที่ประมวลผลและเรียกใช้ได้ทุกเมื่อ

ดูเหมือนว่าอัลฟ่าโกะนั้นไม่มีจุดอ่อน แต่นักพัฒนาระบบก็ยังไม่วางใจ

การเล่นกับมืออาชีพระดับสูงสุดของโลกที่รูปแบบการเล่นไม่เหมือนใคร อาจทำให้อัลฟ่าโกะพลาดท่า

เพื่อปิดรอยรั่วที่อาจเกิดขึ้นได้...อัลฟ่าโกะต้องทดลองเล่นกับมนุษย์ เพื่อหาว่ายังมีจุดอ่อนตรงไหนอีกบ้าง ?

ฟาน ฮุย จึงถูกเชิญมาอีกครั้ง...ครั้งนี้เขาได้เข้ามาเป็นส่วนหนึ่งของทีมพัฒนาอัลฟ่าโกะ หน้าที่ของเขาคือ เล่นหมากล้อมกับอัลฟ่าโกะทั้งวันทั้งคืน เพื่อหาจุดอ่อนของมัน

แล้วเขาก็พบจุดอ่อนนั้นก่อนวันแข่งเพียงไม่กี่วัน

ฟาน ฮุย พบว่าอัลฟ่าโกะเดินหมากได้ยอดเยี่ยมมาก มันแข็งแกร่งเกินต้านทาน แต่มีบางสถานการณ์ที่ดูเหมือนว่าอัลฟ่าโกะจะเข้าใจผิด

เมื่อมันเจอสถานการณ์ที่ไม่มีอยู่ในฐานข้อมูล หรือรูปแบบการเดินที่มันไม่คุ้นเคย อัลฟ่าโกะจัดการกับข้อมูลแบบนี้ได้ไม่ดีนัก

บางครั้งมันหลงผิดคิดว่ามันไปต่อได้ ทั้งที่ความเป็นจริงมันกำลังพาตัวเองเข้าสู่มุมอับและอาจทำให้แพ้ได้ในที่สุด

แม้โอกาสที่จะเกิดเหตุการณ์แบบนี้มีน้อยมาก แต่จะประมาทผู้เล่นระดับลี เซดอลไม่ได้

ด้วยเวลาที่กระชั้นชิดทำให้นักพัฒนาไม่สามารถแก้ไขปัญหานี้ทัน แม้จะกังวลอยู่บ้าง...แต่พวกเขาก็ตัดสินใจที่จะส่งอัลฟ่าโกะเวอร์ชั่นนี้ลงแข่งขัน

สถานที่ถูกจัดที่เกาหลีใต้ บ้านเกิดของ ลี เซดอล

ก่อนวันแข่ง ลี เซดอล มั่นใจมาก

เขาบอกว่าฝีมือของเขาต่างจากฟาน ฮุย

และนี่ก็เพิ่งจะผ่านมาเพียงห้าเดือนเท่านั้น หลังจากที่อัลฟ่าโกะได้ลงแข่งกับฟานฮุย(ครั้งแรก) อัลฟ่าโกะคงพัฒนาไปได้ไม่มาก

เขาจะชนะด้วยสกอร์ 5-0 หรืออย่างแย่ที่สุดคือ 4-1

ในตอนนั้น ไม่มีใครรู้ถึงศักยภาพของอัลฟ่าโกะ

ทุกคนประเมินศักยภาพมันต่ำกว่าความเป็นจริง มีเพียงทีมDeepMildเท่านั้นที่เชื่อมั่นในโปรแกรมของเขา

เรื่องราวต่อจากนี้คือปฐมบทการต่อสู้ระหว่างมนุษย์กับเอไอที่ถูกบันทึกไว้ในประวัติศาสตร์

ลี เซดอล คือ ตัวแทนของมนุษยชาติ

อัลฟ่าโกะ คือ ตัวแทนฝั่งเอไอ

สถานการณ์ในห้าเกม...เกิดอะไรขึ้นบ้าง ?

และหัตถ์ เทวะ ซึ่งเกิดกับลี เซดอลในการเดินตาที่ 78 เป็นอย่างไร ?

โปรดติดตามต่อในตอนที่สองครับ

เครดิตข้อมูล :

สารคดีชุด AlphaGo(2017) สามารถรับชมได้ทาง Netflix

https://en.wikipedia.org/wiki/Go_and_mathematics

https://www.matichonweekly.com/column/article_97380

https://www.blognone.com/node/79675

ภาพประกอบจาก :

https://slideplayer.com/slide/13820427

https://www.slideshare.net/ShaneSeungwhanMoon/how-alphago-works

https://www.alphagomovie.com

ดูเพิ่มเติมในซีรีส์

เกมโกะหยุดโลกของลี เซดอล และ อัลฟ่าโกะ

โฆษณา

ดาวน์โหลดแอปพลิเคชัน

ดาวน์โหลดแอปพลิเคชัน