พูดให้เข้าใจง่าย ๆ ก็คือ การสร้างความฉลาดให้ AI ผ่านการลองผิดลองถูกไปเรื่อย ๆ โดยมีจุดมุ่งหมายคือ ให้ทำคะแนนออกมามากที่สุดเท่าที่จะทำได้
กระบวนการแบบนี้ จะทำให้ AI ได้เรียนรู้ตลอดเวลา หาก AI เคยทำผิดในครั้งหนึ่ง และเมื่อได้เรียนรู้แล้ว ครั้งต่อ ๆ มา AI ก็จะทำได้ดียิ่งขึ้น จนเข้าสู่ในจุดที่ใกล้เคียงความสมบูรณ์แบบมากที่สุดนั่นเอง
โดยทางคุณ Demis ได้เริ่มจากการนำสิ่งที่ตัวเองโปรดปรานที่สุด มาปรับใช้ นั่นคือการให้ AI ฝึกเล่นเกม แต่ไม่ได้บอกกติกา เพียงแค่มีคำสั่งว่าให้ทำคะแนนออกมาให้ได้มากที่สุด
ผลลัพธ์ที่ออกมานั้น เรียกได้ว่า น่าทึ่งเป็นอย่างมาก เพราะเมื่อปล่อยให้ AI ได้ลองผิดลองถูกไปเรื่อย ๆ
นอกจาก AI จะไม่เพียงเล่นเกมได้เก่งกว่ามนุษย์แล้ว AI ก็ยังฉลาดพอ จนพบเห็นช่องโหว่ในเกม และคิดค้นกลยุทธ์ขึ้นมาเอง ในแบบที่มนุษย์ผู้สร้างเกมเอง ยังคิดไม่ได้เลยด้วยซ้ำ..