7 ชั่วโมงที่แล้ว • วิทยาศาสตร์ & เทคโนโลยี

Photonic vs Cerebras ชิปพลังแสง ปะทะ ชิปยักษ์ ซิลิคอน ใครจะเป็นผู้ชนะ?

ในยุคที่เราสามารถเสกผลงานศิลปะชิ้นเอก หรือเขียนโค้ดโปรแกรมที่ซับซ้อนได้ภายในไม่กี่วินาที
เคยสงสัยไหมว่าเบื้องหลังความฉลาดล้ำลึกของ AI เหล่านี้ มันซ่อนความลับอะไรเอาไว้บ้าง
คำตอบไม่ได้มีแค่ชุดคำสั่งทางคณิตศาสตร์ที่สวยงาม แต่มันคือสงครามของการประมวลผลที่กำลังใช้ทรัพยากรมหาศาลในแบบที่โลกไม่เคยเห็นมาก่อน…
หากเราย้อนกลับไปดูประวัติศาสตร์ของอุตสาหกรรมเทคโนโลยีในช่วงกว่าครึ่งศตวรรษที่ผ่านมา
กฎทองคำที่เปรียบเสมือนคัมภีร์ของวงการนี้คือ Moore’s Law ซึ่งถูกตั้งขึ้นโดย Gordon Moore ผู้ร่วมก่อตั้งบริษัท Intel ในปี 1965
กฎนี้ทำนายเอาไว้ว่า จำนวนทรานซิสเตอร์บนชิปคอมพิวเตอร์จะเพิ่มขึ้นเป็นสองเท่าในทุกสองปี
ตลอดเวลาที่ผ่านมา มนุษย์เราสามารถย่อขนาดทรานซิสเตอร์ให้เล็กลงเรื่อยๆ จากขนาดที่เคยมองเห็นได้ด้วยตาเปล่า สู่ขนาดที่เล็กกว่าเส้นผมมนุษย์นับหมื่นเท่า
ในปัจจุบัน เทคโนโลยีการผลิตชิปขั้นสูงสามารถสร้างเส้นรอยวงจรที่มีขนาดเล็กจนเข้าใกล้ขนาดของอะตอมเข้าไปทุกที
สิ่งนี้ทำให้คอมพิวเตอร์มีประสิทธิภาพสูงขึ้นและราคาถูกลงอย่างต่อเนื่อง เป็นรากฐานสำคัญที่ทำให้เรามีสมาร์ตโฟนและอินเทอร์เน็ตใช้กันในทุกวันนี้…
แต่ความรุ่งเรืองนี้กำลังเผชิญหน้ากับบททดสอบครั้งใหญ่ที่สุด นั่นคือการมาถึงของยุค AI
โมเดล AI ในยุคปัจจุบัน โดยเฉพาะ Large language models ต้องการพลังการประมวลผลในระดับที่มหาศาล
การฝึกฝนระบบขั้นสูงอาจต้องใช้ Processors ที่ทรงพลังนับพันตัวทำงานร่วมกันตลอดเวลาเป็นเวลาหลายเดือน
เมื่อระบบเหล่านี้มีขนาดใหญ่ขึ้น การประมวลผลด้วยคอมพิวเตอร์แบบดั้งเดิมจึงต้องเผชิญกับความท้าทายในการเคลื่อนย้ายข้อมูล
ปัญหานี้ในวงการวิศวกรรมคอมพิวเตอร์คือสภาวะที่คอขวดของการทำงานไม่ได้อยู่ที่ว่าสมองกลคิดได้เร็วแค่ไหน แต่อยู่ที่ว่าเราสามารถส่งข้อมูลไปให้มันคิดได้เร็วเพียงใดต่างหาก…
1
ในหลายกรณี ข้อจำกัดที่ใหญ่ที่สุดไม่ใช่ตัว Processors อีกต่อไป
แต่มันคือเวลา พลังงาน และต้นทุนที่ต้องใช้ในการรับส่งข้อมูลระหว่างหน่วยประมวลผลกับหน่วยความจำ
เริ่มต้นกันที่ชิปคอมพิวเตอร์แบบดั้งเดิมที่เราใช้กันอยู่ทุกวันนี้ กลไกการทำงานของมันคือการเคลื่อนย้ายข้อมูลโดยใช้สัญญาณไฟฟ้า
จะมีอนุภาคที่เรียกว่า Electrons ขนาดจิ๋วเดินทางผ่านเส้นทางขนาดเล็กระดับไมโครสโคปภายในตัวชิป
แนวทางนี้สามารถใช้งานได้ดีเยี่ยมมาโดยตลอด แต่มันก็มาพร้อมกับข้อจำกัดทางกฎฟิสิกส์ที่ไม่สามารถหลีกเลี่ยงได้
นั่นคือสัญญาณไฟฟ้าทำให้เกิดความต้านทาน และความต้านทานทำให้เกิดความร้อน…
1
เมื่อ Processors มีพลังมากขึ้น ความต้องการในการระบายความร้อนก็เพิ่มสูงขึ้นเป็นเงาตามตัว
นอกจากนี้ การถ่ายโอนข้อมูลยังกินพลังงานอย่างมหาศาล
มีข้อมูลระบุว่าในบางระบบเซิร์ฟเวอร์ พลังงานส่วนใหญ่ไม่ได้ถูกนำไปใช้ในการคำนวณ
แต่ถูกใช้ไปกับการสูบฉีดข้อมูลผ่านสายทองแดงและแผงวงจร
1
โดยเฉพาะในระบบ Data centers สำหรับ AI ขนาดใหญ่ที่ต้องมีการรับส่งข้อมูลปริมาณมหาศาลระหว่างเซิร์ฟเวอร์อย่างต่อเนื่อง
นี่คือฝันร้ายของต้นทุนค่าไฟและปัญหาโลกร้อน…
เมื่อเส้นทางเดิมเริ่มตีบตัน โลกเทคโนโลยีจึงต้องการทางออกใหม่
และนี่คือจุดที่เทคโนโลยีสุดล้ำสองรูปแบบก้าวเข้ามาในสมรภูมิ ทั้งคู่พยายามแก้ปัญหานี้จากแนวทางที่แตกต่างกันอย่างสิ้นเชิง
แนวทางแรกคือการละทิ้งไฟฟ้าและหันไปพึ่งพาสิ่งที่เดินทางเร็วที่สุดในจักรวาล ซึ่งก็คือแสง
เทคโนโลยีนี้เรียกว่า Photonic chips…
Photonic chips เลือกใช้แนวทางที่แตกต่างออกไปอย่างสิ้นเชิง แทนที่จะเคลื่อนย้ายข้อมูลด้วย Electrons
เทคโนโลยีนี้เลือกใช้ Photons ซึ่งก็คืออนุภาคของแสง
แสงเดินทางได้เร็วมากๆ และที่สำคัญที่สุดคือมันสร้างความร้อนระหว่างการส่งข้อมูลน้อยกว่าไฟฟ้าหลายเท่าตัว
สิ่งนี้สร้างข้อได้เปรียบหลายประการ
ข้อมูลสามารถเคลื่อนที่ข้ามระบบได้เร็วขึ้นมาก เหมือนกับการเปลี่ยนจากถนนลูกรังมาเป็นมอเตอร์เวย์ความเร็วแสงที่ไม่มีข้อจำกัดเรื่องความเร็วอีกต่อไป
การใช้พลังงานลดลงอย่างมีนัยสำคัญ และปัญหาคอขวดในการสื่อสารระหว่าง Processors จะมีความรุนแรงลดลง…
สำหรับเวิร์กโหลดของการประมวลผล AI เรื่องนี้มีความสำคัญเป็นพิเศษ
ระบบ AI สมัยใหม่ใช้เวลาส่วนใหญ่ไปกับการถ่ายโอนข้อมูลเพื่อนำมาเปรียบเทียบ หาความน่าจะเป็น และปรับ weight ของข้อมูล
ซึ่งมันมากกว่าการคำนวณทางคณิตศาสตร์แบบดั้งเดิมเสียอีก
หากข้อมูลสามารถเคลื่อนที่ได้อย่างมีประสิทธิภาพมากขึ้น ประสิทธิภาพโดยรวมก็อาจพุ่งสูงขึ้นอย่างก้าวกระโดด
ในปัจจุบัน มีหลายบริษัทและสถาบันวิจัยชั้นนำกำลังเร่งพัฒนา Photonic processors อย่างจริงจัง
การออกแบบบางชิ้นใช้แสงสำหรับการสื่อสารระหว่างชิ้นส่วนต่างๆ เพื่อส่งข้อมูลข้ามแผงวงจรเท่านั้น
ในขณะที่การวิจัยบางชิ้นทะเยอทะยานไปถึงขั้นพยายามที่จะใช้ระบบแสงเพื่อทำการคำนวณและประมวลผลข้อมูลทางตรรกะแบบตรงๆ เลยด้วยซ้ำ…
ทีนี้เรามาดูอีกหนึ่งทางออกที่แตกต่างกันอย่างสิ้นเชิง แต่บ้าบิ่นและท้าทายอุตสาหกรรมไม่แพ้กัน
นั่นคือแนวคิดของการไม่สร้างชิปขนาดเล็ก แต่สร้างชิปที่มีขนาดใหญ่ที่สุดเท่าที่โลกเคยมีมา
ซึ่งมีชื่อว่า Cerebras Wafer Scale Engine…
เพื่อความเข้าใจ เราต้องมองย้อนกลับไปที่วิธีการผลิตชิปในปัจจุบันก่อน
ชิปคอมพิวเตอร์ส่วนใหญ่เริ่มต้นการเดินทางบนสิ่งที่เรียกว่า Silicon wafer
ซึ่ง Wafer คือแผ่นแร่ซิลิคอนทรงกลมขนาดใหญ่ที่ผ่านกระบวนการทางเคมีจนบริสุทธิ์
ภายในแผ่นนี้จะบรรจุชิปเดี่ยวๆ จำนวนมากไว้ด้วยกัน
หลังจากการผลิตลวดลายวงจรลงบนแผ่นสำเร็จ ชิปเหล่านั้นจะถูกตัดแยกออกจากกัน นำไปทดสอบ และบรรจุแพ็กเกจเป็นชิ้นเดี่ยวๆ
กระบวนการนี้เป็นมาตรฐานของอุตสาหกรรม Semiconductor มานานหลายทศวรรษ…
แต่สตาร์ทอัพที่ชื่อบริษัท Cerebras ได้ตั้งคำถามที่สั่นสะเทือนวงการขึ้นมา
แล้วถ้าเราไม่ตัดแผ่น Wafer เลย จะเกิดอะไรขึ้น
แทนที่จะสร้างชิปขนาดเล็กหลายร้อยตัวเพื่อนำมาเชื่อมต่อกันภายนอกให้วุ่นวาย
บริษัทได้ออกแบบให้แผ่น Wafer ทั้งแผ่นทำงานเป็น Processor ขนาดยักษ์เพียงตัวเดียว
และผลลัพธ์ที่ได้ก็คือ Wafer Scale Engine…
ลองนึกภาพตามดูว่า ชิปที่ล้ำสมัยส่วนใหญ่จะมีขนาดเล็กพอที่จะวางบนฝ่ามือของเราได้สบายๆ
แต่ Cerebras Wafer Scale Engine นั้นมีขนาดใหญ่พอๆ กับกระเบื้องปูพื้นหรือ Silicon wafer ทั้งแผ่น
ภายในพื้นที่อันกว้างใหญ่นั้นบรรจุคอร์ประมวลผลที่ได้รับการปรับแต่งมาสำหรับ AI โดยเฉพาะนับแสนคอร์
ซึ่งทั้งหมดนี้เชื่อมต่อกันอยู่บนแผ่นซิลิคอนเพียงแผ่นเดียว…
การออกแบบระดับมหากาพย์นี้ช่วยแก้ปัญหาความท้าทายที่ใหญ่ที่สุดอย่างหนึ่งของการประมวลผล AI
นั่นก็คือปัญหาเรื่องการสื่อสาร
ในระบบ Data centers ดั้งเดิม ข้อมูลจะต้องเคลื่อนย้ายไปมาระหว่าง Processors ที่แยกกันอยู่ตลอดเวลา
ทุกๆ การรับส่งข้อมูลระหว่างชิปแต่ละตัวจะทำให้เกิดความล่าช้าและสิ้นเปลืองพลังงาน
ยิ่งเมื่อต้องใช้ Processors ร่วมกันนับพันตัว ภาระส่วนเกินในการสื่อสารก็ยิ่งกลายเป็นคอขวดที่บีบรัดประสิทธิภาพของระบบ
แนวทางของ Cerebras ช่วยลดปัญหานี้ให้เหลือน้อยที่สุด
เนื่องจากคอร์ประมวลผลนับแสนคอร์และหน่วยความจำทั้งหมดอาศัยอยู่บนชิปยักษ์เพียงแผ่นเดียว…
ข้อมูลจึงสามารถเดินทางข้ามแผ่น Wafer ได้โดยตรงผ่านเส้นทางซิลิคอนที่รวดเร็ว
โดยไม่ต้องพึ่งพาเครือข่ายภายนอกที่ซับซ้อน
สิ่งนี้ทำให้การสื่อสารรวดเร็วขึ้นมหาศาล และทำให้การรันเวิร์กโหลด AI ขนาดใหญ่มีประสิทธิภาพอย่างที่ระบบเดิมเทียบไม่ติด
สถาปัตยกรรมนี้มีความน่าสนใจเป็นพิเศษสำหรับการนำไปใช้ฝึกฝนและรัน Large language models และแอปพลิเคชันที่ต้องประมวลผลข้อมูลปริมาณมหาศาล…
แน่นอนว่าการสร้างชิปแผ่นใหญ่ขนาดนี้ย่อมมีความเสี่ยง
หากกระบวนการผลิตมีฝุ่นละอองเพียงนิดเดียวตกลงไปบนแผ่นซิลิคอน พื้นที่ส่วนนั้นจะพังทันที
ในอดีต หากชิปตัวไหนพังก็จะถูกคัดทิ้ง
แต่สำหรับชิปที่ใช้พื้นที่ทั้งแผ่นแบบนี้ Cerebras ได้แก้ปัญหาโดยการพัฒนาเทคนิคทางวิศวกรรมที่ซับซ้อน
1
ในการสร้างระบบเครือข่ายภายในที่สามารถกำหนดเส้นทางหลบเลี่ยงพื้นที่ที่บกพร่องบนแผ่นชิปได้โดยอัตโนมัติ
เพื่อให้ Processor โดยรวมยังคงสามารถทำงานต่อไปได้อย่างสมบูรณ์…
มาถึงจุดนี้ หลายคนคงมีคำถามว่า แล้วตกลงแนวทางไหนมันดีกว่ากัน
ระหว่างความเร็วแสงของ Photonic chips กับความยิ่งใหญ่ของ Cerebras Wafer Scale Engine
คำตอบคือ ไม่มีแนวทางใดที่ดีกว่ากันในทุกมิติ เพราะทั้งคู่ถูกสร้างมาเพื่อแก้ปัญหาจากมุมมองที่แตกต่างกัน
Photonic chips มุ่งเน้นไปที่การปรับปรุงวิธีการเคลื่อนย้ายข้อมูลเป็นหลัก
โดยมีเป้าหมายเพื่อลดการใช้พลังงานและเพิ่มความเร็วในการสื่อสารผ่านเทคโนโลยีที่ใช้แสง
ส่วน Cerebras มุ่งเน้นไปที่การปฏิวัติพื้นที่ของการประมวลผล
โดยการขจัดระยะห่างระหว่างหน่วยประมวลผลให้หมดไป เพื่อให้ทุกอย่างเกิดขึ้นจบในแผ่นเดียว…
ทั้ง Photonic computing และสถาปัตยกรรมแบบ Wafer-scale ถือเป็นความพยายามที่ทะเยอทะยานที่สุดในรอบหลายสิบปี
ในการทบทวนแนวคิดใหม่ว่าคอมพิวเตอร์ควรถูกสร้างขึ้นมาอย่างไร
ไม่ว่าเทคโนโลยีไหนจะก้าวขึ้นมาเป็นผู้นำ หรือความจริงแล้วทั้งสองเทคโนโลยีอาจจะถูกพัฒนาควบคู่กันไป
สิ่งเหล่านี้ได้สะท้อนให้เห็นถึงความจริงที่สำคัญข้อนึง
ยุคต่อไปของระบบคอมพิวเตอร์อาจไม่ได้มาจากการทำให้ชิปแบบเดิมมีขนาดเล็กลงหรือมีความเร็วเพิ่มขึ้นเพียงเล็กน้อยอีกต่อไป
แต่มันอาจจะมาจากการเปลี่ยนแปลง “”วิธีคิด”” ขั้นพื้นฐาน
ว่าด้วยวิธีการประมวลผล เคลื่อนย้ายข้อมูล และการก้าวข้ามขีดจำกัดของธรรมชาติใหม่ทั้งหมด
และในขณะที่คุณกำลังอ่านเรื่องราวนี้อยู่ การเปลี่ยนแปลงครั้งยิ่งใหญ่นั้นก็กำลังดำเนินอยู่รอบตัวเราไปเป็นที่เรียบร้อยแล้วนั่นเองครับม…
References : [cerebras,ieeespectrum,technologyreview,wired,nature]
◤━━━━━━━━━━━━━━━◥
หากคุณชอบคอนเทนต์นี้อย่าลืม 'กดไลก์'
หากคอนเทนต์นี้โดนใจอย่าลืม 'กดแชร์'
คิดเห็นอย่างไรคอมเม้นต์กันได้เลยครับผม
◣━━━━━━━━━━━━━━━◢
The original article appeared here https://www.tharadhol.com/photonic-vs-cerebras/
ติดตามสาระดี ๆ อัพเดททุกวันผ่าน Line OA ด.ดล Blog
คลิกเลย --> https://lin.ee/aMEkyNA
——————————————––
ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
=========================
โฆษณา