30 ม.ค. 2025 เวลา 04:06 • วิทยาศาสตร์ & เทคโนโลยี

ประวัติ Liang Wenfeng

วันนี้มาเล่าประวัติคร่าวๆ ของ Liang Wenfeng และบริษัทของเขา DeepSeek ครับ
Liang Wenfeng เกิดในครอบครัวชนชั้นกลาง เขาเกิด และโตในเมือง Zhangjiang ประเทศจีน ในปี 1985 คุณพ่อของเขาเป็นครูสอนหนังสือ
เขามีความสนใจในวิชาวิทยาศาสตร์ และได้เข้าศึกษาต่อด้านวิศวกรรมศาสตร์สาขาไฟฟ้า และการสื่อสารที่มหาวิทยาลัย Zhejiang ตั้งแต่อายุ 17 และศึกษาต่อปริญญาโทวิศวกรรมศาสตร์ในสาขาสารสนเทศ และการสื่อสาร จนเรียนจบในปี 2010 โดยได้ทำการวิจัยในการควบคุมกล้องให้ติดตามเป้าหมาย
หลังจากเรียนจบ เขาย้ายไปอาศัยในเมือง Chengdu มณฑล Sichuan และได้ทำงานเกี่ยวกับ AI ในหลายๆ อุตสาหกรรม และได้ตั้งบริษัทลงทุนที่ชื่อ Hangzhou Yakebi Investment Management Co., Ltd. กับ Xu Jin เพื่อนร่วมมหาวิทยาลัยของเขา และเป็นใบเบิกทางในการเข้าสู่วงการทางการเงิน
หลังจากนั้นในปี 2015 เขาได้ก่อตั้ง hedge fund ที่ชื่อ Hangzhou Huanfang Technology Co., Ltd. ก่อนที่จะกลายมาเป็น Zhejiang Jiuzhang Asset Management Co., Ltd.
จนในปี 2016 เขาได้ร่วมกับเพื่อนมหาวิทยาลัยอีกสองคนก่อตั้ง Ningbo High-Flyer Quantitative Investment Management Partnership หรือ
High Flyer ที่ใช้ AI ในการตัดสินใจลงทุน จนประสบความสำเร็จ ณ จุดสูงสุด เคยมีสินทรัพย์ภายใต้การบริหารมากกว่าหนึ่งแสนล้านหยวนในปี 2021 จนเป็น hedge fund แรกในจีนที่มีขนาดเกินหนึ่งแสนล้านหยวน
ในปี 2020 เขาได้ขยายขอบเขตไปลงทุนในเรื่องของเทคโนโลยี AI และได้เริ่มสั่ง GPU A100 จำนวนกว่า 10,000 ใบมาทำเป็น supercomputer ชื่อ Fire-Flyer I (2020) และ II (2021) โดยลงทุนมากกว่าหนึ่งพันล้านหยวน
ในปี 2023 เขาประกาศตั้งบริษัท DeepSeek เพื่อพัฒนาด้าน Generative AI และจ้างนักศึกษาปริญญาเอกจำนวนมากจากมหาวิทยาลัยชั้นนำอย่างมหาวิทยาลัย Peking และ Tsinghua และเริ่มตีพิมพ์งานวิจัยด้าน AI จำนวนมาก จุดพลิกผันเริ่มขึ้นเมื่อ DeepSeek ได้ออกโมเดล DeepSeek-V2 ออกมาในเดือนพฤษภาคมปีที่แล้ว ที่แสดงให้เห็นศักยภาพของ Generative AI ที่มีประสิทธิภาพสูง
ในต้นทุนที่ต่ำ จนเกิดแรงกดดันให้ผู้ให้บริการด้าน AI ในจีนอย่าง ByteDance, Tencent, Baidu, และ Alibaba ต้องลดราคาเพื่อให้มาแข่งขันกับ DeepSeek ไปก่อนหน้าแล้ว
และในเดือนธันวาคมปีที่แล้ว DeepSeek ก็ได้เปิดตัว DeepSeek-V3 ที่มีจำนวน parameter มากถึง 671 พันล้านตัว และใช้เวลาฝึกเพียง 55 วัน และค่าใช้จ่ายในการฝึกไม่ถึง 6 ล้านเหรียญสหรัฐ แต่กลับมีประสิทธิภาพทัดเทียมกับ AI ก่อนหน้า และในเดือนมกราคมปีนี้เองที่มีการออกโมเดล DeepSeek-R1 ที่มีขนาดเล็ก และเร็วจนสามารถทำงานบนเครื่อง PC ธรรมดาได้ จนทำให้โลกต้องประทับใจกับโมเดลนี้ไม่น้อย
ก่อนหน้านี้ บริษัทของเขาได้รับข้อเสนอซื้อบริษัทในมูลค่าหนึ่งหมื่นล้านเหรียญสหรัฐ แต่เขาปฏิเสธ และบอกว่าเป้าหมายของบริษัทคือการพัฒนาด้าน AI ไม่ใช่เพื่อเงิน และต้องการเน้นให้เกิดนวัติกรรม มากกว่าการเลียนแบบเท่านั้น เขาเชื่อในเรื่องการเปิดเผยโค้ดว่าจะทำให้เกิดนวัตกรรมใหม่ๆ และการพัฒนาที่ดีกว่า การไม่เปิดเผยโค้ดได้เพียงแค่ทำให้คู่แข่งช้าลงเท่านั้น
ชื่อของเขาเริ่มเป็นที่รู้จัก หลังจากที่เขาได้พบ Li Qiang นายกรัฐมนตรีของจีนเมื่อวันที่ 20 มกราคมที่ผ่านมา และ DeepSeek-R1 ได้ถูกเปิดตัวเมื่อไม่กี่วันที่ผ่านมา
โฆษณา