11 ม.ค. 2023 เวลา 05:15 • วิทยาศาสตร์ & เทคโนโลยี

Top 10 ML เฟรมเวิร์กที่มาแรงปี 2023

และข้อสงสัย ทำไม 90% ของโปรเจกต์ ML จึงล้มเหลว ?
แมชชีนเลิร์นนิงเฟรมเวิร์ก คือ คอลเลกชั่นคำสั่งพร้อมใช้-ไลบรารี, อินเทอร์เฟซ, รวมทั้งเครื่องมือต่างๆ ที่จะช่วยให้นักพัฒนาสร้างโมเดล ML ได้ง่ายและรวดเร็วขึ้น โดยไม่ต้องเรียนรู้-เจาะลึก “อัลกอริทึมที่ใช้งานอยู่เบื้องหลัง” มีวิธีใช้ที่ตรงไปตรงมา แค่เรียกใช้คำสั่งในเฟรมเวิร์กแล้วปรับแต่งให้เหมาะสม ทำให้กระบวนการพัฒนาแอปพลิเคชัน ML สำหรับองค์กรธุรกิจ รวดเร็ว และมีประสิทธิภาพมากขึ้น
ไม่มีเฟรมเวิร์กไหนที่ “ดีที่สุด” มีแต่..เฟรมเวิร์กไหน “เหมาะสมที่สุด” สำหรับงานแต่ละชนิด ใหญ่ เล็ก เลือกใช้ไม่เหมือนกัน
ที่น่าสังเกต โปรเจกต์ ML เกือบ 90% ล้มเหลวระหว่างทาง จบแค่งานต้นแบบทดลอง ไปไม่ถึงโปรดักชั่น..เปิดใช้จริงกับยูสเซอร์ (อ้างอิง https://www.qwak.com/post/what-does-it-take-to-deploy-ml-models-in-production)
ส่วนหนึ่งของความล้มเหลวไปไม่ถึงดวงดาว..โปรดักชั่น นอกจากเรื่องงบหมด-อธิบายประโยชน์และความคืบหน้าของโปรเจกต์ไม่ได้ ยังเกิดจากการที่นักพัฒนาถอดใจกับงานวนลูปซ้ำ(จำเจ) และงานจุกจิกงานบริหารหลังโปรดักชั่น ซึ่งมักจะเกิดขึ้นเนื่องจากการเลือกเฟรมเวิร์กที่มีข้อจำกัด ไม่ลดงานหลังโปรดักชั่น และไม่เป็น end-to-end solutions
1
ปัจจุบันมี ML เฟรมเวิร์กมากกว่า 70 ชนิด แต่ละเฟรมเวิร์กมีจุดแข็งจุดอ่อนไม่เหมือนกัน บางเฟรมเวิร์กดูทันสมัยทันกระแสเพราะมีบริษัทไอทีระดับโลกใช้ แต่อาจจะเหมาะกับงานวิจัยหรือทำต้นแบบ มากกว่างานธุรกิจองค์กร ซึ่งต้องการความรวดเร็วในการพัฒนาแบบ end-to-end ตั้งแต่จุดเริ่มต้นพัฒนาไปสู่การปรับใช้ (deployment) รวมทั้งต้องคำนึงถึงเรื่องต้นทุน ผลกำไร การปฏิบัติตามกฎหมาย และประสบการณ์ยูสเซอร์ มากกว่าแค่..ค่าความแม่นยำเปอร์เซนต์สูงๆ ในการคาดคะเนของโมเดล ML
1
งานองค์กรส่วนใหญ่ยังต้องการ “ชุดเครื่องมือหลังโปรดักชั่น” ด้วย เพื่อทำ log, monitor ได้ง่าย ช่วยเฝ้าติดตามโมเดลที่เริ่มเสื่อม ล้าสมัย ไม่สอดคล้องกับข้อมูลใหม่เนื่องจากบริบทเปลี่ยนไป (data distribution shift) รวมทั้งช่วยลดงานเทรนโมเดลซ้ำและย้ำประสิทธิภาพด้วยการทำ hyperparameter tuning และ testing ได้ง่าย
บางครั้งยังต้องการคอมไพล์และออปติไมซ์เส้นทางการประมวลผล (computational graph) สำหรับแต่ละดีไวซ์ปลายทาง...ซึ่งมีจำนวน CPU/GPU/TPU ไม่เหมือนกัน เพื่อเร่งความเร็วโมเดล โดยการทำงานขนานและกระจายงานระหว่างคอร์ของหน่วยประมวลผลได้ง่าย ซึ่งบางเฟรมเวิร์กอาจจะสนับสนุนแบบ “dynamic” computational graph บางเฟรมเวิร์กอาจจะเป็นแค่ static เป็นต้น
อย่างไรก็ตาม บางโจทย์งานหรือบางโปรเจกต์ที่เป็นงานเล็กแอปพลิเคชันไม่ซับซ้อน ก็ไม่จำเป็นต้องขี่ช้างจับตั๊กแตนโดยใช้เฟรมเวิร์กขนาดใหญ่ เพราะนั่นจะเป็นภาระมากกว่าโอกาส ทำให้เสียเวลาและสิ้นเปลืองโดยไม่จำเป็น เป็นต้น
เฟรมเวิร์ก “ที่เหมาะสม” นอกจากจะต้องตอบโจทย์ธุรกิจและยูสเซอร์ได้ดีแล้ว ยังต้องตอบโจทย์เรื่องการสเกลอัพ ขยายขีดความสามารถได้ตามความต้องการ รวมทั้งต้องพิจารณาเงื่อนไขความต้องการของทุกฝ่ายที่เกี่ยวข้อง เช่น ความต้องการของฝ่ายขาย ฝ่ายการตลาด ผู้บริหาร ฯลฯ
ซึ่งผู้บริหารไอทีและนักพัฒนา ML ต้องรู้ทันและเข้าใจข้อดีข้อด้อยของแต่ะเฟรมเวิร์กก่อน รวมทั้งต้องตีโจทย์งานให้ชัดรัดกุมก่อน จึงจะเลือกเฟรมเวิร์กได้ “เหมาะสม” (แนะอ่านเทคนิค framing ML problem ในหนังสือ Designing ML Systems ของ O’Reilly ซึ่งมีฉบับภาษาไทยแล้ว)
สรุป Top 10 เฟรมเวิร์ก ML มาแรงปี 2023 นี้ รวบรวมจากกระทู้และบทความจัดอันดับเฟรมเวิร์กใน Kaggle, GitHub, Stack Overflow, และ Reddit โดยไม่นับรวมเฟรมเวิร์กชนิด Tool-Based Frameworks ซึ่งเน้นสร้างโมเดล ML แบบไม่ต้องเขียนโค้ดมาก เช่น MATLAB, SAS, IBM-SPSS โดย 10 อันดับเฟรมเวิร์กมาแรง มีดังนี้
โฆษณา