14 ธ.ค. 2023 เวลา 13:00 • วิทยาศาสตร์ & เทคโนโลยี

เจาะลึก Multimodal Models AI คืออะไร? มีศักยภาพอย่างไรบ้าง?

หนึ่งในเทรนด์ไอทีที่ถูกพูดถึงอย่างมากในปัจจุบัน คงหนีไม่พ้นแนวทางการพัฒนาของ AI โดยเฉพาะ Multimodal Models ที่จะกลายเป็นอนาคตของ AI ในอีกไม่กี่ปีที่ข้างหน้า
ดังนั้น G-Abel ในฐานะ Tech Enabler ผู้นำเทรนด์เทคโนโลยีของไทย จึงให้ความสำคัญกับโมเดลใหม่นี้ และอยากชวนทุกองค์กรมารู้จักเพื่อนำไปเป็นไอเดียในการนำ AI เข้ามาพัฒนาและประยุกต์ใช้ในองค์กรของคุณต่อไปกันครับ
โดย Multimodal Models คือ โมเดล AI ที่เราจะคุ้นตากันมากขึ้นในช่วงปีหน้า มีความแตกต่างจาก Unimodal ที่ฝึก AI โดยข้อมูลชนิดเดียว แต่โมเดลใหม่จะใช้ตัวแปลที่หลากหลายในการฝึก ไม่ว่าจะเป็นภาพ เสียง ตัวอักษร มาอยู่ในโมเดลเดียว ทำให้ AI ประมวลผลได้หลากหลาย เช่น การใส่ Output เสียงและภาพเข้าไป แล้วระบบจะตีความออกมาเป็นตัวอักษรและภาพได้ เป็นต้น
สามารถประยุกต์ใช้จริงได้หลายสายงาน เช่น การรับข้อมูล Complaint จากลูกค้าทั้งในรูปแบบเสียง ตัวอักษร รูปภาพ ซึ่งช่วยลดโหลดงานในฝ่ายบริการลูกค้าได้จำนวนมาก อีกทั้ง AI ยังสามารถนำเสนอโซลูชันใหม่ ๆ เพิ่มเติมได้อีกด้วย นอกจากนี้ Multimodal ยังเพิ่มเสถียรภาพให้กับระบบ AI ทั้งทางด้านประสิทธิภาพในการประมวลผล ไปจนถึงเพิ่มความยืดหยุ่นในการต่อยอดมากขึ้น
แต่ทุกอย่างย่อมมีดาบสองคม หากไม่ควบคุมให้ดี ก็อาจเพิ่มความเสี่ยงให้กับองค์กรได้เช่นกัน ไม่ว่าจะเป็นด้านความปลอดภัยทางไซเบอร์ การรุกล้ำฟังก์ชันการทำงานของคน หรือทำให้ข้อมูลบิดเบือนได้ ไปจนถึงความซับซ้อนในการพัฒนาซึ่งส่งผลให้ใช้งานจริงยุ่งยากกว่า AI ทั่วไป
อย่างไรก็ตาม Multimodal Models ยังเป็นอีกหนึ่งในทิศทางการพัฒนาของ AI ที่จับต้องได้มากที่สุด และองค์กรทั้งหลายควรจับตา-เฝ้ามอง การพัฒนาพื้นฐานของ AI รูปแบบนี้ไว้อย่างใกล้ชิดครับ
แล้วคุณล่ะ มีความคิดเห็นอย่างไร? คิดว่าการมาของ Multimodal Models AI จะพลิกวงการ AI แค่ไหน? สำหรับใครที่สนใจเทรนด์เทคโนโลยีแนวนี้ สามารถกดติดตาม G-Able เอาไว้ แล้วเราจะพาคุณไปเจาะลึกกับ Industry Insights กันครับ
โฆษณา