26 พ.ค. 2023 เวลา 07:30 • วิทยาศาสตร์ & เทคโนโลยี

Meta ปล่อย Open Source AI “Massively Multilingual Speech”

Meta ปล่อย Open Source AI “Massively Multilingual Speech” รู้จำเสียงได้มากกว่า 4,000 ภาษาพูด Text-To-Speech ได้กว่า 1,100 ภาษา
โครงการ Massively Multilingual Speech (MMS) เป็นโครงการที่ Meta ได้สร้างโมเดลภาษาขึ้นมาใหม่ที่ไม่ใช่แนวโคลน ChatGPT มา แต่เป็นโมเดลรู้จำเสียงหรือสังเคราะห์เสียง ที่สามารถรู้จำเสียงพูด (Speech-To-Text) ได้มากกว่า 4,000 ภาษาพูดทั่วโลก และสามารถสังเคราะห์เสียง (Text-To-Speech) ได้มากกว่า 1,100 ภาษา ซึ่ง Meta ยังได้ปล่อยออกมาเป็น Open Source อีกด้วย
1
โดย Meta เผยว่า MMS นี้จะช่วยอนุรักษ์รักษาความหลากหลายทางภาษาและสนับสนุนให้นักวิจัยสร้างรากฐานต่าง ๆ ขึ้นมา
ทั่วไปแล้ว การรู้จำเสียง (Speech Recognition) และการแปลงข้อความให้กลายเป็นเสียง (Text-To-Speech) นั้นมักจะจำเป็นต้องมีการฝึกฝน (Train) โมเดลด้วยข้อมูลเสียงพูดพร้อม Label ข้อความที่ถอดเสียงมาด้วยกันในปริมาณมหาศาล ระดับหลายพันชั่วโมงขึ้นไป เพื่อที่จะทำให้โมเดล Machine Learning นั้นสามารถคัดแยกและเข้าใจข้อมูลนั้นได้ถูกต้อง
โฆษณา