[ADPT.news] Meta ปล่อย Open Source AI “Massively Multilingual Speech” Meta ปล่อย Open Source AI “Massively Multilingual Speech” รู้จำเสียงได้มากกว่า 4,000 ภาษาพูด Text-To-Speech ได้กว่า 1,100 ภาษา

สำรวจ
ลงทุน
คำถาม

มีบัญชีอยู่แล้ว?หรือ

•

26 พ.ค. 2023 เวลา 07:30 • วิทยาศาสตร์ & เทคโนโลยี

Meta ปล่อย Open Source AI “Massively Multilingual Speech”

Meta ปล่อย Open Source AI “Massively Multilingual Speech” รู้จำเสียงได้มากกว่า 4,000 ภาษาพูด Text-To-Speech ได้กว่า 1,100 ภาษา

โครงการ Massively Multilingual Speech (MMS) เป็นโครงการที่ Meta ได้สร้างโมเดลภาษาขึ้นมาใหม่ที่ไม่ใช่แนวโคลน ChatGPT มา แต่เป็นโมเดลรู้จำเสียงหรือสังเคราะห์เสียง ที่สามารถรู้จำเสียงพูด (Speech-To-Text) ได้มากกว่า 4,000 ภาษาพูดทั่วโลก และสามารถสังเคราะห์เสียง (Text-To-Speech) ได้มากกว่า 1,100 ภาษา ซึ่ง Meta ยังได้ปล่อยออกมาเป็น Open Source อีกด้วย

โดย Meta เผยว่า MMS นี้จะช่วยอนุรักษ์รักษาความหลากหลายทางภาษาและสนับสนุนให้นักวิจัยสร้างรากฐานต่าง ๆ ขึ้นมา

ทั่วไปแล้ว การรู้จำเสียง (Speech Recognition) และการแปลงข้อความให้กลายเป็นเสียง (Text-To-Speech) นั้นมักจะจำเป็นต้องมีการฝึกฝน (Train) โมเดลด้วยข้อมูลเสียงพูดพร้อม Label ข้อความที่ถอดเสียงมาด้วยกันในปริมาณมหาศาล ระดับหลายพันชั่วโมงขึ้นไป เพื่อที่จะทำให้โมเดล Machine Learning นั้นสามารถคัดแยกและเข้าใจข้อมูลนั้นได้ถูกต้อง

อ่านต่อ>>>https://www.adpt.news/2023/05/25/metas-open-source-speech-ai-recognizes-over-4000-spoken-languages/

โฆษณา

ดาวน์โหลดแอปพลิเคชัน

Meta ปล่อย Open Source AI “Massively Multilingual Speech”

ดาวน์โหลดแอปพลิเคชัน