30 พ.ย. เวลา 04:12 • วิทยาศาสตร์ & เทคโนโลยี
ประเทศไทย

SCB 10X เปิดตัวโมเดล AI Typhoon Isan ถอดเสียงภาษาอีสานเฉพาะทาง

โดย
SCB 10X ได้เปิดตัวโปรเจกต์ Typhoon Isan ซึ่งเป็นชุดโมเดล AI ที่ออกแบบมาเพื่อประมวลผลภาษาอีสานโดยเฉพาะ โดยเริ่มจากโมเดลถอดเสียงพูดเป็นตัวอักษร (ASR) เพื่อแก้ปัญหาการรับรู้ภาษาถิ่นของไทยที่ระบบปัจจุบันทำได้ไม่ดี
  • ​รายละเอียดโครงการ Typhoon Isan
1) โมเดลหลัก
- Typhoon Isan ASR โมเดลถอดเสียงพูดภาษาอีสานเป็นข้อความ
- Typhoon Isan TTS โมเดลแปลงข้อความเป็นเสียงพูดภาษาอีสาน (กำลังพัฒนา)
2) ชุดข้อมูลเปิด (Open Data)
- Isan Speech Transcription Convention : แนวทางการถอดเสียงเป็นข้อความ
- Isan Spelling Standard : มาตรการการสะกดคำภาษาอีสาน
- Isan Speech Corpus : ชุดข้อมูลเสียงพูดจากหลายจังหวัด
- Isan Phonetic Dictionary : พจนานุกรมคำอ่าน และ การออกเสียง
1
  • ​ความสำคัญ
- ภาษาอีสานมีผู้ใช้ 20 ล้านคน (1/3 ของประชากรไทย)
- ข้อมูลภาษาถิ่นไทยในรูปแบบดิจิทัลมีน้อย
- โมเดล AI ทั่วไปถอดเสียงภาษาถิ่นผิดเพี้ยน
  • ​ประโยชน์ที่คาดการณ์
- สร้างพื้นฐานข้อมูลภาษาถิ่นไทยในโลกดิจิทัล
- พัฒนาบริการ AI ที่เข้าใจความหลากหลายทางภาษา
- ส่งเสริมการอนุรักษ์ภาษาถิ่นผ่านเทคโนโลยี
✏️ Shoper Gamer
Credit :
👇
  • ​https://www.blognone.com/node/149053
  • ​https://youtu.be/oWatesCiTjA?si=jyFuJA_lP6PSCqjR
โฆษณา