21 มี.ค. เวลา 13:28 • วิทยาศาสตร์ & เทคโนโลยี

OpenAI เปิดตัวโมเดลแปลงเสียงใหม่

โดย
OpenAI ได้เปิดตัวโมเดลแปลงข้อความเป็นเสียง (text-to-speech) และแปลงเสียงเป็นข้อความ (speech-to-text) รุ่นใหม่ ซึ่งมีประสิทธิภาพ และ ความสามารถที่พัฒนาขึ้นอย่างมาก
  • ​แปลงข้อความเป็นเสียง
○ โมเดลใหม่ชื่อ gpt-4o-mini-tts
มีจุดเด่นที่สามารถกำหนดรูปแบบ และ โทนเสียงในการพูดได้หลากหลายมากขึ้น เช่น เสียงแบบนักวิทยาศาสตร์สติเฟื่อง หรือ เสียงแบบคุณครูที่อบอุ่น
○ นักพัฒนาสามารถทดลองใช้งาน และ ปรับแต่งรูปแบบเสียงได้
  • ​แปลงเสียงเป็นข้อความ
○ โมเดลใหม่ชื่อ gpt-4o-transcribe และ gpt-4o-mini-transcribe
จะเข้ามาแทนที่โมเดล Whisper รุ่นเดิม
○ โมเดลใหม่ถูกฝึกฝนด้วยข้อมูลเสียงคุณภาพสูง ทำให้สามารถจับเสียงพูดได้หลากหลายสำเนียงมากขึ้น และ มีความผิดพลาดน้อยลง โดยเฉพาะกับคำที่ไม่รู้จัก
○ OpenAI ได้แสดงผลการทดสอบที่น่าสนใจ โดยโมเดล gpt-4o-transcribe มีอัตราความผิดพลาดในการถอดเสียงลดลงอย่างมากในหลายภาษา รวมถึงภาษาไทย จากเดิม 12% ลดลงเหลือ 5%
✏️ Shoper Gamer
  • ​สำหรับคนที่สนใจ 👇
Credit :
👇
  • ​https://openai.com/index/introducing-our-next-generation-audio-models/
  • ​https://www.blognone.com/node/145395
โฆษณา