[Shoper Gamer] OpenAI เปิดตัวโมเดลแปลงเสียงใหม่ โดย

สำรวจ
ลงทุน
คำถาม

มีบัญชีอยู่แล้ว?หรือ

•

21 มี.ค. 2025 เวลา 13:28 • วิทยาศาสตร์ & เทคโนโลยี

OpenAI เปิดตัวโมเดลแปลงเสียงใหม่

โดย

OpenAI ได้เปิดตัวโมเดลแปลงข้อความเป็นเสียง (text-to-speech) และแปลงเสียงเป็นข้อความ (speech-to-text) รุ่นใหม่ ซึ่งมีประสิทธิภาพ และ ความสามารถที่พัฒนาขึ้นอย่างมาก

★
แปลงข้อความเป็นเสียง

○ โมเดลใหม่ชื่อ gpt-4o-mini-tts

มีจุดเด่นที่สามารถกำหนดรูปแบบ และ โทนเสียงในการพูดได้หลากหลายมากขึ้น เช่น เสียงแบบนักวิทยาศาสตร์สติเฟื่อง หรือ เสียงแบบคุณครูที่อบอุ่น

○ นักพัฒนาสามารถทดลองใช้งาน และ ปรับแต่งรูปแบบเสียงได้

★
แปลงเสียงเป็นข้อความ

○ โมเดลใหม่ชื่อ gpt-4o-transcribe และ gpt-4o-mini-transcribe

จะเข้ามาแทนที่โมเดล Whisper รุ่นเดิม

○ โมเดลใหม่ถูกฝึกฝนด้วยข้อมูลเสียงคุณภาพสูง ทำให้สามารถจับเสียงพูดได้หลากหลายสำเนียงมากขึ้น และ มีความผิดพลาดน้อยลง โดยเฉพาะกับคำที่ไม่รู้จัก

○ OpenAI ได้แสดงผลการทดสอบที่น่าสนใจ โดยโมเดล gpt-4o-transcribe มีอัตราความผิดพลาดในการถอดเสียงลดลงอย่างมากในหลายภาษา รวมถึงภาษาไทย จากเดิม 12% ลดลงเหลือ 5%

✏️ Shoper Gamer

>> https://linkbio.co/ShoperGamer

✓
สำหรับคนที่สนใจ 👇

เรียนรู้เพิ่มเติม

openai.fm

OpenAI.fm

An interactive demo for developers to try the new text-to-speech model in the OpenAI API

Credit :

👇

●
https://openai.com/index/introducing-our-next-generation-audio-models/

●
https://www.blognone.com/node/145395

โฆษณา

ดาวน์โหลดแอปพลิเคชัน

OpenAI เปิดตัวโมเดลแปลงเสียงใหม่

ดาวน์โหลดแอปพลิเคชัน