เมื่อวาน เวลา 03:35 • วิทยาศาสตร์ & เทคโนโลยี

Microsoft AI เปิดตัวโมเดล MAI ชุดใหม่ 3 ตัว เน้นเสียงภาพข้อความ ราคาประหยัด

โดย
Microsoft AI เปิดตัวโมเดลตระกูล MAI เพิ่มเติมอีก 3 ตัวครอบคลุมงานด้านการถอดเสียง การสังเคราะห์เสียง และ การสร้างภาพ โดยรองรับภาษาไทยในโมเดลถอดเสียง
  • ​1) MAI-Transcribe-1 (Speech-to-Text)
- หน้าที่ : ถอดเสียงพูดเป็นข้อความ
- รองรับ: 25 ภาษายอดนิยมรวมภาษาไทย
- ประสิทธิภาพ : คะแนนเบนช์มาร์คดีกว่า GPT-Transcribe และ Gemini 3.1 Flash
⚪ ความเร็ว : ทำงานรวดเร็ว
⚪ ราคา : เริ่มต้น $0.36/ชั่วโมง
  • ​2) MAI-Voice-1 (Text-to-Speech)
- หน้าที่ : สร้างเสียงพูดจากข้อความ
- คุณภาพ : เสียงเป็นธรรมชาติ
- ประสิทธิภาพ : สร้างเสียงยาว 1 นาทีด้วย GPU ตัวเดียวภายในไม่กี่วินาที
- ราคา : เริ่มต้น $22/ข้อความ 1 ล้านตัวอักษร
- สถานะ : เปิดให้ใช้งานบน Microsoft Foundry
  • ​3. MAI-Image-2 (Image Generation)
- หน้าที่ : สร้างรูปภาพ
- การใช้งานจริง : เริ่มใช้กับ Bing และ PowerPoint
- ราคา
⚪ อินพุต: $5/1M tokens
⚪ เอาต์พุต: $33/1M tokens
✏️ Shoper Gamer
Credit :
👇
  • ​https://www.blognone.com/node/150178
  • ​https://x.com/satyanadella/status/2039711802259542302
  • ​https://x.com/MicrosoftAI/status/2039750461167976879
โฆษณา