20 พ.ค. เวลา 13:49 • วิทยาศาสตร์ & เทคโนโลยี

Google เปิดตัว Gemini Omni (Flash) โมเดล Multimodal สร้าง-แก้ไขวิดีโอจากอินพุตทุกประเภท

โดย
Google ประกาศเปิดตัว Gemini Omni โมเดลปัญญาประดิษฐ์ยุคใหม่ ที่สามารถรับอินพุตทั้งข้อความ, ภาพ, เสียง, วิดีโอ และ สร้างเอาต์พุตได้ทุกรูปแบบ (ระยะแรกเน้นการสร้างวิดีโอก่อน)
  • ​ความสามารถด้านวิดีโอ
- เปลี่ยนบรรยากาศ/เวลาในวิดีโอ (ตาม prompt)
- ปรับมุมกล้อง, ควบคุมการเคลื่อนที่ของวัตถุตามกฎฟิสิกส์
- ผสมผสานหลายภาพให้เป็นวิดีโอเดียว
  • ​รุ่นแรก: Gemini Omni Flash
- ใช้งานผ่านแอป Gemini และ Google Flow
- ผู้ใช้ Google AI Plus, Pro, Ultra เข้าถึงได้ทันที
- ฟรีสำหรับครีเอเตอร์ YouTube : ภายในสัปดาห์นี้ เปิดให้ใช้ใน YouTube Shorts และ YouTube Create
- องค์กร และ API: จะตามมาในภายหลัง
  • ​ข้อจำกัด (ระยะแรก)
- ยังรองรับเฉพาะการสร้างวิดีโอ (ไม่ใช่มัลติเอาต์พุตครบทุกประเภท)
- Omni Flash อาจทำงานช้า หรือ ความละเอียดต่ำกว่า Omni Pro ที่จะเปิดตัวในอนาคต
✏️ Shoper Gamer
Credit :
👇
  • ​https://www.blognone.com/node/150613
โฆษณา