9 ก.พ. 2024 เวลา 11:15 • ไอที & แก็ดเจ็ต

Apple เปิดตัว “MGIE” โมเดล AI ปรับแต่งภาพได้ด้วยภาษาธรรมชาติ

อีกหนึ่งนวัตกรรมอันน่าทึ่งจาก Apple คือโมเดล AI ล่าสุดที่ Apple ปล่อยออกมา Open Source บน Hugging Face แล้วในชื่อ “MGIE” โมเดล AI ที่สามารถแก้ไขภาพได้ด้วยคำสั่งที่เป็นภาษาธรรมชาติได้เลย
โดย MGIE ย่อมาจาก MLLM – Guided Image Editing ที่เป็นการใช้ประโยชน์จากโมเดลภาษาขนาดใหญ่หลากหลายรูปแบบ (Multimodal Large Language Models หรือ MLLMs) ที่สามารถแปลคำสั่งของผู้ใช้จากภาษาธรรมชาติแล้วดำเนินการปรับแต่งภาพได้ในระดับพิกเซล ซึ่ง MGIE นี้สามารถจัดการแก้ไขภาพได้ในหลากหลายมุมมอง อย่างเช่น การปรับแต่งแบบสไตล์ Photoshop หรือว่าการปรับแต่งทั้งภาพ หรือว่าปรับแค่เฉพาะที่ เป็นต้น
โมเดล MGIE นี้คือผลลัพธ์ความร่วมมือระหว่าง Apple กับนักวิจัยจาก University of California, Santa Barbara ซึ่งโมเดลนั้นได้ถูกนำเสนอในงานวิจัยที่ได้รับการตีพิมพ์ที่ International Conference on Learning Representations (ICLR) 2024 เป็นที่เรียบร้อยแล้ว
โฆษณา