Blockdit Logo
Blockdit Logo (Mobile)
สำรวจ
ลงทุน
คำถาม
เข้าสู่ระบบ
มีบัญชีอยู่แล้ว?
เข้าสู่ระบบ
หรือ
ลงทะเบียน
The Sound of Thoughts
•
ติดตาม
22 ธ.ค. 2022 เวลา 12:00 • วิทยาศาสตร์ & เทคโนโลยี
OpenAI กำลังพัฒนา “Point-E”
โปรแกรม AI สร้างโมเดลสามมิติ
อ้างอิงรูปภาพ https://github.com/openai/point-e
บริษัท OpenAI ผู้พัฒนา Chat GPT หรือ chatbot อัจฉริยะที่กำลังเป็นที่จับตามองในวงการ Tech ประกาศการพัฒนาล่าสุดของ Point-E โปรแกรมสร้างภาพ 3 มิติ ซึ่งมีลักษณะคล้าย Dall-E เพียงแต่ Point-E จะประมวลผลออกมาในรูปแบบของ 3D point clouds
แม้ว่า Point-E จะยังประมวลภาพออกมาได้ไม่คมชัดนัก แต่ความเร็วในการประมวลผลนั้นเร็วมากเมื่อเทียบกับระบบคอมพิวเตอร์ ณ ปัจจุบัน อย่าง DreamFusion ของ Google ที่ต้องใช้ GPU มากกว่าหนึ่งและใช้เวลากว่าชั่วโมงในการประมวลผล ในขณะที่ Point-E ของ OpenAI ใช้แค่ GPU การ์ดเดียวและใช้เวลาเพียงหนึ่งหรือสองนาที
Alex Nichol หัวหน้าทีมวิจัยจาก OpenAI ได้เขียนอธิบายในรายงานถึงหลักการสร้างวัตถุ 3 มิติจากการป้อนคำอธิบาย (text prompts) ว่า เมื่อป้อนคำอธิบายแล้ว ทีมวิจัยจะใช้โมเดล text-to-image เพื่อแปลงคำให้กลายมาเป็นภาพ rendered ที่สร้างขึ้นเอง (synthetic view) แล้วจึงค่อยสร้างวัตถุสามมิติจากภาพ rendered นั้น ออกมาในรูปแบบของ 3D point clouds ในภายหลัง
ตัวอย่างเช่น หากเราป้อนคำว่า ‘หมา Corgi’ เข้าไปในโปรแกรม ทีมวิจัยจะใช้โมเดล text-to-image เวอร์ัชั่น GLIDE model แปลงคำว่า ‘หมา Corgi’ ออกมาเป็นรูป corgi ในแบบ synthetic rendered view จากนั้นจึงนำรูปหมาที่ rendered แล้ว แปลงมาเป็น corgi ฉบับ 3D RGB point clouds
วิธีการแปลงเป็นภาพสามมิติ อ้างอิงจาก https://arxiv.org/pdf/2212.08751.pdf
เป้าหมายของการทดลองครั้งนี้ คือ หาวิธีการแปลงเป็นโมเดลสามมิติที่ลดเวลาการประมวลผล จากเดิมที่มักใช้เวลาเป็นชั่วโมง ให้เหลือแค่หนึ่งหรือสองนาที ซึ่งวิธีแปลงภาพที่ได้กล่าวไปนั้นทำได้จริงภายในระยะเวลาที่ต้องการ
ทีมวิจัยให้ความเห็นต่อการวิจัยในอนาคตว่า ณ ตอนนี้วิธีแปลงภาพที่ใช้ในการทดลอง ยังต้องพึ่งภาพ render ที่สร้างขึ้น ในอนาคตอาจฝึกให้เครื่องประมวลผลสามารถยึดข้อมูลจากรูปภาพในโลกจริงได้ นอกจากนั้น อาจพัฒนาการแปลงภาพให้ได้ความละเอียดที่เหมาะสมต่อการนำไปพิมพ์โมเดลสามมิติ (3D printing)
ตัวอย่าง 3D point clouds โดย Point-E อ้างอิงจาก https://arxiv.org/pdf/2212.08751.pdf
การใช้ประโยชน์จากภาพ 3 มิติถูกนำไปใช้ในหลากหลายวงการ ตั้งแต่อุตสาหกรรมหนัง, วิดีโอเกมส์, เทคโนโลยี VR และ AR ไปจนถึงการใช้ 3D Printing ในหลาย ๆ อุตสาหกรรม เช่น แฟชั่น-เครื่องประดับ, ยานยนต์, คอมพิวเตอร์ ฯลฯ
หาก Point-E สามารถพัฒนาไปเป็นโปรแกรมที่สร้างโมเดลจำลองสามมิติได้อย่างสมบูรณ์ โดยเกิดขึ้นจากการป้อนคำเพียงแค่ไม่กี่คำ และยังประมวลผลได้ไว ณ วันนั้นคงสร้างความเปลี่ยนแปลงต่อโลกอย่างไม่น้อย
อ้างอิง
https://www.engadget.com/openai-releases-point-e-dall-e-3d-text-modeling-210007892.html?fbclid=IwAR17KRM5a6TfPBcd_NWqHHE08_5ecTffGXI7Huyn0MSFdsok5QKkwL7nW3Y
https://arxiv.org/pdf/2212.08751.pdf
https://github.com/openai/point-e
บันทึก
โฆษณา
ดาวน์โหลดแอปพลิเคชัน
© 2025 Blockdit
เกี่ยวกับ
ช่วยเหลือ
คำถามที่พบบ่อย
นโยบายการโฆษณาและบูสต์โพสต์
นโยบายความเป็นส่วนตัว
แนวทางการใช้แบรนด์ Blockdit
Blockdit เพื่อธุรกิจ
ไทย