2024-01-26 02:23:10
เมื่อวันอังคารที่ผ่านมาตามเวลาไทย Google Research เปิดตัว Lumiere โมเดล AI ที่มีความสามรถในการสร้างวิดีโอจาก Prompt ข้อความและภาพต้นแบบซึ่งเป็นอีกหนึ่งโมเดล AI ที่ถูกพัฒนาโดย Google หลังจากการเปิดตัวของ Gemini ในช่วงปลายปีที่แล้ว
โมเดล AI นี้สามารถสร้างวิดีโอที่มีความสม่ำเสมอ ค่อนข้างลื่น และสมจริงในบางวิดีโอ ซึ่งทาง Google Research นั้นได้มีการนำตัวอย่างในการประมวลผลของโมเดลนี้ให้รับชม ซึ่งแสดงให้เห้นความสามารถของ AI ที่สามารถสรส้งภาพเคลื่อนไหวจาก Prompt ที่เป็นตัวหนังสือ และสร้างวิดีโอขึ้นมา ซึ่งสามารถสร้างได้หลายมุม อีกความสามารถคือการสร้างวิดีโอจากภาพ โดยกรอก Prompt ที่ต้องการ อีกหนึ่งความสามารถที่น่าสนใจคือการเจเนอเรชันวิดีโอจากภาพตัวอย่างอ้างอิงเพียง 1 ภาพ โดยวิดีโอที่ได้จะเป็นสไตลืเดียวกับภาพอ้างอิงและจะมีกสารเคลื่อนไหวตามควทเหมาะสมของสไลต์ภาพ
นอกจากความสามารถเบื้องต้นนี้แล้วยังสามารถสังเคราะห์วิดีโอที่แสดงการเคลื่อนไหวที่สมจริง หลากหลาย และสอดคล้องกัน ซึ่งเป็นความท้าทายที่สำคัญในการสังเคราะห์วิดีโอ ด้วยเหตุนี้ เราจึงแนะนำสถาปัตยกรรม U-Net ของ Space-Time ที่สร้างระยะเวลาชั่วคราวทั้งหมดของวิดีโอในครั้งเดียว ผ่านการผ่านครั้งเดียวในโมเดล ซึ่งตรงกันข้ามกับโมเดลวิดีโอที่มีอยู่ซึ่งสังเคราะห์คีย์เฟรมระยะไกลตามด้วยความละเอียดสูงพิเศษชั่วคราว เช่นการแก้ไขรูปภาพแบบข้อความที่มีจำหน่ายทั่วไปเพื่อการตัดต่อวิดีโอที่สอดคล้องกันได้ สร้างภาพเคลื่อนไหวให้กับเนื้อหาของภาพ การต่อเติมวิดีดอที่ขาดหาย และปรับองค์ประกอบภายในวีดีโอ
ซึ่งตอนนี้สถานะของโมเดล AI ตัวนี้ยังคงเป้นเพียงงงานวิจัยในช่วงแรกเพียงเท่านั้น ทางผู้พัฒนายังไม่พร้อมให้สามารถทดลองใช้งานได้จาดข้อจำกัดบางประการทำให้ต้องมีการ่ปรับปรุงแก้ไขก่อนมีการนำมาใช้งานจริงในอนาคต
2025-01-10 10:12:01
2024-06-10 03:19:31
2024-05-31 03:06:49
2024-05-28 03:09:25
บทความที่น่าสนใจอื่นๆยังมีอีกมากลองเลืือกดูจากด้านล่างนี้ได้นะครับ
2025-02-19 02:29:11
2023-10-20 09:48:57
2024-02-26 01:33:44
2023-12-12 04:56:33
2024-01-30 03:59:36
2024-08-06 03:24:55
2024-03-11 05:30:42
2025-01-30 05:25:36
2023-11-03 10:19:40