2024-01-26 02:23:10
เมื่อวันอังคารที่ผ่านมาตามเวลาไทย Google Research เปิดตัว Lumiere โมเดล AI ที่มีความสามรถในการสร้างวิดีโอจาก Prompt ข้อความและภาพต้นแบบซึ่งเป็นอีกหนึ่งโมเดล AI ที่ถูกพัฒนาโดย Google หลังจากการเปิดตัวของ Gemini ในช่วงปลายปีที่แล้ว
โมเดล AI นี้สามารถสร้างวิดีโอที่มีความสม่ำเสมอ ค่อนข้างลื่น และสมจริงในบางวิดีโอ ซึ่งทาง Google Research นั้นได้มีการนำตัวอย่างในการประมวลผลของโมเดลนี้ให้รับชม ซึ่งแสดงให้เห้นความสามารถของ AI ที่สามารถสรส้งภาพเคลื่อนไหวจาก Prompt ที่เป็นตัวหนังสือ และสร้างวิดีโอขึ้นมา ซึ่งสามารถสร้างได้หลายมุม อีกความสามารถคือการสร้างวิดีโอจากภาพ โดยกรอก Prompt ที่ต้องการ อีกหนึ่งความสามารถที่น่าสนใจคือการเจเนอเรชันวิดีโอจากภาพตัวอย่างอ้างอิงเพียง 1 ภาพ โดยวิดีโอที่ได้จะเป็นสไตลืเดียวกับภาพอ้างอิงและจะมีกสารเคลื่อนไหวตามควทเหมาะสมของสไลต์ภาพ
นอกจากความสามารถเบื้องต้นนี้แล้วยังสามารถสังเคราะห์วิดีโอที่แสดงการเคลื่อนไหวที่สมจริง หลากหลาย และสอดคล้องกัน ซึ่งเป็นความท้าทายที่สำคัญในการสังเคราะห์วิดีโอ ด้วยเหตุนี้ เราจึงแนะนำสถาปัตยกรรม U-Net ของ Space-Time ที่สร้างระยะเวลาชั่วคราวทั้งหมดของวิดีโอในครั้งเดียว ผ่านการผ่านครั้งเดียวในโมเดล ซึ่งตรงกันข้ามกับโมเดลวิดีโอที่มีอยู่ซึ่งสังเคราะห์คีย์เฟรมระยะไกลตามด้วยความละเอียดสูงพิเศษชั่วคราว เช่นการแก้ไขรูปภาพแบบข้อความที่มีจำหน่ายทั่วไปเพื่อการตัดต่อวิดีโอที่สอดคล้องกันได้ สร้างภาพเคลื่อนไหวให้กับเนื้อหาของภาพ การต่อเติมวิดีดอที่ขาดหาย และปรับองค์ประกอบภายในวีดีโอ
ซึ่งตอนนี้สถานะของโมเดล AI ตัวนี้ยังคงเป้นเพียงงงานวิจัยในช่วงแรกเพียงเท่านั้น ทางผู้พัฒนายังไม่พร้อมให้สามารถทดลองใช้งานได้จาดข้อจำกัดบางประการทำให้ต้องมีการ่ปรับปรุงแก้ไขก่อนมีการนำมาใช้งานจริงในอนาคต
2025-01-10 10:12:01
2024-06-10 03:19:31
2024-05-31 03:06:49
2024-05-28 03:09:25
บทความที่น่าสนใจอื่นๆยังมีอีกมากลองเลืือกดูจากด้านล่างนี้ได้นะครับ
2023-10-09 03:59:28
2023-09-12 01:36:07
2024-10-10 11:35:58
2024-03-22 03:13:48
2024-05-06 05:14:24
2025-03-10 01:39:46
2024-04-12 09:31:35
2023-11-07 10:15:06
2024-12-04 10:28:02