الصين تكشف عن تطبيق جديد يحول النص إلى فيديو

كشفت شركة Kuaishou Technology الصينية المعروفة كمنصة للفيديوهات القصيرة، عن تطبيق ذكاء اصطناعي جديد لتحويل النص إلى فيديو المسمى Kling.
وعلى عكس Sora، يبدو أن Kling أصبح متاحًا بالفعل للمستخدمين من خلال قائمة الانتظار.
ويستخدم Kling تقنية مشابهة لـ Sora ويمكنه إنتاج مقاطع فيديو عالية الوضوح بدقة 1080 بكسل يمكن أن تستمر لمدة تصل إلى دقيقتين.
ويمكن للنموذج إنشاء حركات واقعية واسعة النطاق تحاكي بشكل أساسي خصائص العالم المادي. ويقال إن Kling يعتمد على بنية Diffusion Transformer ويستطيع ترجمة المطالبات النصية إلى صور وفيديوهات حية.
ويستخدم نموذج Kling عملية إعادة بناء الوجه والجسم ثلاثية الأبعاد المتقدمة المدعومة بتقنية 3D VAE الخاصة بالشركة، مما يتيح للمستخدمين إنشاء مقاطع فيديو بنسب عرض إلى ارتفاع مختلفة.
وأصدرت الشركة مقطعا تجريبيًا يعرض قدرة Kling على إنشاء مقطع فيديو تصل مدته إلى دقيقتين بجودة 30 إطارًا في الثانية.



