پژوهشگران چینی توانستهاند یک ابزار مبتنی بر هوش مصنوعی جدید به نام Vidu را توسعه دهند که به عنوان رقیب Sora، میتواند توضیحات متنی را به ویدئوهای کوتاه بسیار با کیفیت تبدیل کند.
Sora یکی از قدرتمندترین مدلهای هوش مصنوعی تبدیل متن به ویدئو است که توسط سازندگان ChatGPT یعنی شرکت OpenAI توسعه یافته است. این ابزار AI تنها با دریافت توضیحات متنی میتواند یک ویدئوی کوتاه بسیار با کیفیت در اختیار کاربر قرار دهد.
حالا مهندسان چینی اولین مدل بزرگ تبدیل متن به ویدئو در سطح Sora را معرفی کردهاند. این ابزار مبتنی بر هوش مصنوعی در انجمن 2024 Zhongguancun در پکم رونمایی شده و توانسته رقابت AI در سطح جهانی را تشدید کند.
با Vidu آشنا شوید؛ قدرتمند در ساخت ویدئوهای کوتاه
به گزارش Chinadaily، هوش مصنوعی مورد بحث Vidu نامگذاری شده و توسط مهندسان شرکت Shengshu Technology با همکاری پژوهشگران دانشگاه Tsinghua به واقعیت تبدیل شده میتواند ویدئوهای با کیفیت بالا و مدت زمان 16 ثانیه تولید کند. علاوه بر این، گفته شده که حداکثر رزولوشن برای خروجی ویدئو در حال حاضر 1080p است و کاربر تنها با یک کلیک میتواند به فایل نهایی دست یابد.
Vidu بر اساس یک معماری تبدیل بصری جامع یا Universal Vision Transformer (U-ViT) ساخته شده که دو مدل هوش مصنوعی تبدیل متن به ویدئو Diffusion و Transformer را با یکدیگر ترکیب میکند.
در همین رابطه بخوانید:
نکته جالب آن است که Vidu در مقایسه با Sora درک بهتری از المانها و عناصر چینی داشته و به همین دلیل میتواند مواردی مثل خرس پاندا یا اژدهای چینی را با کیفیت بیشتر و جزئیات دقیقتری ایجاد کرد.