Google компаниясы жасанды интеллект көмегімен контент жасау бағытында тағы бір үлкен қадам жасады. Енді Gemini Advanced пайдаланушылары жай ғана мәтіндік сипаттама арқылы сапалы қысқаметражды видеолар жасай алады. Бұл мүмкіндік Google-дың ең жаңа видео генерациялау моделі — Veo 2 арқылы жүзеге асады.
Veo 2 моделі арқылы қолданушылар 720p сапада, ұзақтығы 8 секунд болатын MP4 форматындағы видеоларды жасауға мүмкіндік алады. Ол үшін арнайы бағдарламалау білімі қажет емес — тек сахнаны егжей-тегжейлі сипаттау жеткілікті. Неғұрлым нақты сипаттама жазылса, соғұрлым нәтиже сапалырақ болады. Мысалы, «күн батып жатқан уақытта жағажайда жүгіріп келе жатқан бала» деп жазсаңыз, AI осы көріністі кадрлық тұрғыдан визуализациялайды.
Бұл жаңа функция Gemini жүйесінің ішіндегі «model» мәзірінен таңдалады және қазіргі кезде кейбір Advanced (тәжірибелі) қолданушыларға кезең-кезеңімен қосылып жатыр. Жақында барлық пайдаланушыға қолжетімді болады деп күтілуде. Бұл — бұрын тек кинематография немесе анимация саласының мамандары қол жеткізе алатын мүмкіндікті қарапайым қолданушыларға беру деген сөз.
Veo 2 моделі арқылы жасалған видеолардың басты артықшылықтары мыналар:
Бұл технологияның тағы бір артықшылығы — оның шығармашылық процесті демокрациялау (democratization) яғни «баршаға қолжетімді ету» бағытымен үйлесуі. Бұрын толық бір шығармашылық топты талап ететін анимациялық сцена немесе видеоролик енді бір адамның ноутбук арқылы жасай алатын дүниесіне айналып отыр.
Сонымен қатар Google желтоқсан айында таныстырған Whisk атты тәжірибелік платформасына да жаңа мүмкіндік қосты. Енді Whisk Animate функциясы арқылы жай суретті 8 секундтық анимацияланған видеоға айналдыруға болады. Бұл құралды labs.google/whisk мекенжайынан пайдалануға болады. Бұл — әсіресе иллюстрация, комикс, білім беру және жарнама салаларында үлкен қызығушылық туғызуы мүмкін.
Google жасанды интеллектімен жасалған барлық видеоларға SynthID деп аталатын арнайы сандық таңба енгізеді. Бұл таңба видеодағы әрбір кадрға ендіріліп, оның жасанды интеллектпен жасалғанын айқын көрсетіп тұрады. Бұл — жалған ақпарат, deepfake және манипуляциялық контенттермен күресудің бір тетігі.
Сонымен қатар компания қауіпсіздікке айрықша көңіл бөліп отыр. Google бұл модельдерге арналған келесі шараларды қолға алған:
Veo 2 және Whisk Animate функциялары бүгінде Gemini Advanced қолданушылары үшін іске қосылған. Жүйе барлық Gemini-дың қолдайтын тілдерінде жұмыс істейді. Бұл мүмкіндіктер Google One AI Premium жазылымы аясында ұсынылады. Жақында бұл функцияларды кеңейтілген платформа — YouTube Shorts пен Google Ads секілді құралдарға интеграциялау жоспары бар.
Мәтіннен кино стиліндегі видео жасау мүмкіндігі — жасанды интеллектінің медиа өндірісіндегі мүмкіндіктерін жаңа деңгейге көтеріп отыр. Қолданушылар енді өз идеяларын бейнемен жеткізудің мүлде жаңа жолына ие болды. Бұл тек шығармашылық емес, сонымен қатар білім беру, жарнама, әлеуметтік медиа, контент-маркетинг, тіпті ойын жасау саласында да жаңа дәуірдің басы болуы мүмкін.
Аршат Ораз