Sora გარდაუვალია: როგორი შეიძლება იყოს ვიდეოტექნოლოგიების მომავალი

OpenAI-მა, რომელიც მსოფლიოში ცნობილია თავისი ჩატბოტით ChatGPT, 15 თებერვალს წარმოადგინა ახალი გენერაციული ხელოვნური ინტელექტის მოდელი სახელწოდებით Sora. ის საშუალებას გაძლევთ, ვიდეოები ტექსტის საშუალებით ააწყოთ. ასეთი ხელსაწყოს გამოჩენამ კიდევ უფრო მეტი შეშფოთება გამოიწვია “დიფ ფეიქების“ განვითარებასთან დაკავშირებით.

რატომ არის სორა არა Sora, არამედ გიგანტური ნახტომი?

დაახლოებით ერთი თვის წინ Google-მა გამოაცხადა ნეიროქსელ Lumiere-ის გაშვების შესახებ, რომელსაც შეუძლია 5-წამიანი ვიდეოების გენერირება 512x512 პიქსელის გარჩევადობით. ახლა კი OpenAI-მ გააკეთა ერთი შეხედვით შეუძლებელი - შექმნა გენერაციული მოდელი Sora რეალისტური ერთწუთიანი ვიდეოებით.

OpenAI ავარჯიშებდა მოდელს ორიგინალური გარჩევადობის ვიდეოებზე, როგორიცაა FullHD (1920x1080) და არა მოკლე ვიდეოებზე 512x512 გარჩევადობით, როგორც ეს ჩვეულებრივ იყო. ამ მიზეზით, Sora-ს შეუძლია შექმნას როგორც ვერტიკალური, ისე ჰორიზონტალური ვიდეოები.

OpenAI-ის წარმატება ისიც არის, რომ მათ შეიმუშავეს ნეიროქსელი DALL-E 3-ის მსგავსი მიდგომის საფუძველზე. ისინი ჯერ მოკლე ვიდეოს ცალკე მოდელს ამზადებენ ზუსტი აღწერილობის დასაწერად. შემდეგ, GPT-4V (ChatGPT ფუნქცია, რომლითაც ნერვული ქსელი ამოიცნობს სურათებს და ითვალისწინებს მათ რეაგირებისას. - Forbes) გამოყენებით, ისინი ქმნიან დეტალურ აღწერილობებს, იღებენ დიდი რაოდენობით მაღალი ხარისხის და ცვლად ვიდეო აღწერილობას Sora-ს ვარჯიშისთვის.

გარდა ამისა, Sora-ს არქიტექტურა არა მხოლოდ ცალკეული ვიდეო ფრაგმენტების გენერირების საშუალებას გაძლევთ, არამედ შეგიძლიათ მათი გაერთიანება ერთ მთლიანობაში. ეს ხსნის გზას გრძელი, თანმიმდევრული ვიდეოების შექმნისა, რომლებიც ადრე მიუწვდომელი იყო ხელოვნური ინტელექტის თაობისთვის.

რა თქმა უნდა, არსებობს მისი ბოროტად გამოყენების რისკები. მაგრამ ჩვენ ვხედავთ, რომ OpenAI-ს ესმის ეს და დგამს ნაბიჯებს პოტენციური რისკებისგან თავის დასაცავად. კომპანიის ვებსაიტზე არსებული ინფორმაციის მიხედვით, ისინი ავითარებენ ინსტრუმენტებს ყალბი და აკრძალული შინაარსის იდენტიფიცირებისთვის.

წყარო: forbes.com

თეონა რამაზაშვილი