Geçtiğimiz Şubat ayında OpenAI, basit metin komutlarından videoların tamamını oluşturabilen Sora adında güçlü bir yapay zeka oluşturucuyu tanıtmıştı. Bugün Sora betadan çıkıyor ve halka açılıyor
Aylık 20 ABD dolarından başlayan fiyatlarla ChatGPT aboneliğinin bir parçası olarak sunulan kullanıcılar, yalnızca bir metin isteminden 20 saniyeye kadar yüksek çözünürlüklü video oluşturabilecek. Ancak Sora’nın hem yetenekleri hem de kullanıcı deneyimi ChatGPT’nin sade sunumunun ötesindedir.
En önemlisi, küçük bir pilot test havuzu havuzu, gerçek insanları kurgusal sahnelere yerleştirmek için insanların fotoğraflarını yükleyebilecek (OpenAI’nin söylediği bir özellik, tüm kamuoyuna yayınlanabileceğini veya yayınlanamayacağını söylüyor).
Sora’nın ürün lideri Rohan Sahai, “Çağrı yapmadan önce bir süre test yapıyoruz” dedi.
İçerideki Sora tasarımı
Sora’nın uzaktan demosunda beni en çok şaşırtan şey, ilk arayüzün ne kadar net göründüğü ve UX’e genel yaklaşımın, ChatGPT’nin birkaç yıl önceki lansmanıyla karşılaştırıldığında ne kadar zengin olduğuydu. Şirket, güçlü, özelleştirilebilir bir yapay zeka iş akışı ile ortalama bir insanın anlayabileceği kadar basit bir şey arasında bir denge kuruyor.
Sora’nın sanatçı programları başkanı Suki Mansoor, “Yeni arayüzler eklemeliyiz” diyor.
Bilgi istemi kutusu, video oluşturmaya yönelik birkaç seçenekten biridir. Ayrıca kendi ilham medyanızı içe aktarabilir ve hatta kendi stilize estetiğinizi geliştirebilirsiniz. Arayüz sizi doğrudan Google Drive’dan gelebilecek bir dosya yönetim sistemine davet ediyor. Solda bir proje dizininiz ve sağda çalışma alanınız var
Listenin en başında, Sora topluluğunun en son çalışmalarını içeren ve Görsel Tasarım Deposu’nu hatırlatan metanetli bir ruh hali panosu olarak sunulan bir besleme yer alıyor. Mansoor, “Bunu, insanların Sora’yı daha etkili bir şekilde nasıl kullanacaklarını öğrenmelerine yardımcı olmak için bir sosyal medya akışından ziyade ilham ve eğitim olarak düşünüyorduk” diyor. Bu videolardan herhangi birine dokunduğunuzda yalnızca izlemekle kalmaz, aynı zamanda arkasındaki komutları ve yöntemleri de görebilir ve isterseniz o videoyu yeniden düzenleyebilirsiniz (AI TikTok’a benzer).
Ancak aslında kendi videolarınızı oluşturduğunuzda, daha büyük araç seti Adobe Premiere veya iMovie’ye benziyor. Bir video oluşturmaya başladığınız anda, Sora’nın sizin için yarattıklarını metin kartlarındaki bir storyboard üzerinde özetlediği zaman çizelgesi görünümüne geçebilirsiniz.
Sora nasıl çalışır?
Ekibe sahilde bir aksolotl inşa etme görevi verdim. Bu ilk storyboard’da bile, OpenAI’nin metin yönlendirmelerimi nasıl zenginleştirdiğini doğrulamak için izlemem gereken bir video var; yaratığı “etrafta sıçrayan yumuşak dalgalar” ile “kendine özgü tüylü solungaçları” olan pembe bir yaratık olarak tanımlıyor. Bir sonraki storyboard panelinde, ona herhangi bir çalışma yapmadığım için axolotl’un ne yaptığını öğrendim. Çırpınan solungaçlarıyla denize bakarak “biraz hareket ediyor”.
Yeniden yazmak için bu storyboard’lara geri dönebilirim. Veya çözünürlüğü değiştirmek için alttaki gezinme çubuğuna gidebilir veya kara film gibi kendi eğitimli eserimin stilistik filtresini ekleyebilirim. Bu videoların her birinin oluşturulması için ne kadar güç gerektiğini sorduğumda OpenAI “yorum yok” yanıtının eşdeğerini sunuyor.
Bulduğum aksolotlda çok fazla solungaç vardı ama bunun dışında inandırıcı bir doğal videoydu. Ekip daha sonra iki sahneyi bir araya getirmek, videoyu daha uzun hale getirmek veya kendi estetiğinize ilham verecek diğer klipleri örneklemek gibi diğer video zaman çizelgesi araçlarını gösterdi.
Bu yetenekler, geçtiğimiz yıl dünya çapındaki OpenAI yaratıcılarıyla kapalı beta olarak geliştirildi. Bu gruplardan biri Kanadalı bir müzik grubuydu. utangaç çocuklarBu da gerçekten etkili bir video sağlar son single’ları için“Aşkım”, iki makak maymununun arkadaşlık kurmak için el değmemiş bir yağmur ormanına atladığı sahne. . . Trajik ifşadan önce. Bu, bir yaban hayatı fotoğrafçısı olarak ömür boyu geçirebileceğiniz ve asla tanık olamayacağınız bir görüntü. Ancak Shy Kids, videoyu, ışık düzenlemesi ve renk düzeltme dışında Sora dışında herhangi bir VFX olmadan neredeyse iki haftada hazırladı.
Grup üyesi Walter Woodman, e-posta yoluyla şunları yazdı: “Bir sayfanın asla boş kalmamasını sağlamak harika. Bu, hızlı bir şekilde fikir üretmenize ve yinelemenize olanak tanıyor, bu da yaratıcı sürece daha fazla kişinin katılmasına olanak tanıyor.” “Hâlâ belirlilik üzerinde çalışmaya ihtiyaç var. fiziği anlamadığınızı.. henüz!
“Planımız sınırlarını keşfetmeye devam etmek. . . Ve hayır,” diye devam ediyor. “Şu anda Marakeş’teyim, elinde 10 kiloluk bir analog kamera ve filmle dolaşan adam çünkü görüntüleri eski yöntemle yapmak çok önemli – aynı zamanda keşfetmek de çok önemli. ve yeniyi şekillendirin.”
Stres sistemi testi ve deepfake’in gelecekteki kararları
OpenAI geçtiğimiz yıl sanatçılarla çalışıyor ve şirket gerçekten iki hayat yaşıyor. Sahai, “Sanatçılar kötü niyetli kullanıcılar değildir” diyor Sistemi test etmek için OpenAI, her türlü kötü kullanım durumunu halktan önce ortadan kaldırmaya çalışan “Kırmızı Takım Üyeleri”ne başvuruyor.
OpenAI, Sora’nın arkasındaki korumaları “güvenlik yığını” olarak tanımlıyor. Bunların çoğu, OpenAI’nin ChatGPT ve onun görüntü oluşturucusu Dall-E ile halihazırda yaptıklarına dayanıyor. ChatGPT dil analizi her isteğin üzerinden geçer. Örneğin bugün Dall-E’de çıplaklık veya şiddet içeren görüntüler oluşturamazsınız.
Sahai, amaçlarının “yaratıcılık ile istismarı dengelemek” olduğunu söylüyor. “Oldukça temkinli bir yaklaşımla başlıyoruz. Çocukların cinsel istismarı veya derin intikam pornosu sahtekarlıkları konusunda oldukça muhafazakar olma eğilimindeyiz, (dolayısıyla bunların) Sora’da kullanılması aslında imkansızdır. Pek çok yaratıcının reddedilmekten dolayı bunun biraz fazla tetikleyici bir mutluluk olduğunu söylemesini bekliyorum ve bu dengeyi zamanla bulacağız.”
2018’de orijinal deepfake yönteminin arkasındaki isimsiz geliştiriciyle röportaj yapan ilk gazeteciydim ve iş çoğunlukla zahmetli ve kaba olsa da, insanlıkta herkesin oluşturulabileceği radikal yeni bir sayfaya girdiğimiz açıktı. Her bağlam az çok anlıktır. Altı yıl sonra Sora bizi o geleceğe taşıyor.
Psora’nın en kötü suiistimallerini hafifletmenin en kolay seçeneği, içinde tanınabilir hiçbir insanın inşa edilmemesini sağlamak olacaktır. Ancak ekibin açıkladığı gibi birçok sanatçı, örnek görsellerdeki sahnelere belirli kişileri ekleme konusuna ilgi duyduğunu ifade etti ve adil olmak gerekirse, yaratıcı prodüksiyondaki herkes böyle bir aracı gerçekten kullanabilir.
“Sinema geçmişinden geliyorum. . . Yani (anlıyorum) Sora, içinde gerçek kişilerin yer aldığı videoları destekleyecektir,” dedi Mansoor “İstismarın önlenmesini istiyoruz”
Peki istismarın sınırları nelerdir? OpenAI, yukarıda bahsedilen sınırlı beta aracılığıyla Human Generations’ı başlatıyor. Gerçek moderatörlerin çıktıları inceleyeceği ve ünlülerin ve kamuoyuna mal olmuş kişilerin kullanılmasının varsayılan olarak engelleneceği ümit verici. Üretilen tüm videolar, izlenebilir kaynak olması için görünmez bir şekilde filigranlanır. “Kötüye kullanım modelleri” veya fikri mülkiyet ihlaliyle ilgili her şeyi yasaklayacaklardır.
Sahai, “Bunu bir deney olarak ele alıyoruz” dedi. “Yakından izleyebildiğimiz yalnızca belirli sayıda insan var.”
Kişisel olarak, yeterli koruma önlemleriyle hafifletilmiş gibi görünen yapay zeka intikam pornosu olasılığı ve başka birinin hayali memesini koyma konusunda kendi rızamın olmaması konusunda daha az endişeleniyorum. Eğer OpenAI insan neslinin etik davranmasına odaklanırsa, daha katı katılım ve çıkış seçenekleri sunmak daha sorumlu bir yaklaşım olacaktır.
Örneğin, katılım özelliği sayesinde sanatçılar yalnızca kendilerinin videolarını hazırlayabilir. Ya da belki OpenAI’ye gidip görsellerinin kullanılmasından vazgeçilebilir. Varsayımsal olarak vazgeçme seçeneği lojistik açıdan karmaşık olacaktır çünkü OpenAI’nin sistemlerine gelen her yüzü incelemesini gerektirecektir.
Sahai, devre dışı bırakma araçları hakkında “Bu, dikkate alacağımız bir şey” dedi “Bunun üzerine yüz verilerini ve araçlarını saklarsak, çok fazla biyometrik karmaşıklık ortaya çıkar ve bu, . . . Bu özelliğin kapatılması kolaydır.”
OpenAI’nin Sora’sı artık mevcut. Gerçeklik sonsuza dek yok oldu.