Sora AI Bisa Bikin Video dari Teks, Apa Rahasianya?
Apa lo termasuk salah satu orang yang ikutan panik kerjaan di industri kreatif bakal digantiin sama AI? Gue bisa relate banget, tapi badai masih jauh dari kata selesai. Dulu, kita pernah sempat ngomongin soal MusicLM, AI besutan Google yang bisa bikin lagu cuma bermodalkan keyword vibes-nya aja.
Nah, sekarang ada pesaingnya yang bisa ngelakuin hal sama, tapi khusus buat bikin video! Lho, gimana cara kerjanya? Sini, kita bakal kenalan sama Sora AI yang lagi booming belakangan ini sampai tuntas, Bro!
Ketik Aja, Video Langsung Jadi
Oke, tapi sebenarnya cara kerja Sora AI itu gimana? Nah, text-to-video generator satu ini pakai teknologi diffusion transformer model. Kalau di-breakdown, cara kerjanya terdiri dari gabungan neural network buat model bahasa ala di ChatGPT sama Gemini plus diffusion model DALL-E buat hilangin noise dari gambar.
Gimana dengan Kualitas Hasilnya?
Bahkan, durasinya juga cukup banget di era keemasan short-form video kayak sekarang. Dengan kata lain, lo bisa bikin video pakai Sora AI dengan durasi sampai 60 detik. Ini aja udah ngebuktiin kalau teknologinya benar-benar kelewat canggih buat zaman sekarang! Pastinya, pertahanin konsistensi setiap frame selama 1 menit full bukan hal yang gampang, apalagi mengingat AI sendiri masih baru mulai berkembang.
Tapi, namanya juga AI teknologi yang masih relatif baru buat bikin video, of course hasilnya juga enggak 100% sempurna. Kalau lo perhatiin setiap detail frame videonya dari dekat, pastinya lo bakal nemu minimal 1 bagian yang aneh atau enggak konsisten. Contohnya, kaki yang pendek sebelah, walk cycle yang singkat, atau objek yang kelihatan melebur sama yang lain.
Pro Kontra Sora AI
Kalau kita sekarang bisa bikin video cuma modal ketik beberapa kata di keyword, gimana kabar orang-orang yang susah payah kuliah jurusan DKV atau broadcasting? Tunggu dulu, soalnya Sora AI menuai banyak pro kontra, terutama dari orang-orang di industri kreatif! In fact, gue rasa ada alasan bagus kenapa OpenAI belum bisa ngerilis Sora AI buat kalangan umum.
For starters, ada masalah hak cipta. Buat bisa bikin video dari kata kunci apapun dengan hasil HD, tentunya Sora AI harus belajar dari banyak gambar dan video buatan manusia. Nah, masalahnya, belum tentu semua bahan pembelajaran itu dikasih seizin creator-nya.
Selain itu, potensi penyalahgunaan teknologinya juga gede banget. Kalau lo sempat ingat orang-orang ngeributin masalah deepfake, you get the idea. Apalagi, di era digital sekarang yang bikin informasi sesat lebih gampang nyebar.
Bukan Text-to-Video Generator Pertama
Meski kelihatan sophisticated banget, sebenarnya Sora AI bukan text-to-video generator yang paling pertama di dunia. Justru, sebelum Sora AI lahir, udah ada generator serupa dari berbagai perusahaan teknologi. Contohnya, ada Emu dari Meta, Stable Video Diffusion dari Stability AI, dan belum lama ini, Google juga ngerilis Lumiere.
Tapi, di antara semuanya, Sora AI termasuk yang paling terkenal karena berbagai kelebihannya. Kalau generator yang lain cuma bisa bikin video berdurasi kurang dari 10 detik aja, beda cerita sama Sora AI. Terus, konsistensi antar frame di video akhirnya juga belum semulus Sora AI, tapi mungkin nanti bisa makin berkembang..
Ngelihatin perkembangan Sora AI di videografi emang bikin mindblown karena cara kerja teknologinya super canggih. Tapi, at the same time, lo juga harus tahu kalau Sora AI masih belum sepenuhnya bisa nge-capture cause and effect dari setiap peristiwa yang lo rekam di kamera.
Karena itu juga, esensinya bakal tetap beda jauh sama video buatan manusia. So, artinya, lo bisa tetap bersaing selama lo terus ningkatin skill dan nambah pengalaman biar video bikinan lo makin authentic!