Media90.id – Google resmi memperkenalkan model kecerdasan buatan (AI) terbaru mereka bernama Gemini Omni dalam ajang Google I/O 2026 yang digelar di Mountain View, California, Amerika Serikat, Selasa (19/5/2026) waktu setempat.
Model ini dirancang sebagai sistem “any-to-any”, yang memungkinkan AI menerima berbagai jenis input seperti teks, gambar, audio, hingga video, lalu mengubahnya menjadi konten baru secara utuh dan terintegrasi.
Dalam pengembangannya, Gemini Omni disebut sebagai evolusi lanjutan dari Google Veo, model AI sebelumnya yang berfokus pada pembuatan dan pengeditan gambar. Kini, kemampuan tersebut diperluas ke ranah video generatif yang lebih kompleks.
Edit Video Cukup dengan Percakapan Alami
Salah satu fitur paling menonjol dari Gemini Omni adalah kemampuan mengedit video hanya melalui perintah berbasis bahasa alami. Pengguna cukup mengetik instruksi seperti sedang berbicara, dan sistem akan langsung menyesuaikan hasil video sesuai permintaan.
Google menyebutkan:
“Dengan Omni, Anda dapat menggabungkan gambar, audio, video, dan teks sebagai input untuk menghasilkan video berkualitas tinggi yang didukung oleh pengetahuan dunia nyata milik Gemini.”
Menariknya, Gemini Omni mampu mempertahankan konteks dari setiap instruksi yang diberikan. Hal ini membuat karakter, objek, hingga suasana dalam video tetap konsisten meskipun pengguna melakukan revisi berulang kali.
Sebagai contoh, pengguna dapat meminta perubahan seperti mengubah patung menjadi gelembung, menambahkan karakter baru, hingga mengubah suasana adegan secara dramatis hanya melalui prompt teks.
Pemahaman Fisika Lebih Realistis dan Avatar Digital
Google mengklaim Gemini Omni memiliki pemahaman yang lebih baik terhadap hukum fisika dibandingkan model AI sebelumnya. Hal ini memungkinkan simulasi visual yang lebih realistis, termasuk:
- Efek gravitasi pada objek
- Pergerakan energi kinetik
- Dinamika fluida seperti air dan gas
Dengan kemampuan ini, hasil video terlihat lebih natural dan mendekati dunia nyata.
Selain itu, Gemini Omni juga memanfaatkan pengetahuan Gemini terkait sains, sejarah, dan konteks dunia nyata untuk menghasilkan video yang lebih akurat secara logika. AI ini bahkan mampu membuat video penjelasan (explainer video) hanya dari prompt singkat.
Google juga memperkenalkan fitur “Avatars” yang memungkinkan pengguna membuat karakter digital berbasis wajah dan suara mereka sendiri. Avatar ini dapat digunakan untuk menghasilkan video AI yang menyerupai pengguna asli secara visual maupun audio.
Keamanan dengan Watermark Digital SynthID
Untuk mengantisipasi potensi penyalahgunaan konten AI, Google menyematkan teknologi watermark digital bernama SynthID pada setiap video yang dihasilkan Gemini Omni.
Pengguna juga dapat memverifikasi keaslian konten melalui aplikasi Gemini, Chrome, maupun Google Search, sehingga transparansi konten tetap terjaga di ekosistem digital.
Peluncuran Gemini Omni Flash dan Ketersediaan
Model pertama yang dirilis dari keluarga ini adalah Gemini Omni Flash. Google membaginya ke dalam beberapa skema akses:
- Pengguna Berbayar: Tersedia global melalui Google One AI Premium serta Google Workspace
- Pengguna Umum: Dapat digunakan tanpa biaya tambahan melalui YouTube Shorts dan YouTube Create
- Developer dan Enterprise: Akses API akan tersedia dalam beberapa minggu ke depan
Era Baru Editing Video Berbasis AI
Dengan hadirnya Gemini Omni, Google membawa lompatan besar dalam teknologi video generatif. Proses editing yang sebelumnya membutuhkan perangkat lunak kompleks kini dapat dilakukan hanya dengan perintah teks sederhana.
Inovasi ini sekaligus membuka babak baru dalam industri kreatif digital, di mana produksi video menjadi lebih cepat, fleksibel, dan mudah diakses oleh pengguna umum maupun profesional.














