Media90 – Dunia teknologi mulai bergeser dari layar ke suara. OpenAI dikabarkan tengah menyiapkan langkah besar dalam pengembangan perangkat audio, lebih dari sekadar meningkatkan kemampuan suara ChatGPT. Berdasarkan laporan terbaru dari The Information, perusahaan ini telah mengalokasikan beberapa bulan terakhir untuk memadukan tim teknisi, produk, dan riset guna mengurus model audionya. Reorganisasi ini menjadi bagian dari rencana rahasia untuk meluncurkan perangkat personal “audio-first” pada awal 2026.
Evolusi Percakapan Natural
Teknologi inti perangkat baru ini akan memanfaatkan model audio generasi terbaru yang mampu menghadirkan interaksi lebih natural dan emosional dibanding versi sebelumnya. Salah satu fitur utamanya adalah kemampuan menangani interupsi secara real-time. Artinya, AI dapat berbicara bersamaan dengan pengguna, menciptakan alur percakapan yang menyerupai interaksi manusia nyata.
Dengan dialog yang lebih lancar dan tidak terlalu kaku, OpenAI menargetkan perangkat ini berperan sebagai rekan bicara, bukan sekadar alat digital. Lonjakan kemampuan teknis ini menjadi fondasi penting bagi perangkat yang sepenuhnya mengandalkan interaksi suara dibanding layar atau keyboard.
Desain Perangkat Keras Dipengaruhi Jony Ive
Perangkat yang sedang dikembangkan bukan sekadar proyek sampingan. OpenAI menyiapkan seluruh rangkaian hardware, mulai dari smart speaker tanpa layar hingga smart glasses bertenaga AI, dengan desain “audio-first”. Mantan kepala desain Apple, Jony Ive, berperan penting dalam proyek ini setelah akuisisi perusahaannya, io, oleh OpenAI senilai $6,5 miliar (sekitar Rp108,8 triliun) pada Mei 2025.
Ive fokus menciptakan pengalaman yang meminimalkan ketergantungan pada layar, menghasilkan perangkat yang dapat menyatu secara mulus dalam kehidupan sehari-hari. Dengan desain ini, pengguna bisa menikmati interaksi AI tanpa harus selalu menatap layar, menghadirkan bentuk pendamping digital yang lebih natural dan intuitif.
Tren Industri: Audio Jadi Fokus Utama
OpenAI tidak bergerak sendiri. Seluruh industri teknologi mulai menekankan interaksi audio:
-
Meta: Meluncurkan kacamata cerdas Ray-Ban dengan lima mikrofon untuk mendengar percakapan di ruangan ramai.
-
Google: Menguji “Audio Overviews” untuk mengubah hasil pencarian menjadi rangkuman lisan.
-
Tesla: Mengintegrasikan chatbot Grok xAI dalam kendaraan untuk mengatur navigasi dan kendali cuaca lewat percakapan.
-
Startup: Perusahaan seperti Sandbar dan proyek yang dipimpin Eric Migicovsky (pendiri Pebble) mengembangkan cincin AI yang memungkinkan pengguna “bicara ke tangan mereka”.
Meski beberapa percobaan seperti Humane AI Pin belum sukses total, tren interaksi berbasis audio diyakini akan terus berkembang, dari mobil hingga perangkat wearable.
Tantangan dan Harapan
Merancang perangkat berbasis audio sepenuhnya adalah langkah berani dan penuh risiko. Banyak pengguna masih mengutamakan teks untuk alasan privasi, sehingga OpenAI harus membuktikan perangkat ini bermanfaat sebagai pelengkap atau bahkan pengganti smartphone.
Namun, kolaborasi visi Sam Altman dan keahlian desain Jony Ive menimbulkan ekspektasi tinggi. Dengan rencana rilis model audio pada 2026 dan perangkat audio pada 2027, OpenAI berharap memimpin era pasca-smartphone, di mana interaksi AI terdengar, bukan hanya terlihat.
Fitur Unggulan Model Audio OpenAI
-
Ucapan Alami: Respon lebih emosional dan akurat.
-
Bicara Bersamaan: Mendengar dan merespon secara real-time.
-
Interupsi Cerdas: Menangani sela percakapan layaknya manusia.
-
Prioritas Privasi: Bisa digunakan sebagai pendamping rumah tangga tanpa layar yang mengganggu.
OpenAI tampaknya ingin membuktikan bahwa masa depan AI bukan hanya soal layar dan teks, melainkan suara yang menghadirkan pengalaman digital lebih manusiawi dan intuitif.














