TEKNO

Revolusi Nvidia: Dynamic Memory Sparsification Bikin AI Lebih Cepat dan Hemat Biaya Infrastruktur

113
×

Revolusi Nvidia: Dynamic Memory Sparsification Bikin AI Lebih Cepat dan Hemat Biaya Infrastruktur

Sebarkan artikel ini
Teknik DMS Nvidia: Tingkatkan Kecepatan AI dan Kurangi Biaya Infrastruktur
Teknik DMS Nvidia: Tingkatkan Kecepatan AI dan Kurangi Biaya Infrastruktur

Media90 – Raksasa teknologi chip, Nvidia, baru saja memperkenalkan inovasi revolusioner yang berpotensi mengubah peta komputasi kecerdasan buatan (AI). Teknologi bernama Dynamic Memory Sparsification (DMS) ini diklaim mampu memangkas kebutuhan memori GPU hingga delapan kali lipat, tanpa menurunkan akurasi model AI.

Inovasi ini muncul di tengah krisis ketersediaan unit pemroses grafis (GPU) dan tingginya biaya operasional pusat data AI di seluruh dunia. Dengan DMS, Nvidia menargetkan kendala utama dalam pengembangan Large Language Model (LLM) modern: keterbatasan memori saat melakukan proses penalaran (reasoning).

Ads
close ads

Solusi untuk Kendala ‘Bottleneck’ Memori

Saat menjalankan model bahasa besar, AI menghasilkan teks atau token demi token yang disimpan dalam key-value cache (KV cache)—memori sementara yang terus membengkak seiring panjangnya konteks.

Semakin panjang proses penalaran model, semakin banyak memori GPU yang tersedot. Kondisi ini sering menjadi bottleneck, menyebabkan biaya komputasi melonjak dan membatasi jumlah pengguna yang dapat dilayani secara bersamaan. DMS hadir untuk mengelola KV cache agar tetap efisien tanpa mengorbankan informasi penting.

Cara Kerja Dynamic Memory Sparsification (DMS)

Berbeda dengan metode tradisional yang menghapus data memori lama secara heuristik, DMS bekerja lebih cerdas. Model AI “mengelola memorinya sendiri,” mengenali token mana yang relevan untuk penalaran selanjutnya dan mana yang bisa dihapus.

Nvidia juga menerapkan delayed eviction, menunda penghapusan token agar model sempat menyerap konteks penting sebelum memori dibersihkan. Hasilnya: beban GPU berkurang signifikan, tanpa mengganggu kualitas output AI.

Akurasi Tetap Terjaga, Performa Meningkat

Dalam pengujian pada model populer seperti Qwen dan Llama, DMS menunjukkan hasil impresif. Misalnya, pada Qwen3-8B, akurasi tetap stabil di berbagai benchmark seperti MATH 500, HumanEval, hingga AIME 2024. Bahkan, dalam beberapa skenario coding dan matematika, model dengan DMS mencatat skor sedikit lebih tinggi dibanding versi standar.

Efisiensi memori ini langsung meningkatkan kecepatan sistem. GPU tidak perlu terus-menerus membaca dan menulis data besar ke memori, sehingga latensi berkurang dan throughput meningkat. Model AI kini bisa memproses konteks lebih panjang tanpa risiko kehabisan memori (out of memory).

Kompatibilitas dan Kemudahan Adopsi

DMS dirancang agar mudah diadopsi. Nvidia menyatakan teknologi ini dapat diterapkan pada model pretrained tanpa perlu pelatihan ulang yang mahal.

DMS kompatibel dengan infrastruktur standar dan telah dirilis sebagai bagian dari framework Model Optimizer Nvidia, dapat diintegrasikan ke ekosistem AI populer seperti Hugging Face dan sistem yang mendukung FlashAttention. Perusahaan pengembang AI pun bisa segera mengimplementasikan teknologi ini untuk menekan biaya infrastruktur.

Dampak Ekonomi bagi Industri AI

Penghematan memori hingga delapan kali lipat berarti pengurangan biaya operasional yang signifikan. Satu GPU kini dapat menangani beban kerja yang sebelumnya membutuhkan kapasitas jauh lebih besar, atau melayani lebih banyak pengguna dengan perangkat keras yang sama.

Bagi perusahaan yang kesulitan mendapatkan chip AI terbaru, DMS memberi solusi perangkat lunak yang mengoptimalkan perangkat yang ada. Dengan teknologi ini, Nvidia memastikan kemajuan AI tidak terhambat oleh keterbatasan fisik memori semata.

Dengan DMS, kecepatan, efisiensi, dan biaya operasional AI kini berada pada level yang lebih terjangkau, menandai era baru komputasi AI yang lebih cerdas dan hemat sumber daya.

WhatsApp Web Alami Gangguan Pengguna Mengaku Dialihkan ke Facebook
TEKNO

Media90.id – Layanan WhatsApp Web dilaporkan mengalami gangguan massal atau down pada Rabu pagi, 20 Mei 2026. Gangguan tersebut langsung memicu kebingungan di kalangan pengguna internet lantaran saat membuka alamat resmi WhatsApp Web, browser justru otomatis mengarahkan tampilan ke halaman utama Facebook. Pantauan di media sosial menunjukkan keluhan mulai ramai bermunculan di platform X sejak sekitar pukul 06.00 WIB. Gangguan ini sempat menimbulkan kepanikan kecil di kalangan pekerja kantoran maupun pengguna yang hendak memulai aktivitas pagi menggunakan WhatsApp Web. Ads close ads Sejumlah netizen mengaku heran karena halaman login WhatsApp Web tidak menampilkan kode QR seperti biasanya. Salah satu akun…

China Jadi Negara Pertama yang Terapkan Nomor Identitas untuk Robot Humanoid
TEKNO

Media90 – Hubei Humanoid Robot Innovation Center di Provinsi Hubei, China, resmi menerapkan sistem pemberian nomor identitas unik atau “KTP” khusus bagi robot humanoid. Kebijakan ini menjadi langkah perdana di dunia yang bertujuan untuk memastikan pelacakan penuh serta akuntabilitas operasional perangkat robotika. Sistem identitas ini dirancang untuk merekam seluruh riwayat aktivitas robot sepanjang masa pakainya. Langkah tersebut diambil untuk mengurangi risiko keamanan sekaligus mempermudah penentuan tanggung jawab hukum apabila terjadi kerusakan atau malfungsi pada robot. Ads close ads Identitas Digital Berisi Data Lengkap Robot Melansir China Daily, Chief Operating Officer Hubei Humanoid Robot Innovation Center, Liu Chuanhou, menjelaskan bahwa nomor…

Jangan Sembarangan Tunjukkan Pose Peace AI Bisa Ambil Data Biometrik
TEKNO

Media90 – Tren keamanan siber terbaru memperingatkan bahwa kebiasaan berfoto dengan pose dua jari atau peace sign berpotensi membuka celah baru bagi pencurian data biometrik. Seiring meningkatnya kualitas kamera smartphone dan pesatnya perkembangan kecerdasan buatan (AI), ancaman terhadap privasi digital pengguna kini semakin nyata. Teknologi seperti computer vision dan image enhancement disebut mampu dimanfaatkan untuk mengekstraksi informasi sensitif dari foto yang diunggah secara publik di media sosial. Ads close ads Modus Pencurian Data Sidik Jari Berbasis AI Ancaman ini bekerja melalui beberapa tahapan yang memanfaatkan detail visual pada gambar digital: Pertama, pelaku melakukan ekstraksi gambar, yaitu mencari foto beresolusi tinggi…

WhatsApp Dibanjiri Spam Nomor Brasil Sejumlah Akun Mendadak Logout
TEKNO

Media90 – Jagat media sosial baru-baru ini dihebohkan oleh fenomena serangan spam misterius yang menyasar para pengguna aplikasi pesan instan WhatsApp. Sejumlah warganet di platform Threads dan TikTok mengeluhkan akun WhatsApp mereka yang tiba-tiba dibanjiri pesan dari ratusan nomor asing dengan kode negara Brasil. Dampak dari serbuan pesan massal tersebut tidak bisa dianggap sepele. Beberapa pengguna melaporkan akun mereka langsung keluar (logout) secara otomatis dan mengalami kesulitan saat mencoba melakukan pemulihan akun. Ads close ads Salah satu unggahan yang viral di Threads berasal dari seorang praktisi keamanan siber dengan akun @cantikacr. Dalam unggahannya, ia mengingatkan pengguna untuk segera meningkatkan keamanan…

Anker Rilis USB C Hub 5 in 1 Murah dengan HDMI 4K untuk Laptop Tipis
TEKNO

Media90 – Tren desain laptop modern yang semakin tipis dan minimalis memang terlihat elegan, namun sering kali membuat jumlah port konektivitas menjadi terbatas. Menjawab kebutuhan tersebut, produsen aksesori teknologi global Anker resmi memperkenalkan perangkat terbaru mereka bernama Anker 5-in-1 All-in-One USB-C Expansion Dock atau Anker 5-in-1 USB-C Hub. Perangkat aksesori ini debut di pasar China melalui platform e-commerce JD.com dan langsung menarik perhatian karena hadir dengan harga yang sangat terjangkau. Anker membanderol produk ini seharga 99 yuan atau setara sekitar Rp258 ribuan. Ads close ads Dengan harga ekonomis tersebut, produk ini diproyeksikan menjadi solusi praktis bagi pengguna ultrabook maupun laptop…

Google Resmi Ubah Fitbit Jadi Google Health Kini Hadir dengan AI Health Coach
TEKNO

Media90 – Google resmi memperkenalkan gelang kebugaran terbaru bernama Fitbit Air. Bersamaan dengan peluncuran perangkat tersebut, Google juga mengumumkan rebranding aplikasi Fitbit menjadi Google Health yang kini dilengkapi layanan pelatih kesehatan berbasis kecerdasan buatan atau AI. Ads close ads Transformasi ini menjadi bagian dari strategi kebugaran Google setelah mengakuisisi Fitbit pada 2021 untuk memperkuat ekosistem perangkat wearable Android mereka. Gemini AI Jadi Otak Google Health Coach Salah satu pembaruan terbesar dalam platform baru ini adalah kehadiran Google Health Coach. Fitur tersebut ditenagai teknologi Gemini dan dirancang sebagai pelatih kebugaran, pakar tidur, sekaligus penasihat kesehatan personal berbasis AI. Menurut Google, sistem…

OpenAI Hadirkan Codex ke ChatGPT Mobile Programmer Kini Bisa Pantau Proyek dari HP
TEKNO

Media90 – OpenAI resmi mengintegrasikan alat pemrograman berbasis kecerdasan buatan mereka, Codex, ke dalam aplikasi ChatGPT versi seluler. Melalui pembaruan ini, pengguna kini dapat memantau sekaligus mengelola alur kerja pengembangan perangkat lunak secara jarak jauh langsung dari perangkat mobile. Ads close ads Pembaruan yang masih berstatus preview tersebut telah tersedia bagi seluruh pelanggan paket langganan ChatGPT di perangkat iOS maupun Android. Fitur Pengelolaan Jarak Jauh Integrasi terbaru ini memungkinkan pengembang melihat environment Codex yang sedang berjalan secara langsung dari berbagai perangkat. Dalam pernyataan resminya, OpenAI menjelaskan bahwa pembaruan tersebut tidak hanya berfungsi untuk mengontrol komputer dari jarak jauh, tetapi juga…