NVIDIA Vera Rubin mendobrak pakem GPU dengan rak 600-kilowatt dan memori jutaan token
CEO NVIDIA, Jensen Huang, memberikan kejutan besar di GTC 2025, membuat tim infrastruktur berebutan mengambil kalkulator mereka: platform Vera Rubin akan mendorong rak pusat data hingga 600 kilowatt pada tahun 2027.¹ Pengumuman ini menandai pergeseran mendasar dalam cara kerja pusat data, memaksa pemikiran ulang secara menyeluruh mengenai pengiriman daya, sistem pendingin, dan infrastruktur fisik yang pada dasarnya tidak berubah selama beberapa dekade.
Platform Vera Rubin merupakan lompatan paling ambisius dari NVIDIA. Sistem multi-komponen ini menggabungkan CPU Vera khusus, GPU Rubin generasi berikutnya, dan akselerator Rubin CPX (Context Processing eXtension) khusus, yang dirancang khusus untuk beban kerja AI yang mencapai jutaan token.² Tidak seperti peningkatan tambahan yang biasa terjadi pada generasi GPU, varian Vera Rubin NVL144 CPX menghadirkan performa AI 7,5x lipat dari sistem Blackwell GB300 yang ada sekarang, sekaligus secara fundamental mengubah cara pengemasan, pendinginan, dan penggunaan GPU.
"Kami adalah perusahaan teknologi pertama dalam sejarah yang mengumumkan empat generasi sesuatu," jelas Huang kepada Data Center Dynamics, menjelaskan peta jalan NVIDIA hingga tahun 2028.⁴ Transparansi ini memiliki tujuan yang sangat penting: memberikan waktu yang cukup bagi penyedia infrastruktur, operator pusat data, dan perusahaan seperti Introl untuk mempersiapkan diri dalam menata ulang infrastruktur AI secara menyeluruh.
Spesifikasi platform NVIDIA Vera Rubin NVL144 yang menunjukkan performa inferensi FP4 sebesar 3,6 exaflops dan peningkatan 3,3x lipat dari GB300 NVL72, yang akan hadir pada paruh kedua tahun 2026.
Revolusi arsitektur dimulai dengan silikon khusus.
Peta jalan lengkap NVIDIA dari Blackwell hingga Feynman, menunjukkan evolusi dari arsitektur rak Oberon hingga Kyber yang mendukung konsumsi daya hingga 600kW.
CPU Vera menandai keberangkatan NVIDIA dari desain ARM yang sudah jadi, yang menampilkan 88 core ARM kustom dengan multithreading simultan, yang memungkinkan 176 prosesor logis.⁵ NVIDIA menyebut core khusus ini sebagai "Olympus", dan desain ini memberikan performa dua kali lipat dari CPU Grace yang digunakan pada sistem Blackwell saat ini.⁶ Setiap CPU Vera terhubung ke GPU Rubin melalui antarmuka NVLink C2C 1,8 TB/dtk, yang memungkinkan bandwidth yang belum pernah ada sebelumnya di antara elemen-elemen komputasi.⁷
GPU Rubin standar mendorong batas dengan memori HBM4 288GB per paket, mempertahankan kapasitas yang sama dengan Blackwell Ultra B300 tetapi meningkatkan bandwidth memori dari 8 TB/s menjadi 13 TB/s.⁸ Setiap paket Rubin berisi dua die GPU dengan jumlah reticle terbatas, meskipun NVIDIA telah mengubah metodologi penghitungannya - jika Blackwell menyebut satu GPU (dua die), Rubin menyebutnya dua GPU. ⁹ Perubahan ini merefleksikan peningkatan kompleksitas arsitektur multi-die dan membantu pelanggan untuk lebih memahami sumber daya komputasi yang sesungguhnya di setiap sistem.
Elemen paling inovatif hadir dalam bentuk Rubin CPX, akselerator yang dibuat khusus untuk pemrosesan konteks masif. Desain monolitik menghasilkan 30 petaFLOP komputasi NVFP4 dengan 128GB memori GDDR7 yang hemat biaya, yang secara khusus dioptimalkan untuk mekanisme perhatian pada model transformer.¹⁰ CPX mencapai kemampuan perhatian 3x lebih cepat dibandingkan dengan sistem GB300 NVL72, yang memungkinkan model AI untuk memproses jutaan konteks token - setara dengan satu jam video atau seluruh basis kode - tanpa penurunan kinerja.¹¹
Penerapan menuntut perombakan infrastruktur secara menyeluruh.
Sistem standar Vera Rubin NVL144, yang dijadwalkan hadir pada paruh kedua tahun 2026, mempertahankan kompatibilitas dengan infrastruktur GB200/GB300 yang sudah ada, dengan memanfaatkan arsitektur rak Oberon yang sudah dikenal.¹² Sistem ini mengemas 144 die GPU (72 paket), 36 CPU Vera, dan menghadirkan performa inferensi FP4 sebesar 3,6 exaFLOPS - 3,3x lebih tinggi dibandingkan Blackwell Ultra.¹³ Konsumsi daya tetap dapat diatur pada kisaran 120-130kW per rak, serupa dengan penerapan saat ini.
Varian Vera Rubin NVL144 CPX membawa performa lebih jauh, mengintegrasikan 144 GPU Rubin CPX bersama 144 GPU Rubin standar dan 36 CPU Vera untuk menghasilkan delapan exaFLOPs komputasi NVFP4 - peningkatan 7,5x lipat dari GB300 NVL72 - dengan memori berkecepatan tinggi sebesar 100TB dan bandwidth memori sebesar 1,7 PB/s dalam satu rak.¹⁴
Semuanya berubah dengan Rubin Ultra dan arsitektur rak Kyber pada tahun 2027. Sistem NVL576 menjejalkan 576 die GPU ke dalam satu rak, mengonsumsi daya 600kW-lima kali lipat dari sistem saat ini.¹⁵ Desain Kyber memutar bilah komputasi 90 derajat ke dalam orientasi vertikal, mengemas empat buah pod yang masing-masing terdiri atas 18 bilah ke dalam rak.¹⁶ Setiap bilah menampung delapan GPU Rubin Ultra di samping CPU Vera, mencapai kepadatan yang tampaknya mustahil beberapa tahun yang lalu.
Sistem NVIDIA Blackwell saat ini dengan 72 GPU yang menghasilkan 1,1 exaflops
Sistem NVIDIA Rubin di masa depan yang ditingkatkan menjadi 576 GPU dan 15 exaflops dalam satu rak 600kW
Pendinginan sistem ini membutuhkan perendaman cairan secara menyeluruh tanpa kipas - berbeda dengan sistem saat ini yang masih menggunakan beberapa pendinginan udara untuk komponen tambahan.¹⁷ CoolIT Systems dan Accelsius telah mendemonstrasikan solusi pendinginan yang mampu menangani rak 250kW dengan temperatur air masuk 40°C, yang memvalidasi jalur teknologi untuk penggunaan 600kW.¹⁸ Rak Kyber memiliki sespan khusus untuk infrastruktur daya dan pendinginan, yang secara efektif membutuhkan dua tapak rak untuk setiap sistem 600kW.¹⁹
Evolusi arsitektur daya memungkinkan komputasi skala megawatt.
Transisi NVIDIA ke distribusi daya 800 VDC mengatasi keterbatasan fisika mendasar dari infrastruktur saat ini. Distribusi in-rack 54V tradisional akan membutuhkan rak daya 64U untuk sistem skala Kyber, tanpa menyisakan ruang untuk komputasi yang sebenarnya.²⁰ Arsitektur 800V menghilangkan konversi AC/DC di tingkat rak, meningkatkan efisiensi ujung ke ujung hingga 5%, dan mengurangi biaya perawatan hingga 70%.²¹
Infrastruktur daya yang baru mendukung rak mulai dari 100kW hingga lebih dari 1MW, menggunakan tulang punggung yang sama, dan menyediakan skalabilitas yang dibutuhkan untuk generasi mendatang.²² Perusahaan yang menggunakan Vera Rubin harus merencanakan peningkatan daya secara masif - satu rak NVL576 membutuhkan daya sebanyak 400 rumah pada umumnya. Pusat data yang merencanakan penerapan tahun 2027 harus memulai peningkatan infrastruktur sekarang, termasuk koneksi listrik skala utilitas dan kemungkinan pembangkit listrik di tempat.
Bagi spesialis infrastruktur seperti Introl, pergeseran ini menciptakan peluang yang belum pernah terjadi sebelumnya. Keahlian perusahaan dalam menerapkan infrastruktur GPU pada skala besar, mengelola lebih dari 100.000 GPU di seluruh dunia, dan posisi kehadirannya yang luas di Asia Pasifik Organisasi membutuhkan mitra yang tidak hanya memahami penerapan GPU, tetapi juga tarian rumit antara daya, pendinginan, dan jaringan yang diperlukan untuk sistem 600kW.
Peningkatan kinerja membenarkan investasi infrastruktur.
Varian Vera Rubin NVL144 CPX menampilkan potensi platform ini dengan delapan exaFLOPS komputasi NVFP4, di samping memori berkecepatan tinggi 100TB dan bandwidth memori 1,7 PB/s, semuanya dalam satu rak.²⁴ NVIDIA mengklaim bahwa perusahaan dapat meraih laba atas investasi 30x hingga 50x lipat, atau setara dengan pendapatan sebesar US$5 miliar dari investasi modal sebesar US$100 juta.²⁵
Pengguna awal termasuk Leibniz Supercomputing Center di Jerman, yang menggunakan superkomputer Blue Lion dengan Vera Rubin untuk mencapai daya komputasi 30 kali lebih besar daripada sistem mereka saat ini.²⁶ Sistem Doudna di Lawrence Berkeley National Lab juga akan berjalan pada Vera Rubin, menggabungkan simulasi, data, dan AI ke dalam satu platform untuk komputasi ilmiah.²⁷
Spesialisasi Rubin CPX untuk pemrosesan konteks mengatasi hambatan kritis dalam sistem AI saat ini. Perusahaan seperti Cursor, Runway, dan Magic sudah mengeksplorasi bagaimana CPX dapat mempercepat asisten pengkodean dan aplikasi pembuatan video yang membutuhkan pemrosesan jutaan token secara bersamaan.²⁸ Kemampuan untuk mempertahankan seluruh basis kode atau video berjam-jam dalam memori aktif pada dasarnya mengubah apa yang dapat dicapai oleh aplikasi AI.
Tantangan infrastruktur menciptakan peluang pasar.
Lompatan ke rak 600kW memperlihatkan kenyataan pahit tentang kemampuan pusat data saat ini. Sebagian besar fasilitas berjuang dengan rak 40kW; bahkan pusat data AI mutakhir jarang melebihi 120kW. Transisi ini tidak hanya membutuhkan sistem pendingin baru, tetapi juga desain ulang fasilitas secara menyeluruh, mulai dari lantai beton yang mampu menopang beban berat yang sangat besar hingga gardu listrik yang sesuai untuk operasi industri.
"Pertanyaannya adalah berapa banyak fasilitas pusat data yang ada yang dapat mendukung konfigurasi yang begitu padat," catat The Register, menyoroti bahwa sifat rak Kyber yang dibuat khusus berarti fasilitas membutuhkan infrastruktur yang dibangun khusus.²⁹ Pengembangan greenfield di wilayah dengan kelebihan energi terbarukan atau nuklir - Skandinavia, Quebec, dan UEA - kemungkinan besar akan mengarah pada adopsi.
Garis waktu tersebut memberikan ruang bernapas bagi industri namun menuntut tindakan segera. Organisasi yang merencanakan infrastruktur AI untuk tahun 2027 dan seterusnya harus mengambil keputusan sekarang tentang lokasi fasilitas, pengadaan daya, dan arsitektur pendinginan. Waktu tunggu tiga tahun mencerminkan kompleksitas penerapan infrastruktur yang beroperasi di luar batas kemampuan secara fisik.
Jalan di luar Vera Rubin
Peta jalan NVIDIA melampaui Vera Rubin hingga arsitektur Feynman pada tahun 2028, kemungkinan besar mendorong ke arah rak 1 megawatt.³¹ CEO Vertiv, Giordano Albertazzi, menyatakan bahwa untuk mencapai densitas skala MW akan membutuhkan "revolusi lebih lanjut dalam pendinginan cair, dan perubahan paradigma di sisi daya." Lintasan ini tampaknya tidak dapat dielakkan-Beban kerja AI membutuhkan peningkatan eksponensial dalam densitas komputasi, dan secara ekonomi lebih mengutamakan konsentrasi daripada distribusi.
Pergeseran dari peningkatan bertahap ke perubahan revolusioner dalam infrastruktur GPU mencerminkan transformasi AI yang lebih luas. Seperti halnya model bahasa yang besar melompat dari miliaran menjadi triliunan parameter, infrastruktur yang mendukungnya juga harus melakukan lompatan yang sama. Vera Rubin tidak hanya mewakili GPU yang lebih cepat, tetapi juga pemikiran ulang mendasar tentang cara kerja infrastruktur komputasi.
Untuk perusahaan seperti Introl yang berspesialisasi dalam penerapan infrastruktur GPU, Vera Rubin menciptakan peluang generasi. Organisasi membutuhkan mitra yang dapat menavigasi kompleksitas penerapan 600kW, mulai dari perencanaan awal hingga implementasi dan pengoptimalan yang berkelanjutan. Perusahaan yang berhasil menerapkan Vera Rubin akan mendapatkan keunggulan kompetitif yang signifikan dalam kemampuan AI, sementara perusahaan yang ragu-ragu berisiko kalah saat industri ini berlomba menuju AI skala besar.
Kesimpulan
Platform Vera Rubin dari NVIDIA memaksa industri pusat data untuk menghadapi kenyataan yang tidak nyaman tentang keterbatasan infrastruktur sekaligus menawarkan kemampuan komputasi yang belum pernah ada sebelumnya. Rak 600kW pada tahun 2027 mewakili lebih dari sekadar konsumsi daya yang lebih tinggi - rak ini menandai transformasi lengkap dalam cara infrastruktur AI dibangun, didinginkan, dan dioperasikan. Organisasi yang mulai merencanakan sekarang, bermitra dengan spesialis infrastruktur berpengalaman yang memahami kompleksitas penerapan generasi mendatang, akan berada di posisi terbaik untuk memanfaatkan kemampuan revolusioner yang dimungkinkan oleh Vera Rubin.
Kedatangan platform ini pada tahun 2026-2027 memberikan waktu bagi industri untuk mempersiapkan diri, namun waktu terus berjalan. Pusat data yang dirancang hari ini harus mengantisipasi kebutuhan di masa depan, dan Vera Rubin menjelaskan bahwa masa depan menuntut perubahan radikal dari pemikiran konvensional. Perusahaan yang merangkul transformasi ini akan mendukung terobosan AI generasi berikutnya, mulai dari model bahasa jutaan token hingga sistem pembuatan video real-time yang tampak seperti fiksi ilmiah saat ini.
Referensi
¹ The Register. "CPU Vera Rubin Nvidia, GPU grafik kursus untuk rak 600kW." 19 Maret 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.
² NVIDIA Newsroom. "NVIDIA Memperkenalkan Rubin CPX: Kelas Baru GPU yang Dirancang untuk Inferensi Konteks Masif." 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.
Ibid.
⁴ Dinamika Pusat Data. "GTC: Jensen Huang, Ian Buck, dan Charlie Boyle dari Nvidia tentang masa depan kepadatan rak pusat data." 21 Maret 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.
⁵ TechPowerUp. "NVIDIA Memperkenalkan CPU Vera dan GPU Rubin Ultra AI, Mengumumkan Arsitektur Feynman." 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.
⁶ CNBC. "Nvidia mengumumkan chip AI Blackwell Ultra dan Vera Rubin." 18 Maret 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.
⁷ Yahoo Finance. "Nvidia memulai debut superchip Vera Rubin generasi berikutnya di GTC 2025." 18 Maret 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.
⁸ Platform Berikutnya. "Nvidia Menggambar Peta Jalan Sistem GPU Hingga 2028." 5 Juni 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.
⁹ SemiAnalisis. "NVIDIA GTC 2025 - Dibangun Untuk Penalaran, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman." 4 Agustus 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.
¹⁰ NVIDIA Newsroom. "NVIDIA Memperkenalkan Rubin CPX: Kelas Baru GPU yang Dirancang untuk Inferensi Konteks Masif."
¹¹ Ibid.
¹² Tom's Hardware. "Nvidia mengumumkan GPU Rubin pada tahun 2026, Rubin Ultra pada tahun 2027, Feynman juga ditambahkan ke peta jalan." 18 Maret 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.
¹³ Tumpukan Baru. "NVIDIA Meluncurkan Arsitektur Rubin dan Feynman Generasi Terbaru, Mendorong Batas Kekuatan AI." 14 April 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.
¹⁴ NVIDIA Newsroom. "NVIDIA Memperkenalkan Rubin CPX: Kelas Baru GPU yang Dirancang untuk Inferensi Konteks Masif."
¹⁵ Dinamika Pusat Data. "Rak Nvidia Rubin Ultra NVL576 diharapkan menjadi 600kW, akan hadir pada paruh kedua tahun 2027." 18 Maret 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.
¹⁶ Tom's Hardware. "Nvidia memamerkan Rubin Ultra dengan rak dan infrastruktur Kyber 600.000 Watt, yang akan hadir pada tahun 2027." 19 Maret 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.
¹⁷ Dinamika Pusat Data. "GTC: Jensen Huang, Ian Buck, dan Charlie Boyle dari Nvidia tentang masa depan kepadatan rak pusat data."
¹⁸ Perbatasan Pusat Data. "CoolIT dan Accelsius Mendorong Batas Pendinginan Cairan Pusat Data di Tengah Kepadatan Rak yang Melonjak." 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.
¹⁹ Dinamika Pusat Data. "GTC: Jensen Huang, Ian Buck, dan Charlie Boyle dari Nvidia tentang masa depan kepadatan rak pusat data."
²⁰ Blog Teknis NVIDIA. "Arsitektur NVIDIA 800 VDC Akan Memberi Tenaga pada Pabrik AI Generasi Berikutnya." 20 Mei 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.
²¹ Ibid.
²² Ibid.
²³ Intro. "Wilayah Cakupan." Diakses 2025. https://introl.com/coverage-area.
²⁴ NVIDIA Newsroom. "NVIDIA Memperkenalkan Rubin CPX: Kelas Baru GPU yang Dirancang untuk Inferensi Konteks Masif."
²⁵ Ibid.
²⁶ Blog NVIDIA. "Superkomputer Singa Biru Akan Berjalan pada NVIDIA Vera Rubin." 10 Juni 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.
²⁷ Ibid.
²⁸ NVIDIA Newsroom. "NVIDIA Memperkenalkan Rubin CPX: Kelas Baru GPU yang Dirancang untuk Inferensi Konteks Masif."
²⁹ The Register. "CPU Vera Rubin Nvidia, kursus grafik GPU untuk rak 600kW."
³⁰ Pusat Data Center Global. "Rak 600kW Nvidia Telah Hadir (Apakah Infrastruktur Anda Sudah Siap?)." 23 Maret 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.
³¹ TechPowerUp. "NVIDIA Memperkenalkan CPU Vera dan GPU Rubin Ultra AI, Mengumumkan Arsitektur Feynman."
³² Dinamika Pusat Data. "GTC: Jensen Huang, Ian Buck, dan Charlie Boyle dari Nvidia tentang masa depan kepadatan rak pusat data."