Nvidia Perkenalkan Nemotron 3, Model AI Open-Source Super untuk Sistem AI Agentic

Apa yang akan Anda lakukan jika sumber daya kecerdasan buatan (AI) super canggih tersedia bagi Anda untuk diunduh dan dijalankan secara lokal? Nvidia memperkenalkan Nemotron 3 Super, model AI open-source yang memadukan kemampuan penalaran tingkat lanjut untuk menangani alur kerja agentic yang kompleks. Model hibrida ini dirancang untuk menyelesaikan tugas dengan akurasi tinggi, menjadikannya pilihan utama bagi banyak perusahaan AI.
Inovasi Terkini untuk Alur Kerja Agentic: Peluncuran Model AI Super Open-Source Nemotron 3 oleh Nvidia
Sebagai bagian dari keluarga Nemotron 3, Nemotron 3 Super saat ini disimpan di website Nvidia, platform Hugging Face, dan OpenRouter. Selain itu, model ini juga disampaikan ke Dell Enterprise Hub dan dioptimalkan untuk penempatan on-premise di Dell AI Factory.
Untuk masalah konteks dan biaya penalaran yang meningkat, model terbaru ini memberikan solusi. Model AI yang dikembangkan untuk alur kerja agentic cenderung menghasilkan jumlah token yang lebih banyak, karena interaksi setiap agen atau sub-agen memerlukan pengiriman konteks penuh. Demikian pula, mengeksekusi tugas-tugas yang kompleks memerlukan pemikiran multi-level, yang dapat secara signifikan meningkatkan biaya menjalankan model.
Selanjutnya, dengan arsitektur hibridanya, Nemotron 3 Super dilengkapi dengan total 120 miliar parameter dan 12 miliar parameter aktif. Model ini juga mendapatkan jendela konteks sebanyak satu juta token, yang memungkinkan agen mempertahankan memori alur kerja penuh. Selain itu, pengembangannya juga memanfaatkan teknik yang disebut Latent MoE, yang meningkatkan akurasi dengan mengaktifkan empat ahli dengan biaya satu untuk menghasilkan token berikutnya pada inferensi.
Di sisi lain, perusahaan ini mengatakan bahwa mereka merilis model open-source dengan bobot terbuka di bawah lisensi yang permissive. Mengenai dataset dan pelatihan, perusahaan mengatakan bahwa Nemotron 3 Super dilatih pada data sintetis yang dihasilkan menggunakan model penalaran frontier. Nvidia mengatakan mereka akan menerbitkan metodologi lengkap, termasuk lebih dari 10 triliun token atau dataset pra dan pasca pelatihan, 15 lingkungan pelatihan untuk reinforcement learning dan resep evaluasi.




