Pembaruan Terkini Google Gemini 3: Lebih Unggul dari GPT-5.2 dan Claude Opus 4.6

1 hari ago

5 1 minute read

Apakah Anda pernah mendengar bahwa Google’s Updated Gemini 3 kini dikenal sebagai model AI paling canggih? Pada hari Kamis, Google merilis pembaruan besar untuk Gemini 3, model AI Deep Think mereka yang sudah sangat pintar sejak diluncurkan pada Desember 2025. Pembaruan ini tidak hanya meningkatkan performa di semua tolok ukur utama, tetapi juga menciptakan rekor baru dalam ARC-AGI-2 dan Ujian Terakhir Manusia, mengungguli OpenAI’s GPT-5.2 dan Claude Opus 4.6 dari Anthropic.

Baca juga: MediaTek Akan Menampilkan Inovasi 6G, 5G-Advanced, dan Edge AI di Pameran ‘AI untuk Kehidupan’ di MWC 2026

Peningkatan Signifikan pada Gemini 3 Deep Think Google

Dalam sebuah postingan blog, raksasa teknologi tersebut mengungkapkan bahwa mereka merilis pembaruan besar untuk Gemini 3 Deep Think yang akan memungkinkannya untuk menyelesaikan tantangan modern di bidang sains, penelitian, dan teknik. Model ini terus tersedia untuk pelanggan Google AI Ultra, tetapi sekarang, sekelompok peneliti dan perusahaan terpilih juga dapat mengaksesnya melalui antarmuka pemrograman aplikasi (API) perusahaan.

Selanjutnya, dalam pengumuman pembaruan tersebut, CEO Google Sundar Pichai mengatakan, “Gemini 3 Deep Think mendapatkan peningkatan yang signifikan. Kami telah menyempurnakan Deep Think dalam kemitraan erat dengan para ilmuwan dan peneliti untuk mengatasi tantangan nyata di dunia.” Elon Musk menyebut perkembangan ini “Mengesankan,” dalam responsnya terhadap postingan tersebut.

Di sisi lain, dengan peningkatan ini, diklaim bahwa model AI ini telah mencetak skor 84,6 persen pada tes ARC-AGI-2, yang mengukur kemampuan penalaran model-model unggulan. Google mengklaim bahwa skor tersebut juga telah diverifikasi oleh ARC Prize Foundation. Ini juga mencetak rekor baru dengan mencetak 48,4 persen (tanpa alat) pada Ujian Terakhir Manusia, yang dikenal sebagai tes benchmark paling sulit yang ada.

Namun demikian, perusahaan juga mengklaim bahwa Gemini 3 Deep Think juga mencapai skor Elo 3.455 di Codeforces. Dalam setiap tes ini, dikatakan bahwa model Google berhasil mengungguli model-model unggulan dari OpenAI dan Anthropic.

Bagian berikutnya, Google juga membagikan bagaimana beberapa peneliti menggunakan model AI ini dalam masalah ilmiah dunia nyata. Google menyoroti bahwa Lisa Carbone, seorang matematikawan di Universitas Rutgers, menggunakan Gemini 3 Deep Think untuk meninjau sebuah jurnal matematika yang sangat teknis. Ia mengamati bahwa model ini berhasil mengidentifikasi kelemahan logis halus yang sebelumnya lewat dari tinjauan sejawat manusia tanpa terdeteksi.