Jakarta, CNN Indonesia —
Google resmi merilis model kecerdasan buatan (AI) terbaru mereka, Gemini 2.0 pada Rabu (11/12). Apa saja kecanggihannya?
Gemini 2.0 Flash tersedia dalam versi chatbot untuk pengguna di seluruh dunia. Sementara, versi eksperimental multimodal dari model ini, yang hadir dengan fitur text-to-speech dan pembuat gambar, tersedia hanya untuk para developer.
“Ini adalah model andalan kami, model dengan latensi rendah dan performa lebih baik dalam skala besar, menggunakan teknologi tercanggih kami,” kata Google dalam keterangan resmi yang diterima CNNIndonesia.com, Kamis (12/12).
Google mengklaim, dengan model baru ini, pengguna dapat merasakan bahkan lebih banyak manfaat dari Gemini. Perusahaan mengatakan awal tahun depan, mereka akan menambahkan Gemini 2.0 ke lebih banyak produk Google.
Tidak hanya itu, menurut perusahaan kemampuan penalaran Gemini 2.0 akan membantu AI Overviews menangani topik dan pertanyaan yang lebih kompleks, termasuk persamaan matetika tingkat lanjut, kueri multimodal, dan pengkodean.
Google mengungkap pihaknya akan memberikan pembaruan ini secara luas mulai tahun depan, “sambil terus membawa AI Overviews ke lebih banyak negara. Pengujian dimulai minggu ini”.
Gemini 2.0 juga akan diterapkan di seluruh prototipe penelitian agen Google, seperti Project Astra, sebuah prototipe riset Google yang menjajaki kapabilitas mendatang dari asisten AI universal, Project Mariner, yang mengeksplorasi masa depan interaksi antara manusia dan agentic AI, dimulai dari browser; serta Jules, sebuah agentic kode berteknologi AI yang dapat membantu para developer.
“Google juga mengeksplorasi penerapan agen ke lebih banyak domain seperti video game dan robotik. Saat mengembangkan teknologi baru ini, Google mengambil pendekatan pengembangan yang eksploratif dan bertahap,” ujar Google.
Selain mendukung input multimodal seperti gambar, video, dan audio, Gemini 2.0 Flash kini turut mendukung output multimodal seperti kombinasi teks dan gambar yang dihasilkan secara native serta audio multibahasa text-to-speech yang dapat dikendalikan.
Gemini 2.0 Flash juga mampu secara native memanggil alat seperti Google Search, eksekusi kode, serta fungsi yang ditentukan pengguna pihak ketiga.
“Tujuan kami adalah menyediakan model kami bagi publik secara aman dan cepat. Bulan lalu, kami telah membagikan versi eksperimental awal Gemini 2.0 dan mendapatkan masukan-masukan bagus dari para developer,” kata perusahaan.
Google menambahkan Gemini 2.0 Flash sekarang juga tersedia sebagai model eksperimental bagi para developer melalui Gemini API di Google AI Studio dan Vertex AI
Untuk membantu developer membuat aplikasi dinamis dan interaktif, Google juga merilis Multimodal Live API baru yang memiliki audio real-time, input streaming video, serta kemampuan untuk menggunakan alat kombinasi.
(tim/dmi)
[Gambas:Video CNN]