Model AI Robotika Gemini Google mencapai dunia fisik

Mustakim Bakhtiar Maret 12, 2025

0 0 1 minute read

Dalam kisah sci-fi, kecerdasan buatan sering membuat semua jenis robot yang cerdas, mampu, dan kadang-kadang pembunuhan. Keterbatasan yang mengungkapkan dari AI terbaik hari ini adalah bahwa, untuk saat ini, ia tetap terjebak di dalam jendela obrolan.

Google DeepMind mengisyaratkan rencana untuk mengubah hari ini – mungkin dikurangi bagian pembunuhannya – dengan mengumumkan versi baru dari model AI Gemini yang memadukan bahasa, visi, dan tindakan fisik bersama -sama untuk menyalakan berbagai robot yang lebih mampu, adaptif, dan berpotensi berguna.

Dalam serangkaian video demonstrasi, perusahaan menunjukkan beberapa robot yang dilengkapi dengan model baru, yang disebut robotika Gemini, memanipulasi barang -barang sebagai tanggapan terhadap perintah lisan: robot lipat kertas, menyerahkan sayuran, dengan lembut memasukkan sepasang kacamata ke dalam kasing, dan menyelesaikan tugas lainnya. Robot bergantung pada model baru untuk menghubungkan item yang terlihat dengan tindakan yang mungkin untuk melakukan apa yang diperintahkan. Model ini dilatih dengan cara yang memungkinkan perilaku digeneralisasi di perangkat keras yang sangat berbeda.

Google DeepMind juga mengumumkan versi modelnya yang disebut Gemini Robotics-ER (untuk penalaran yang diwujudkan), yang hanya memiliki pemahaman visual dan spasial. Idenya adalah agar peneliti robot lain menggunakan model ini untuk melatih model mereka sendiri untuk mengendalikan tindakan robot.

Dalam demonstrasi video, para peneliti Google Deepmind menggunakan model untuk mengontrol robot humanoid yang disebut Apollo, dari startup Apptronik. Robot bercakap -cakap dengan manusia dan menggerakkan huruf di sekitar meja saat diperintahkan.

“Kami telah dapat membawa pemahaman dunia-pemahaman konsep umum-dari Gemini 2.0 ke robotika,” kata Kanishka Rao, seorang peneliti robotika di Google Deepmind yang memimpin pekerjaan itu, pada briefing sebelum pengumuman hari ini.

Google DeepMind mengatakan model baru ini dapat mengontrol robot yang berbeda dengan sukses dalam ratusan skenario spesifik yang sebelumnya tidak termasuk dalam pelatihan mereka. “Setelah model robot memiliki pemahaman konsep umum, itu menjadi jauh lebih umum dan bermanfaat,” kata Rao.

Terobosan yang memunculkan chatbots yang kuat, termasuk chatgpt Openai dan Google Gemini, dalam beberapa tahun terakhir ini meningkatkan harapan revolusi serupa dalam robotika, tetapi rintangan besar tetap ada.

Sumber

Mustakim Bakhtiar Maret 12, 2025

0 0 1 minute read