Bisnis

Meta’s Yann Lecun mengatakan model AI saat ini tidak memiliki 4 ciri -ciri manusia utama

Apa kesamaan yang dimiliki semua makhluk cerdas? Empat hal, menurut Kepala Ilmuwan AI Meta, Yann Lecun.

Pada KTT Aksi AI di Paris awal tahun ini, para pemimpin politik dan pakar AI berkumpul untuk membahas pembangunan AI. Lecun berbagi definisi dasar tentang kecerdasannya dengan pemimpin AI IBM, Anthony Annunziata.

“Ada empat karakteristik penting dari perilaku cerdas yang dapat dilakukan oleh setiap hewan, atau hewan yang relatif pintar, dan tentu saja manusia,” katanya. “Memahami dunia fisik, memiliki ingatan yang gigih, mampu bernalar, dan mampu merencanakan, dan merencanakan tindakan yang kompleks, khususnya perencanaan secara hierarkis.”

Lecun mengatakan AI, terutama model bahasa besar, belum mencapai ambang ini, dan menggabungkan kemampuan ini akan membutuhkan pergeseran dalam cara mereka dilatih. Itulah sebabnya banyak perusahaan teknologi terbesar adalah kemampuan berbatu ke model yang ada dalam perlombaan mereka untuk mendominasi permainan AI, katanya.

“Untuk memahami dunia fisik, yah, Anda melatih sistem penglihatan yang terpisah. Dan kemudian Anda mengikatnya di LLM. Untuk memori, Anda tahu, Anda menggunakan Rag, atau Anda mengarahkan beberapa memori asosiatif di atasnya, atau Anda hanya membuat model Anda lebih besar,” katanya. Rag, yang merupakan singkatan dari pengambilan generasi augmented, adalah cara untuk meningkatkan output model bahasa besar menggunakan sumber pengetahuan eksternal. Dikembangkan di meta.

Namun, semua itu hanyalah “peretasan,” kata Lecun.

Lecun telah berbicara dalam beberapa kesempatan tentang alternatif yang ia sebut model berbasis dunia. Ini adalah model yang dilatih pada skenario kehidupan nyata dan memiliki tingkat kognisi yang lebih tinggi daripada AI berbasis pola. Lecun, dalam obrolannya dengan Annunziata, menawarkan definisi lain.

“Anda memiliki beberapa gagasan tentang keadaan dunia pada saat itu, Anda membayangkan tindakan yang mungkin diambil, model dunia memprediksi seperti apa keadaan dunia dari tindakan yang Anda lakukan,” katanya.

Namun, katanya, dunia berkembang menurut serangkaian kemungkinan yang tak terbatas dan tidak dapat diprediksi, dan satu -satunya cara untuk melatih bagi mereka adalah melalui abstraksi.

Meta sudah bereksperimen dengan ini melalui V-jepa, model yang dirilisnya ke publik pada bulan Februari. Meta menggambarkannya sebagai model non-generatif yang belajar dengan memprediksi bagian video yang hilang atau bertopeng.

“Ide dasarnya adalah Anda tidak memprediksi di tingkat piksel. Anda melatih sistem untuk menjalankan representasi abstrak dari video sehingga Anda dapat membuat prediksi dalam representasi abstrak itu, dan mudah -mudahan representasi ini akan menghilangkan semua detail yang tidak dapat diprediksi,” katanya.

Konsep ini mirip dengan bagaimana ahli kimia membentuk hierarki mendasar untuk blok pembangunan materi.

“Kami membuat abstraksi. Partikel, di atas ini, atom, di atas ini, molekul, di atas ini, bahan,” katanya. “Setiap kali kami naik satu lapisan, kami menghilangkan banyak informasi tentang lapisan di bawah ini yang tidak relevan untuk jenis tugas yang tertarik untuk kami lakukan.”

Itu, pada dasarnya, adalah cara lain untuk mengatakan bahwa kita telah belajar untuk memahami dunia fisik dengan menciptakan hierarki.



Sumber

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button