‘Godfather of Ai’ mengatakan dia mempercayai chatgpt-4 lebih dari yang seharusnya

Muchsin Fajri Mei 19, 2025

0 0 1 minute read

Ayah baptis AI mengatakan dia terlalu mempercayai chatbot pilihannya.

“Saya cenderung percaya apa yang dikatakannya, meskipun saya mungkin harus mencurigakan,” Geoffrey Hinton, yang dianugerahi Hadiah Nobel 2024 dalam Fisika atas terobosannya dalam Pembelajaran Mesin, mengatakan tentang GPT-4 Openai dalam wawancara CBS yang ditayangkan Sabtu.

Selama wawancara, dia Letakkan teka-teki sederhana untuk Openai’s GPT-4, yang katanya dia gunakan untuk tugasnya sehari-hari.

“Sally memiliki tiga saudara lelaki. Masing -masing saudara lelakinya memiliki dua saudara perempuan. Berapa banyak saudara perempuan yang dimiliki Sally?”

Jawabannya adalah satu, karena Sally adalah salah satu dari dua saudara perempuan. Tapi Hinton mengatakan GPT-4 mengatakan kepadanya jawabannya dua.

“Itu mengejutkan saya. Itu mengejutkan saya masih mengacaukannya,” katanya.

Merefleksikan batas -batas AI saat ini, ia menambahkan: “Ini ahli dalam segala hal. Ini bukan ahli yang sangat baik dalam segala hal.”

Hinton mengatakan dia mengharapkan model masa depan akan lebih baik. Ketika ditanya apakah dia pikir GPT-5 akan memperbaiki teka-teki itu, Hinton menjawab, “Ya, saya curiga.”

Teka -teki Hinton tidak membuat setiap versi chatgpt. Setelah wawancara ditayangkan, beberapa orang berkomentar di media sosial bahwa mereka mencoba teka -teki pada model yang lebih baru – termasuk GPT-4O dan GPT-4.1 – –dan mengatakan AI melakukannya dengan benar.

Openai tidak segera menanggapi permintaan komentar dari Business Insider.

Openai pertama kali meluncurkan GPT-4 pada tahun 2023 sebagai model bahasa besar andalannya. Model ini dengan cepat menjadi tolok ukur industri karena kemampuannya lulus ujian sulit seperti ujian SAT, GRE, dan BAR.

Openai memperkenalkan GPT-4O-model default yang mendukung chatgpt-pada Mei 2024, mengklaim itu cocok dengan kecerdasan GPT-4 tetapi lebih cepat dan lebih fleksibel, dengan peningkatan kinerja di seluruh teks, suara, dan visi. Openai sejak itu merilis GPT-4.5 dan, yang terbaru, GPT-4.1.

Google Gemini 2.5-Pro berada di peringkat teratas oleh Chatbot Arena Leaderboard, platform yang bersumber dari kerumunan yang menempati peringkat model. GPT-4O dan GPT-4.5 Openai dekat.

Sebuah studi baru -baru ini oleh perusahaan pengujian AI Giskard menemukan bahwa memberi tahu chatbots untuk menjadi singkat dapat membuat mereka lebih mungkin untuk “berhalusinasi” atau membuat informasi.

Para peneliti menemukan bahwa model terkemuka-termasuk GPT-4O, Mistral, dan Claude-lebih rentan terhadap kesalahan faktual ketika diminta untuk jawaban yang lebih pendek.