Teknologi

Hasil Tes IQ 26 Model AI April 2026: Grok dan GPT-5.4 Raih Skor 145

9
×

Hasil Tes IQ 26 Model AI April 2026: Grok dan GPT-5.4 Raih Skor 145

Sebarkan artikel ini
Tracking AI uji 26 model AI dengan tes IQ Mensa Norwegia April 2026. Grok-4.20 dan GPT-5.4 Pro raih 145, sementara Qwen 3.5 jadi model China tertinggi dengan skor 130.
Tracking AI uji 26 model AI dengan tes IQ Mensa Norwegia April 2026. Grok-4.20 dan GPT-5.4 Pro raih 145, sementara Qwen 3.5 jadi model China tertinggi dengan skor 130.

Grok dan GPT-5.4 Skor 145, Kalahkan 24 Model AI dalam Tes IQ Mensa Norwegia April 2026

XJABAR.COM – Dua model AI dari perusahaan berbeda — Grok 4.20 Expert Mode milik xAI dan OpenAI GPT 5.4 Pro (Vision) — meraih skor IQ tertinggi setara 145 dalam pengujian Tracking AI menggunakan tes Mensa Norwegia pada April 2026, mengungguli setidaknya 24 model lainnya dari berbagai perusahaan teknologi global.

Bagaimana Tracking AI Mengukur IQ Model AI?

Pengujian ini bukan survei opini atau benchmark internal perusahaan. Tracking AI adalah platform independen yang secara khusus menguji dan membandingkan performa berbagai model AI menggunakan metodologi terstandar.

Untuk edisi April 2026, platform ini menggunakan tes IQ Mensa Norwegia — instrumen pengukuran kecerdasan yang terdiri dari 35 teka-teki pola visual. Hasilnya kemudian divisualisasikan oleh Visual Capitalist, perusahaan media data independen yang dikenal lewat sajian infografis berbasis data.

Pengujian melibatkan setidaknya 26 model AI dari berbagai perusahaan dalam beberapa variannya — mencakup model teks murni maupun model multimodal yang mendukung input gambar.

Ada perbedaan metode penting antara dua kategori ini. Model non-vision menerima soal yang sudah dikonversi menjadi deskripsi verbal sebelum dijawab. Model vision mengerjakan soal langsung dalam bentuk gambar asli tanpa modifikasi apapun. Perbedaan format ini berkontribusi pada perbedaan skor yang cukup signifikan di antara varian dari model yang sama.

Tracking AI juga menerapkan aturan khusus untuk menangani penolakan jawaban: jika sebuah model menolak menjawab pertanyaan, soal yang sama akan diulang hingga maksimal 10 kali, dan jawaban terakhir yang dijadikan penilaian akhir.

Dua Model Berbagi Puncak dengan Skor 145

Hasil pengujian menunjukkan persaingan yang sangat ketat di papan atas. Tidak ada satu model pun yang berdiri sendiri di posisi pertama — dua model dari perusahaan berbeda meraih skor identik.

Grok-4.20 Expert Mode dari xAI dan OpenAI GPT-5.4 Pro (Vision) sama-sama meraih skor 145, sehingga Visual Capitalist menempatkan keduanya di posisi pertama secara bersamaan.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *