Harianjogja.com, JOGJA— Perkembangan kecerdasan buatan (AI) menunjukkan lonjakan signifikan setelah sejumlah model terbaru mencetak skor tinggi dalam pengujian IQ berbasis pola visual. Hasil uji ini menempatkan AI pada level yang hampir setara dengan manusia kategori jenius.
Dilansir dari Visual Capiltalist, platform pengujian independen Tracking AI menguji 26 model AI menggunakan standar Mensa Norway IQ Test pada April 2026. Hasilnya kemudian divisualisasikan oleh Visual Capitalist.
Dua model menempati posisi teratas dengan skor identik 145, yakni Grok-4.20 Expert Mode dari xAI dan GPT-5.4 Pro (Vision) dari OpenAI. Skor ini hanya terpaut satu poin dari angka maksimum 146 yang biasanya dicapai oleh kelompok manusia paling jenius.
Di posisi ketiga, Gemini 3.1 Pro Preview dari Google mencatat skor 141. Hasil ini menunjukkan kemampuan penalaran pola AI kini setara dengan sekitar 2% populasi manusia dengan IQ tertinggi.
Model AI dari China juga menunjukkan perkembangan pesat. Qwen 3.5 dari Alibaba menempati peringkat ke-10 dengan skor 130. Sementara DeepSeek R1 dan DeepSeek V3 berada di posisi 14 dan 15 dengan skor masing-masing 112 dan 111.
Pencapaian ini meningkat dibandingkan tahun sebelumnya, ketika skor tertinggi hanya mencapai 135. Namun, pengujian ini memiliki keterbatasan karena hanya mengukur kemampuan mengenali pola, bukan aspek lain seperti kreativitas, empati, atau kebijaksanaan.
Metode pengujian dilakukan dengan 35 teka-teki pola visual. Model berbasis visual diuji menggunakan gambar langsung, sedangkan model non-visual diberikan deskripsi verbal. Jika model menolak menjawab, pertanyaan diulang hingga 10 kali.
Meski hasilnya impresif, para ahli menegaskan bahwa skor IQ bukan ukuran tunggal kecerdasan. AI memang semakin unggul dalam logika dan analisis, tetapi belum mampu sepenuhnya menandingi kompleksitas kecerdasan manusia yang mencakup etika, intuisi, dan nilai-nilai sosial.
Dengan demikian, lonjakan kemampuan AI ini lebih tepat dilihat sebagai alat bantu yang semakin canggih, bukan pengganti peran manusia secara menyeluruh.
Berikut daftar lengkap 26 model dalam pengujian (skor):
- Grok-4.20 Expert Mode (145)
- OpenAI GPT-5.4 Pro (Vision) (145)
- Gemini 3.1 Pro Preview (141)
- OpenAI GPT-5.4 Thinking (Vision) (139)
- OpenAI GPT-5.3 (136)
- Grok-4.20 Expert Mode (Vision) (133)
- OpenAI GPT-5.4 Thinking (133)
- Meta Muse Spark (133)
- Gemini 3.1 Pro Preview (Vision) (132)
- Qwen 3.5 (130)
- Claude 4.6 Opus (130)
- Kimi K2.5 (127)
- Manus (115)
- DeepSeek R1 (112)
- DeepSeek V3 (111)
- Gemini 3.1 Flash (110)
- Llama 4 Maverick (110)
- GPT-5.3 (Vision) (109)
- Claude 4.6 Sonnet (106)
- Bing Copilot (101)
- Perplexity (97)
- Mistral Medium 3.1 (96)
- Claude 4.6 Sonnet (Vision) (94)
- Claude 4.6 Opus (Vision) (82)
- Llama 4 Maverick (Vision) (79)
- GPT-5.4 Pro (non-vision) (73)**
Cek Berita dan Artikel yang lain di Harian Jogja, dan edisi cetak versi elektronik kami hadir di Epaper Harian Jogja.


















































