Dolar 35,6654
Euro 37,3974
Altın 3.174,43
BİST 10.104,85
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul 11°C
Hafif Yağmurlu
İstanbul
11°C
Hafif Yağmurlu
Pts 13°C
Sal 16°C
Çar 16°C
Per 15°C

Yapay zeka bunadı mı? Bilişsel testte sınıfta kaldı!

Bilim insanları tarafından yapılan yeni bir araştırmada, insanlar üzerinde erken bunamayı test etmek için kullanılan bilişsel testler yapay zeka modelleri üzerinde denendi. Yapay zeka teknolojilerinin testlerde beklenmedik şekilde bilişsel zayıflık sergilediği ortaya konuldu.

Yapay zeka bunadı mı? Bilişsel testte sınıfta kaldı!
19 Aralık 2024 1:06 AM
41

Yapay zekanın bilişsel yetenekleri ne kadar gelişmiş? Son yapılan bir araştırma, Montreal Bilişsel Değerlendirme Testi ile bu sorunun yanıtını aradı.

MONTREAL BİLİŞSEL DEĞERLENDİRME TESTİ

The BMJ dergisinde yayımlanan çalışmaya göre, popüler yapay zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Bilişsel Değerlendirme Testi (MoCA) üzerinde değerlendirildi. Bu test, dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler gibi bilişsel yetileri ölçmek için kullanılıyor.

TEST SONUÇLARI

ChatGPT 4o: 30 üzerinden 26 puanla en yüksek skor.

ChatGPT 4 ve Claude: 30 üzerinden 25 puan.

Gemini 1.0: 30 üzerinden sadece 16 puanla en düşük skor.

ESKİ MODELLERDE PERFORMANS DAHA DÜŞÜK

Araştırma, tıpkı yaşlanan insanlar gibi, eski yapay zeka modellerinin de testlerde daha düşük performans gösterdiğini ortaya koydu. Bu bulgular, yapay zekanın yakın zamanda insan doktorlarının yerini alabileceği yönündeki düşünceye şüpheyle yaklaşılması gerektiğini gösteriyor.

Tüm modeller, sayı ve harfleri sıralama gibi yol izleme görevlerinde ve saat çizme testlerinde düşük performans gösterdi.
Ayrıca Gemini modelleri, beş kelimelik bir diziyi hatırlama gibi gecikmeli hatırlama görevlerinde başarısız oldu. Buna karşın, adlandırma, dikkat, dil ve soyutlama gibi alanlarda tüm sohbet robotları başarılı bir performans sergiledi.

YAPAY ZEKA VE TIP

Son yıllarda yapay zekanın tıpta kullanılması konusundaki heyecan, bu çalışmayla yeni bir tartışma boyutuna taşındı. Daha önceki çalışmalar, büyük dil modellerinin tıbbi teşhislerde başarılı olduklarını ortaya koysa da, bilişsel bozukluklar gibi insan benzeri zaaflarının derinlemesine incelenmediği vurgulanıyor.

YORUMLAR

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.