Page 57 - Sinerji s53_ES_HD_YEPYENİ_WEB
P. 57
teknoloji
Yapay zeka bunadı mı?
Bilişsel testte
sınıfta kaldı!
Bilim insanları tarafından yapılan yeni bir araştırmada, insanlar üzerinde erken bunamayı
test etmek için kullanılan bilişsel testler yapay zeka modelleri üzerinde denendi. Yapay zeka
teknolojilerinin testlerde beklenmedik şekilde bilişsel zayıflık sergilediği ortaya konuldu.
Yapay zekanın bilişsel yetenekleri ne kadar gelişmiş? Son yapılan Tüm modeller, sayı ve harfleri sıralama gibi yol izleme görevlerin-
bir araştırma, Montreal Bilişsel Değerlendirme Testi ile bu soru- de ve saat çizme testlerinde düşük performans gösterdi.
nun yanıtını aradı.
Ayrıca Gemini modelleri, beş kelimelik bir diziyi hatırlama gibi
gecikmeli hatırlama görevlerinde başarısız oldu. Buna karşın,
MONTREAL BİLİŞSEL adlandırma, dikkat, dil ve soyutlama gibi alanlarda tüm sohbet
DEĞERLENDİRME TESTİ robotları başarılı bir performans sergiledi.
The BMJ dergisinde yayımlanan çalışmaya göre, popüler yapay
zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Biliş- YAPAY ZEKA VE TIP
sel Değerlendirme Testi (MoCA) üzerinde değerlendirildi. Bu test, Son yıllarda yapay zekanın tıpta kullanılması konusundaki heye-
dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler can, bu çalışmayla yeni bir tartışma boyutuna taşındı. Daha ön-
gibi bilişsel yetileri ölçmek için kullanılıyor.
ceki çalışmalar, büyük dil modellerinin tıbbi teşhislerde başarılı
olduklarını ortaya koysa da, bilişsel bozukluklar gibi insan benzeri
TEST SONUÇLARI zaaflarının derinlemesine incelenmediği vurgulanıyor.
ChatGPT 4o: 30 üzerinden 26 puanla en yüksek skor.
ChatGPT 4 ve Claude: 30 üzerinden 25 puan.
Gemini 1.0: 30 üzerinden sadece 16 puanla en düşük skor.
ESKİ MODELLERDE
PERFORMANS DAHA DÜŞÜK
Araştırma, tıpkı yaşlanan insanlar gibi, eski yapay zeka model-
lerinin de testlerde daha düşük performans gösterdiğini ortaya
koydu. Bu bulgular, yapay zekanın yakın zamanda insan doktor-
larının yerini alabileceği yönündeki düşünceye şüpheyle yaklaşıl-
ması gerektiğini gösteriyor.
54 BOSİAD SİNERJİ / Ocak 2025 BOSİAD SİNERJİ / Ocak 2025 55