Page 57 - Sinerji s53_ES_HD_YEPYENİ_WEB
P. 57

teknoloji




 Yapay zeka bunadı mı?



 Bilişsel testte




 sınıfta kaldı!




















                    Bilim insanları tarafından yapılan yeni bir araştırmada, insanlar üzerinde erken bunamayı
                    test etmek için kullanılan bilişsel testler yapay zeka modelleri üzerinde denendi. Yapay zeka
                    teknolojilerinin testlerde beklenmedik şekilde bilişsel zayıflık sergilediği ortaya konuldu.



                Yapay zekanın bilişsel yetenekleri ne kadar gelişmiş? Son yapılan   Tüm modeller, sayı ve harfleri sıralama gibi yol izleme görevlerin-
                bir araştırma, Montreal Bilişsel Değerlendirme Testi ile bu soru-  de ve saat çizme testlerinde düşük performans gösterdi.
                nun yanıtını aradı.
                                                                 Ayrıca Gemini modelleri, beş kelimelik bir diziyi hatırlama gibi
                                                                 gecikmeli hatırlama görevlerinde başarısız oldu. Buna karşın,
                           MONTREAL BİLİŞSEL                     adlandırma, dikkat, dil ve soyutlama gibi alanlarda tüm sohbet
                          DEĞERLENDİRME TESTİ                    robotları başarılı bir performans sergiledi.
                The BMJ dergisinde yayımlanan çalışmaya göre, popüler yapay
                zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Biliş-  YAPAY ZEKA VE TIP
                sel Değerlendirme Testi (MoCA) üzerinde değerlendirildi. Bu test,   Son yıllarda yapay zekanın tıpta kullanılması konusundaki heye-
                dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler   can, bu çalışmayla yeni bir tartışma boyutuna taşındı. Daha ön-
                gibi bilişsel yetileri ölçmek için kullanılıyor.
                                                                 ceki çalışmalar, büyük dil modellerinin tıbbi teşhislerde başarılı
                                                                 olduklarını ortaya koysa da, bilişsel bozukluklar gibi insan benzeri
                             TEST SONUÇLARI                      zaaflarının derinlemesine incelenmediği vurgulanıyor.
                ChatGPT 4o: 30 üzerinden 26 puanla en yüksek skor.
                ChatGPT 4 ve Claude: 30 üzerinden 25 puan.
                Gemini 1.0: 30 üzerinden sadece 16 puanla en düşük skor.

                            ESKİ MODELLERDE
                        PERFORMANS DAHA DÜŞÜK
                Araştırma, tıpkı yaşlanan insanlar gibi, eski yapay zeka model-
                lerinin de testlerde daha düşük performans gösterdiğini ortaya
                koydu. Bu bulgular, yapay zekanın yakın zamanda insan doktor-
                larının yerini alabileceği yönündeki düşünceye şüpheyle yaklaşıl-
                ması gerektiğini gösteriyor.





 54  BOSİAD SİNERJİ / Ocak 2025                                                                             BOSİAD SİNERJİ / Ocak 2025  55
   52   53   54   55   56   57   58   59   60   61   62