Page 56 - Sinerji s53_ES_HD_YEPYENİ_WEB
P. 56

teknoloji




                                              Yapay zeka bunadı mı?



                                              Bilişsel testte




                                              sınıfta kaldı!




















                                                                                                                                                Bilim insanları tarafından yapılan yeni bir araştırmada, insanlar üzerinde erken bunamayı
                                                                                                                                                test etmek için kullanılan bilişsel testler yapay zeka modelleri üzerinde denendi. Yapay zeka
                                                                                                                                                teknolojilerinin testlerde beklenmedik şekilde bilişsel zayıflık sergilediği ortaya konuldu.



                                                                                                                                            Yapay zekanın bilişsel yetenekleri ne kadar gelişmiş? Son yapılan   Tüm modeller, sayı ve harfleri sıralama gibi yol izleme görevlerin-
                                                                                                                                            bir araştırma, Montreal Bilişsel Değerlendirme Testi ile bu soru-  de ve saat çizme testlerinde düşük performans gösterdi.
                                                                                                                                            nun yanıtını aradı.
                                                                                                                                                                                              Ayrıca Gemini modelleri, beş kelimelik bir diziyi hatırlama gibi
                                                                                                                                                                                              gecikmeli hatırlama görevlerinde başarısız oldu. Buna karşın,
                                                                                                                                                        MONTREAL BİLİŞSEL                     adlandırma, dikkat, dil ve soyutlama gibi alanlarda tüm sohbet
                                                                                                                                                       DEĞERLENDİRME TESTİ                    robotları başarılı bir performans sergiledi.
                                                                                                                                            The BMJ dergisinde yayımlanan çalışmaya göre, popüler yapay
                                                                                                                                            zeka modelleri ChatGPT 4, Claude 3.5 ve Gemini, Montreal Biliş-  YAPAY ZEKA VE TIP
                                                                                                                                            sel Değerlendirme Testi (MoCA) üzerinde değerlendirildi. Bu test,   Son yıllarda yapay zekanın tıpta kullanılması konusundaki heye-
                                                                                                                                            dikkat, hafıza, dil, görsel-uzamsal beceriler ve yürütücü işlevler   can, bu çalışmayla yeni bir tartışma boyutuna taşındı. Daha ön-
                                                                                                                                            gibi bilişsel yetileri ölçmek için kullanılıyor.
                                                                                                                                                                                              ceki çalışmalar, büyük dil modellerinin tıbbi teşhislerde başarılı
                                                                                                                                                                                              olduklarını ortaya koysa da, bilişsel bozukluklar gibi insan benzeri
                                                                                                                                                          TEST SONUÇLARI                      zaaflarının derinlemesine incelenmediği vurgulanıyor.
                                                                                                                                            ChatGPT 4o: 30 üzerinden 26 puanla en yüksek skor.
                                                                                                                                            ChatGPT 4 ve Claude: 30 üzerinden 25 puan.
                                                                                                                                            Gemini 1.0: 30 üzerinden sadece 16 puanla en düşük skor.

                                                                                                                                                         ESKİ MODELLERDE
                                                                                                                                                    PERFORMANS DAHA DÜŞÜK
                                                                                                                                            Araştırma, tıpkı yaşlanan insanlar gibi, eski yapay zeka model-
                                                                                                                                            lerinin de testlerde daha düşük performans gösterdiğini ortaya
                                                                                                                                            koydu. Bu bulgular, yapay zekanın yakın zamanda insan doktor-
                                                                                                                                            larının yerini alabileceği yönündeki düşünceye şüpheyle yaklaşıl-
                                                                                                                                            ması gerektiğini gösteriyor.





       54  BOSİAD SİNERJİ / Ocak 2025                                                                                                                                                                                                   BOSİAD SİNERJİ / Ocak 2025  55
   51   52   53   54   55   56   57   58   59   60   61