Cyfrowa demencja. Sztuczna inteligencja wykazuje oznaki pogorszenia funkcji poznawczych
Wiodące modele sztucznej inteligencji wykazują upośledzenie funkcji poznawczych podobne do wczesnych objawów demencji, ocenianych za pomocą testu MoCA.
Nowe badanie wykazało, że prawie wszystkie główne modele sztucznej inteligencji (AI), czyli „chatboty”, to wykazują objawy łagodnego upośledzenia funkcji poznawczych w przypadku testów stosowanych do wykrywania wczesnej demencji.
Według , naukowcy ocenili zdolności poznawcze głównego duże modele językowe (LLM) dostępne publicznie – ChatGPT wersje 4 i 4o (opracowane przez OpenAI), Claude 3.5 „Sonnet” (opracowane przez Anthropic) oraz Gemini wersje 1 i 1.5 (opracowane przez Alphabet) – za pomocą testu Montrealska ocena poznawcza (MoCA).
Test ten jest szeroko stosowany do wykrywania zaburzeń funkcji poznawczych i wczesnych objawów demencji, zwykle u osób starszych. Poprzez serię zadań i krótkich pytań ocenia możliwości jednostki, czyli uwagę, pamięć, język, zdolności wzrokowo-przestrzenne i funkcje wykonawcze.
Maksymalny wynik wynosi 30 punktów, a wynik 26 lub więcej jest ogólnie uważany za normalny.
W ocenie ChatGPT 4. uzyskał najwyższy wynik w teście MoCA (26 z 30), a następnie ChatGPT 4 i Claude (25 z 30). Najniższą notę (16 na 30) uzyskał Gemini 1.0.
Wszystkie chatboty wypadły słabo pod względem zdolności wzrokowo-przestrzenne i zadania wykonawcze, jak połączyć zakreślone w kółku cyfry i litery w kolejności rosnącej oraz test rysowania zegara. Modele Gemini nie zdały zadania opóźnionego przypominania (zapamiętywanie sekwencji pięciu słów).
W kolejnych testach wzrokowo-przestrzennych chatboty nie wykazał empatii ani nie trafnie zinterpretował złożone sceny wizualne.
Oprócz tego, że odkrycia te mają jedynie charakter obserwacyjny, należy wziąć pod uwagę, że istnieje wiele różnic między ludzkim mózgiem a wspaniałymi modelami językowymi.
Zespół zwraca jednak uwagę, że wszystkie główne modele językowe ponoszą jednolitą porażkę w zadaniach wymagających abstrakcja wizualna i funkcja wykonawcza on może uniemożliwić jego użycie w warunkach klinicznych.
Artykuł naukowy z wynikami ukazał się w czasopiśmie BMJ’a.