Süni intellektin təhlükəsizliyi və effektivliyini yoxlayan yüzlərlə testdə qüsurlar aşkarlandı

16:09 / 04.11.2025

Alimlər süni intellektin təhlükəsizliyini və effektivliyini qiymətləndirmək üçün aparılan 445 testin nəticələrinin etibarlılığını şübhə altına alan ciddi qüsurlar müəyyən ediblər.

Böyük Britaniyanın Süni İntellekt Təhlükəsizliyi İnstitutu ilə Stanford, Berkeley və Oksford universitetlərinin də daxil olduğu 14 qurumdan 29 tədqiqatçı “Vacib Olanı Ölçmək: Böyük Dil Modellərinin Qiymətləndirilməsində Struktur Etibarlılığı” adlı bir araşdırma aparıb.

Tədqiqatçılar süni intellektin alt sahələri olan təbii dilin işlənməsi (NLP) və maşın öyrənməsi istiqamətlərində aparılan, sahənin aparıcı konfranslarından toplanmış 445 qiymətləndirmə testini sistematik şəkildə analiz ediblər.

Araşdırma nəticəsində məlum olub ki, bu testlərin demək olar hamısı nəticələrin doğruluğunu və etibarlılığını zədələyə biləcək nöqsanlara malikdir.

Araşdırmanın əsas müəllifi, Oksford İnternet İnstitutunun əməkdaşı Endryu Bin The Guardian qəzetinə açıqlamasında bildirib ki, bu testlər böyük texnologiya şirkətlərinin bazara çıxardığı ən son süni intellekt modellərinin qiymətləndirilməsində əsas alət kimi istifadə olunur.

Bin vurğulayıb ki, bu qiymətləndirmə sistemləri süni intellektlə bağlı bütün iddiaların təməlini təşkil edir:

“Əgər ortaq anlayışlar və sağlam ölçmə mexanizmləri yoxdursa, modellərin həqiqətən inkişaf edib-etmədiyini anlamaq getdikcə çətinləşir”.

AFN.az
Redaksiyamızla əlaqə: tel; 070 372 99 90, E-mail:office@afn.az

Diqqətinizi çəkə biləcək digər xəbərlər

Süni intellektin təhlükəsizliyi və effektivliyini yoxlayan yüzlərlə testdə qüsurlar aşkarlandı

"Google" silahlarda süni intellektdən istifadə öhdəliyini geri götürüb

ABŞ-dan süni intellekt hesabatı -

Süni intellektlə yazılan xəbərləri başa düşmək daha çətindir

BDU-da süni intellektin psixoterapiyada tətbiq imkanları müzakirə olunub

Süni intellekt strategiyası qarşıya 13 əsas məqsəd qoyub