Süni intellektin təhlükəsizliyi və effektivliyini yoxlayan yüzlərlə testdə qüsurlar aşkarlandı
Alimlər süni intellektin təhlükəsizliyini və effektivliyini qiymətləndirmək üçün aparılan 445 testin nəticələrinin etibarlılığını şübhə altına alan ciddi qüsurlar müəyyən ediblər.
Böyük Britaniyanın Süni İntellekt Təhlükəsizliyi İnstitutu ilə Stanford, Berkeley və Oksford universitetlərinin də daxil olduğu 14 qurumdan 29 tədqiqatçı “Vacib Olanı Ölçmək: Böyük Dil Modellərinin Qiymətləndirilməsində Struktur Etibarlılığı” adlı bir araşdırma aparıb.
Tədqiqatçılar süni intellektin alt sahələri olan təbii dilin işlənməsi (NLP) və maşın öyrənməsi istiqamətlərində aparılan, sahənin aparıcı konfranslarından toplanmış 445 qiymətləndirmə testini sistematik şəkildə analiz ediblər.
Araşdırma nəticəsində məlum olub ki, bu testlərin demək olar hamısı nəticələrin doğruluğunu və etibarlılığını zədələyə biləcək nöqsanlara malikdir.
Araşdırmanın əsas müəllifi, Oksford İnternet İnstitutunun əməkdaşı Endryu Bin The Guardian qəzetinə açıqlamasında bildirib ki, bu testlər böyük texnologiya şirkətlərinin bazara çıxardığı ən son süni intellekt modellərinin qiymətləndirilməsində əsas alət kimi istifadə olunur.
Bin vurğulayıb ki, bu qiymətləndirmə sistemləri süni intellektlə bağlı bütün iddiaların təməlini təşkil edir:
“Əgər ortaq anlayışlar və sağlam ölçmə mexanizmləri yoxdursa, modellərin həqiqətən inkişaf edib-etmədiyini anlamaq getdikcə çətinləşir”.

