Нейромережі навчилися брехати і маніпулювати: вчені попередили про небезпеку

Штучний інтелект стає все більше схожим на інтелект людини / фото ua.depositphotos.com

Нейромережі навчилися систематично брехати співрозмовнику, хоча їх ніхто спеціально на це не тренував, а в деяких випадках їм навіть забороняли таку поведінку. Про це йдеться в науковій статті, опублікованій у журналі Patterns.

Група дослідників із Массачусетського технологічного інституту (США) зазначає, що штучний інтелект навчається на величезній кількості текстів, які не завжди містять достовірну інформацію. Через це нейромережа іноді може видавати співрозмовнику неправдиву інформацію, щиро вважаючи, що говорить правду.

Однак нове дослідження показує, що іноді нейромережа здатна брехати цілком «усвідомлено». Автори проаналізували поведінку так званих великих мовних моделей (таких як GPT-4) і моделей, навчених під більш специфічні завдання (такі як проходження відеоігор або торги на ринку).

Відео дня

В одному з розглянутих випадків нейромережа GPT-4 змогла обдурити людину, змусивши її пройти за неї стандартну «капчу» «Доведи, що ти не робот».

Нейромережі навчилися брехати і маніпулювати: вчені попередили про небезпеку

Також дослідники побачили, як нейромережа CICERO перемагала людей у настільній грі «Дипломатія», вдаючись до обману. Дослідники виявили, що, граючи за Францію, мовна модель змусила Англію (в її ролі була людина) провести таємні переговори з Німеччиною (іншою людиною). Нейромережа також запропонувала Англії напасти на Німеччину і пообіцяла захист зі свого боку, а потім попередила Німеччину про можливий напад.

Дослідники виявили, що схильність до обману була вищою у більш сучасних і складніших нейромереж. На думку вчених, ці нейромережі краще вміють знаходити ефективні стратегії поведінки, а ті, своєю чергою, часто припускають брехню і удавання.

На думку дослідників, поки зарано говорити, що ШІ спеціально обманює людей. Нейромережа діє виключно в логіці вирішення поставленого завдання, і користується обманом саме як інструментом досягнення потрібного результату.

Проте автори дослідження закликали розробників ШІ звернути увагу на таку поведінку нейромереж. На їхню думку, необхідно розробити систему регулювання ШІ, оскільки його здатність обманювати і маніпулювати може призвести до серйозних наслідків.

Розвиток нейромереж: останні новини

Як писав УНІАН, нещодавно компанія OpenAI випустила мовну модель GPT-4о, яка ще трохи наблизила штучний інтелект до людини. Незабаром в інтернеті «завірусився» список, у якому чат-бота попросили перерахувати професії, які він зможе замінити.

Також ми розповідали, що компанія Google провела щорічну весняну презентацію IO, на якій, окрім усього іншого, було представлено нові АІ-інструменти для створення медіаконтенту: Veo, що генерує відео в 1080p, і Imagen 3, найпотужніший АІ-художник компанії.

www.unian.ua