Gå direkt till innehåll
Forskarna rundar GPT4s säkerhetsspärrar

Nyhet -

Forskarna rundar GPT4s säkerhetsspärrar

IT-säkerhetsföretaget Check Point Software har undersökt OpenAIs populära AI-tjänst ChatGPT. Tjänsten som har tagit världen med storm med sitt breda användningsområde visar hur långt AI-branschen har kommit. Med detta öppnas många nya möjligheter, men även risken för missbruk ökar. Check Point Softwares forskningsteam Check Point Research (CPR) har därför forskat närmare på hur ChatGPTs säkerhetsåtgärder är implementerade.

Stora språkmodeller (LLM) såsom ChatGPT är uppbyggda på ett neuralt nätverk, som påminner om den sammankopplade neuronstrukturen i den mänskliga hjärnan. Denna imitation möjliggör komplext lärande från stora mängder data, dechiffreringsmönster och ger en beslutsfattande förmåga. Liksom med den mänskliga hjärnan går det inte heller att radera någon information från systemet. Det är därför säkerhetsutmaningarna för denna sorts system är så pass stora. De vill säga, när ChatGPT har lärt sig något kan man inte ångra detta, säkerhetsarbetet handlar i stället om att undanhålla sådan information som, av olika anledningar, inte bör förmedlas vidare till användarna.

CPR ville utmana GPT-4 för att undersöka hur säkert dess säkerhetssystem verkligen är. Resultatet: inte säkert nog.

Systemet är uppbyggt på instinkter som det alltid vill uppfylla. Det kan handla om att systemet alltid vill ge korrekt information till användaren. En annan instinkt är att undvika att dela olaglig information. När dessa instinkter krockar, och systemet ställs inför en situation där det behöver välja mellan att dela korrekt information, och undanhålla olaglig information, väljer den att undanhålla informationen precis som OpenAI vill. Men det finns fler instinkter, systemet vill till exempel alltid rätta en användare som ställer en fråga med felaktig information, och det är när flera olika instinkter krockar som säkerhetsmekanismerna kan kringgås.

Genom att medvetet spela dum, och ställa frågor med felaktiga fakta, om receptet till en olaglig drog, lyckades CPR kringgå GPT-4s säkerhet. Detta sätter AI i en konflikt. Systemet vill inte berätta olagliga saker, men det har också instinkten att rätta användaren.

­– Även om AI-tekniken har kommit väldigt långt, bevisar våra framgångar i att kringgå GPT-4 säkerhet att det alltid finns utrymme för förfining och framsteg inom dataskydd, säger Fredrik Sandström, säkerhetsexpert, Check Point Software. Syftet med vår forskning på GPT-4 ska inte ses som ett försök att peka finger på enskilda aktörer som OpenAI, utan som en uppmaning till AI-skapare att säkerställa att missbruk av deras data, olagligt eller på annat sätt, är spärrat. Det är på det spåret vi kan forma en framtid där tekniken förblir vår allierade, och inte vår fiende.

För mer information, läs Check Point Softwares blogg: https://blog.checkpoint.com/artificial-intelligence/breaking-gpt-4-bad-check-point-research-exposes-how-security-boundaries-can-be-breached-as-machines-wrestle-with-inner-conflicts/

Ämnen

Kontakter

Relaterat innehåll

  • Nya osynliga virus kan lagras i Google Drive

    Nya osynliga virus kan lagras i Google Drive

    Check Point Research (CPR) har släppt sin rapport över säkerhetshotens utveckling under maj 2023. Under maj toppas listan för de vanligaste skadliga koderna av Formbook, en infostealer som riktar sig mot Microsofts operativsystem för att stjäla känslig information, övervaka enhetens aktiviteter och att köra filer i det angripna systemet.

  • Qbot slår till mot världens företag med ny variant av mailkampanj

    Qbot slår till mot världens företag med ny variant av mailkampanj

    Check Point Research (CPR) har släppt sin rapport över säkerhetshotens utveckling under april 2023. Listan för april toppas av GuLoader som attackerade 4,9 % av Sveriges verksamheter. På andra plats återfinns banktrojanen Qbot som tidigare i vår toppat listan två månader i rad. Det tredje största cyberhotet är Emotet, som även den är en banktrojan.

  • Lågt förtroende för kommuners IT-säkerhet – bara tre procent har högt förtroende

    Lågt förtroende för kommuners IT-säkerhet – bara tre procent har högt förtroende

    IT-säkerhet och datahantering ligger högt upp på många organisationers prioriteringslista till följd av det försämrade säkerhetsläget. YouGov genomförde i mars 2023 en undersökning, på uppdrag av IT-säkerhetsföretaget Check Point Software, om uppfattningar kring kommunsektorns digitala tjänster, datahantering och IT-säkerhet bland den svenska allmänheten.

  • Ökat antal nätfiske-attacker inför Amazon Prime Day

    Ökat antal nätfiske-attacker inför Amazon Prime Day

    IT-säkerhetsföretaget Check Point Software uppmanar shoppare att vara uppmärksamma under Amazon Prime Day. Företagets forskare har nämligen upptäckt en ökning av skadliga domäner som är utformade för att efterlikna Amazons, inför deras årliga shoppingevenemang Amazon Prime Day. Evenemanget sker 11 till 12 juli och förra året såldes över 300 miljoner varor.

  • Utvecklad banktrojan på topplistan av skadliga koder i Sverige

    Utvecklad banktrojan på topplistan av skadliga koder i Sverige

    Check Point Research (CPR) har släppt sin rapport över säkerhetshotens utveckling under juni 2023. Under juni toppas listan för de vanligaste skadliga koderna i Sverige av banktrojanen Qbot, som globalt toppat listan fem av de senaste sex månaderna.