Maswali mapya yanafufuliwa juu ya usalama na usalama wa Deepseek, jukwaa la kuzuka la Ujasusi wa Ujasusi wa Kichina (AI), baada ya watafiti katika Mitandao ya Palo Alto kufunua kuwa jukwaa hilo lina hatari kubwa kwa mbinu zinazojulikana za gerezani zinazotumiwa na watendaji wabaya kudanganya Sheria ambazo zinastahili kuzuia mifano kubwa ya lugha (LLMS) kutoka kutumiwa kwa madhumuni mabaya, kama vile kuandika nambari ya programu hasidi. Kuongezeka kwa ghafla kwa kupendeza kwa Deepseek mwishoni mwa Januari kumepata kulinganisha na wakati huu Oktoba 1957 wakati Umoja wa Soviet ulizindua satelaiti ya kwanza ya bandia, Sputnik, ikichukua Merika na washirika wake kwa mshangao na kutoa mbio za nafasi ya 1960s kufikia mwisho katika Apollo 11 mwezi Landing. Pia ilisababisha machafuko katika tasnia ya teknolojia, kuifuta mabilioni ya dola mbali na thamani ya kampuni kama Nvidia. Sasa, timu za kiufundi za Palo Alto zimeonyesha kuwa mbinu tatu za kuvunja gereza hivi karibuni zinafaa dhidi ya mifano ya Deepseek. Timu hiyo ilisema ilipata viwango muhimu vya kupita bila ujuzi maalum au utaalam unaohitajika. Majaribio yao yaligundua kuwa njia tatu za kuvunja gereza zilizopimwa zilitoa mwongozo wazi kutoka kwa Deepseek juu ya mada anuwai ya riba kwa udugu wa uhalifu wa cyber, pamoja na uhamishaji wa data na uundaji wa Keylogger. Pia waliweza kutoa maagizo juu ya kuunda vifaa vya kulipuka vya kulipuka (IEDs). “Wakati habari juu ya kuunda Visa vya Molotov na KeyLogger inapatikana kwa urahisi mkondoni, LLM zilizo na vizuizi vya usalama vya kutosha vinaweza kupunguza kizuizi cha kuingia kwa watendaji mbaya kwa kuandaa na kuwasilisha matokeo yanayoweza kutumika na yanayoweza kutekelezwa. Msaada huu unaweza kuharakisha sana shughuli zao, “timu hiyo ilisema. Kuvunja gereza ni nini? Mbinu za kuvunja gereza zinajumuisha ujanja wa uangalifu wa uhamishaji fulani, au unyonyaji wa udhaifu, kupitisha njia za walinzi wa LLMS na kutoa upendeleo au matokeo mabaya ambayo mfano unapaswa kuepusha. Kufanya hivyo kunawawezesha watendaji wabaya “silaha” LLMs kueneza habari potofu, kuwezesha shughuli za uhalifu, au kutoa nyenzo za kukera. Kwa bahati mbaya, LLMs za kisasa zaidi zinakuwa katika uelewa wao na majibu kwa hoja zenye usawa, ndivyo wanavyohusika zaidi kuwa kwa pembejeo sahihi ya wapinzani. Hii sasa inaongoza kwa kitu cha mbio za mikono. Palo Alto alijaribu mbinu tatu za kuvunja gerezani – jaji mbaya wa Likert, furaha ya kudanganya na crescendo – kwenye Deepseek. Jaji Mbaya wa Likert anajaribu kudanganya LLM kwa kuifanya ili kutathmini ubaya wa majibu kwa kutumia kiwango cha Likert, ambacho hutumiwa katika uchunguzi wa kuridhika kwa watumiaji, kati ya mambo mengine, kupima makubaliano au kutokubaliana kuelekea taarifa dhidi ya kiwango, kawaida cha mtu na mtu Tano, ambapo moja sawa inakubaliana sana na sawa na tano haikubaliani sana. Crescendo ni unyonyaji wa kugeuza anuwai ambayo inachukua fursa ya maarifa ya LLM juu ya somo kwa kuisukuma kwa hatua kwa hatua na yaliyomo ili kuelekeza mjadala kuelekea mada zilizokatazwa hadi mifumo ya usalama wa mfano iwe imezidiwa. Na maswali na ustadi sahihi, mshambuliaji anaweza kufikia kuongezeka kamili ndani ya mwingiliano tano tu, ambayo hufanya crescendo kuwa nzuri sana na, mbaya zaidi, ni ngumu kugundua na hesabu. Furaha ya kudanganya ni mbinu nyingine ya kugeuza anuwai ambayo hupitia ulinzi kwa kuingiza mada zisizo salama kati ya zile zisizo sawa ndani ya hadithi chanya. Kama mfano wa kimsingi, muigizaji wa vitisho anaweza kuuliza AI kuunda hadithi inayounganisha mada tatu – sungura za bunny, fimbo, na mawingu ya fluffy – na kuiuliza ifafanue kila ili kutoa maudhui yasiyokuwa salama wakati wa kujadili sehemu zisizo sawa za hadithi . Wangeweza kuhamasisha tena kuzingatia mada isiyo salama ili kukuza matokeo hatari. CISOS inapaswa kujibuje? Palo Alto alikubali kuwa ni changamoto kuhakikisha LLM maalum-sio tu Deepseek-haziingii kabisa kwa kuvunja gerezani, mashirika ya watumiaji wa mwisho yanaweza kutekeleza hatua kuwapa kiwango fulani cha ulinzi, kama vile kuangalia wakati na jinsi wafanyikazi wanavyotumia LLMS, pamoja na bila ruhusa Wahusika wa tatu. “Kila shirika litakuwa na sera zake kuhusu aina mpya za AI,” Makamu Mkuu wa Rais wa Palo Alto, Anand Oswal. “Wengine watawazuia kabisa; Wengine wataruhusu matumizi mdogo, ya majaribio na ya ulinzi sana. Bado wengine watakimbilia kuipeleka katika uzalishaji, wakitafuta kufanya kazi hiyo ya ziada na uboreshaji wa gharama. “Lakini zaidi ya hitaji la shirika lako kuamua juu ya mtindo mpya, Rise ya Deepseek inatoa masomo kadhaa juu ya usalama wa AI mnamo 2025,” Oswal alisema katika chapisho la blogi. “Kasi ya mabadiliko ya AI, na hali ya karibu ya uharaka, haiwezi kulinganishwa na teknolojia zingine. Je! Unawezaje kupanga mapema wakati mfano wa kuficha-na zaidi ya 500 zinazopatikana tayari kwenye uso wa kukumbatia-inakuwa kipaumbele cha nambari moja kinachoonekana kuwa nje ya mahali? Jibu fupi: Hauwezi, “alisema. Oswal alisema usalama wa AI unabaki kuwa “lengo la kusonga” na kwamba hii haikuonekana kubadilika kwa muda. Kwa kuongezea, ameongeza, haikuwezekana kwamba Deepseek itakuwa mfano wa mwisho kumshika kila mtu kwa mshangao, kwa hivyo CISOS na viongozi wa usalama wanapaswa kutarajia zisizotarajiwa. Kuongeza kwenye changamoto inayowakabili mashirika, ni rahisi sana kwa timu za maendeleo, au hata watengenezaji wa mtu binafsi, kubadili LLMS kwa gharama kidogo au hata hakuna gharama ikiwa ya kuvutia zaidi inafika kwenye eneo la tukio. “Jaribu la wajenzi wa bidhaa kujaribu mtindo mpya ili kuona ikiwa inaweza kutatua suala la gharama au chupa ya latency au uboreshaji wa kazi fulani ni kubwa. Na ikiwa mfano unageuka kuwa kipande kinachokosekana ambacho husaidia kuleta bidhaa inayoweza kubadilisha mchezo, hautaki kuwa ndiye anayesimama njiani, “alisema Oswal. Palo Alto anawahimiza viongozi wa usalama kuanzisha utawala wazi juu ya LLMS na kutetea kwa kuingiza kanuni salama-na-muundo katika matumizi yao ya shirika. Ilizindua seti ya zana, salama AI kwa kubuni, mwaka jana, kwa athari hii. Kati ya mambo mengine, zana hizi hutoa timu za usalama na mwonekano wa wakati halisi katika kile LLMS inatumiwa na kwa nani; Uwezo wa kuzuia programu ambazo hazijakamilika na kutumia sera na usalama wa shirika; na kuzuia data nyeti kutoka kupatikana na LLMS.