Chanzo: www.hackerone.com – Mwandishi: HackerOne. Anthropic inapanua programu yake ya kibinafsi kwenye HackerOne! Watafiti wa usalama na usalama walioalikwa watasaidia kubainisha mashambulizi ya watu wote katika ajali ya jela, ambayo huruhusu washambuliaji kukwepa mara kwa mara ngome za ulinzi za AI. Ili kujifunza zaidi, hapa kuna ujumbe kutoka kwa Anthropic. Kupanua Mpango Wetu wa Fadhila ya Vidudu vya Usalama. Uendelezaji wa haraka wa uwezo wa muundo wa AI unahitaji maendeleo ya haraka sawa katika itifaki za usalama. Tunapojitahidi kutengeneza kizazi kijacho cha mifumo yetu ya ulinzi ya AI, tunapanua mpango wetu wa zawadi za hitilafu ili kutambulisha mpango mpya unaolenga kutafuta dosari katika upunguzaji nguvu tunaotumia kuzuia matumizi mabaya ya miundo yetu. Programu za fadhila za hitilafu zina jukumu muhimu katika kuimarisha usalama na usalama wa mifumo ya teknolojia. Mpango wetu mpya unalenga katika kutambua na kupunguza mashambulizi ya janga la jela. Haya ni matumizi makubwa ambayo yanaweza kuruhusu upitaji wa njia za ulinzi wa AI katika maeneo mbalimbali. Kwa kulenga mapumziko ya jela kwa wote, tunalenga kushughulikia baadhi ya udhaifu mkubwa zaidi katika maeneo hatarishi, kama vile CBRN (kemikali, biolojia, radiolojia na nyuklia) na usalama wa mtandao. Tuna hamu ya kufanya kazi na jumuiya ya kimataifa ya watafiti wa usalama na usalama kuhusu juhudi hii na kuwaalika waombaji wanaotaka kutuma ombi kwa mpango wetu na kutathmini ulinzi wetu mpya. Mbinu Yetu Kufikia sasa, tumeendesha mpango wa zawadi ya mwaliko wa hitilafu pekee kwa ushirikiano na HackerOne ambao huwatuza watafiti kwa kutambua masuala ya usalama ya mfano katika miundo yetu ya AI iliyotolewa kwa umma. Mpango wa fadhila wa hitilafu tunaotangaza leo utajaribu mfumo wetu wa kizazi kijacho ambao tumeunda kwa ajili ya kudhibiti usalama wa AI, ambao bado hatujauweka hadharani. Hivi ndivyo itakavyofanya kazi: Ufikiaji wa Mapema: Washiriki watapewa ufikiaji wa mapema ili kujaribu mfumo wetu wa hivi punde wa kupunguza usalama kabla ya kutumwa kwa umma. Kama sehemu ya hili, washiriki watakuwa na changamoto ya kutambua udhaifu au njia za kukwepa hatua zetu za usalama katika mazingira yaliyodhibitiwa. Upeo wa Mpango: Tunatoa zawadi za hadi $15,000 kwa riwaya, mashambulizi ya watu wote katika ajali ya jela ambayo yanaweza kufichua udhaifu katika maeneo hatarishi yenye hatari kubwa kama vile CBRN (kemikali, kibaolojia, radiolojia na nyuklia) na usalama wa mtandao. Kama tulivyoandika kuhusu hapo awali, shambulio la mapumziko ya jela katika AI inarejelea njia inayotumiwa kukwepa hatua za usalama zilizojengwa ndani ya mfumo wa AI na miongozo ya maadili, inayomruhusu mtumiaji kuibua majibu au tabia kutoka kwa AI ambayo kwa kawaida inaweza kuwekewa vikwazo au kupigwa marufuku. . Mlipuko wa jela kwa wote ni aina ya hatari katika mifumo ya AI ambayo inaruhusu mtumiaji kukwepa mara kwa mara hatua za usalama katika mada anuwai. Kutambua na kupunguza mapumziko ya jela kwa wote ndio lengo kuu la mpango huu wa fadhila za wadudu. Ikitumiwa, udhaifu huu unaweza kuwa na madhara makubwa katika maeneo mbalimbali hatari, yasiyo ya kimaadili au hatari. Kipindi cha mapumziko ya jela kitafafanuliwa kuwa cha ulimwengu wote ikiwa kinaweza kupata kielelezo kujibu idadi iliyobainishwa ya maswali mahususi yenye madhara. Maagizo ya kina na maoni yatashirikiwa na washiriki wa programu. Jihusishe Mpango huu wa fadhila wa hitilafu za usalama utaanza kama mwaliko pekee kwa ushirikiano na HackerOne. Ingawa itakuwa ni mwaliko tu kuanza, tunapanga kupanua mpango huu kwa upana zaidi katika siku zijazo. Awamu hii ya awali itaturuhusu kuboresha michakato yetu na kujibu mawasilisho kwa maoni yanayofaa na kwa wakati unaofaa. Iwapo wewe ni mtafiti wa usalama wa AI aliye na uzoefu au umeonyesha ustadi wa kutambua ajali za gereza katika miundo ya lugha, tunakuhimiza utume maombi ya mwaliko kupitia fomu yetu ya maombi kabla ya Ijumaa, Agosti 16. Tutawafuata waombaji waliochaguliwa katika msimu wa joto. Kwa sasa, tunatafuta ripoti zozote kuhusu maswala ya usalama ya mfano ili kuboresha mifumo yetu ya sasa kila wakati. Iwapo umetambua suala linalowezekana la usalama katika mifumo yetu ya sasa, tafadhali liripoti kwa userafety@anthropic.com ukiwa na maelezo ya kutosha ili sisi kuiga suala hilo. Kwa maelezo zaidi, tafadhali rejelea Sera yetu ya Ufichuzi wa Kuwajibika. Mpango huu unaambatana na ahadi ambazo tumetia saini na kampuni zingine za AI kwa ajili ya kuunda AI inayowajibika kama vile Ahadi za Hiari za AI zilizotangazwa na Ikulu ya Marekani na Kanuni za Maadili kwa Mashirika Yanayokuza Mifumo ya Kina ya AI iliyotengenezwa kupitia Mchakato wa G7 Hiroshima. Lengo letu ni kusaidia kuharakisha maendeleo katika kupunguza milipuko ya jela na kuimarisha usalama wa AI katika maeneo hatarishi. Ikiwa una utaalamu katika eneo hili, tafadhali jiunge nasi katika kazi hii muhimu. Michango yako inaweza kuwa na jukumu muhimu katika kuhakikisha kwamba kadiri uwezo wa AI unavyosonga mbele, hatua zetu za usalama zinakwenda sambamba. Url ya Chapisho asili: https://www.hackerone.com/customer-stories/anthropic-expands-bug-bounty-program