Jiunge na majarida yetu ya kila siku na ya kila wiki kwa masasisho ya hivi punde na maudhui ya kipekee kwenye chanjo ya AI inayoongoza katika tasnia. Pata Maelezo Zaidi Utafiti mpya wa kina kutoka kwa watafiti wa Microsoft na washirika wa kitaaluma unaonyesha kuwa maajenti wa akili bandia wanaotumia miundo mikubwa ya lugha (LLMs) wanazidi kuwa na uwezo wa kudhibiti violesura vya picha za mtumiaji (GUI), na hivyo basi kubadilisha jinsi wanadamu wanavyoingiliana na programu. Teknolojia kimsingi huipa mifumo ya AI uwezo wa kuona na kuendesha miingiliano ya kompyuta kama wanadamu wanavyofanya – kubofya vitufe, kujaza fomu, na kuabiri kati ya programu. Badala ya kuhitaji watumiaji kujifunza amri changamano za programu, “mawakala hawa wa GUI” wanaweza kutafsiri maombi ya lugha asilia na kutekeleza vitendo muhimu kiotomatiki. “Mawakala hawa wanawakilisha mabadiliko ya dhana, kuwezesha watumiaji kufanya kazi ngumu, za hatua nyingi kupitia amri rahisi za mazungumzo,” watafiti wanaandika. “Programu zao zinaenea katika urambazaji wa wavuti, mwingiliano wa programu ya simu, na uwekaji otomatiki wa kompyuta ya mezani, ikitoa uzoefu badiliko wa mtumiaji ambao hubadilisha jinsi watu huingiliana na programu.” Ifikirie kama kuwa na msaidizi mkuu mwenye ujuzi wa juu ambaye anaweza kuendesha programu yoyote ya programu kwa niaba yako. Unamwambia tu msaidizi kile unachotaka kukamilisha, na wanashughulikia maelezo yote ya kiufundi ya kuifanya ifanyike. Ratiba hii inaorodhesha ukuaji wa haraka wa mawakala wa AI wenye uwezo wa kudhibiti programu, huku kukiwa na ongezeko la miundo mipya kutoka kwa watafiti na makampuni ya teknolojia iliyoibuka tangu 2023, iliyoainishwa na programu zao kwenye wavuti, simu na majukwaa ya kompyuta. (Mikopo: arxiv.org) Kuongezeka kwa wasaidizi wa AI ya biashara hubadilisha kila kitu Kampuni kuu za teknolojia tayari zinakimbia ili kujumuisha uwezo huu kwenye bidhaa zao. Power Automate ya Microsoft hutumia LLM kusaidia watumiaji kuunda mtiririko wa kiotomatiki kwenye programu zote. Msaidizi wa Copilot AI wa kampuni anaweza kudhibiti programu moja kwa moja kulingana na amri za maandishi. Utendaji wa Matumizi ya Kompyuta ya Anthropic kwa Claude huwezesha AI kuingiliana na violesura vya wavuti na kufanya kazi ngumu. Inaripotiwa kwamba Google inaunda Project Jarvis, mfumo wa AI ambao ungetumia kivinjari cha Chrome kutekeleza majukumu ya msingi ya wavuti kama vile utafiti, ununuzi, na kuhifadhi nafasi za usafiri, ingawa uwezo huu bado unatengenezwa na haujatolewa hadharani. “Ujio wa Miundo Kubwa ya Lugha, haswa mifano ya multimodal, imeleta enzi mpya ya otomatiki ya GUI,” karatasi inabainisha. “Wameonyesha uwezo wa kipekee katika uelewa wa lugha asilia, utengenezaji wa nambari, ujanibishaji wa kazi, na usindikaji wa kuona.” Hii inawakilisha fursa ya soko inayowezekana ya $68.9 bilioni ifikapo 2028, kulingana na wachambuzi katika Utafiti wa BCC, makampuni yanatazamia kufanyia kazi kazi zinazorudiwa kiotomatiki na kufanya programu zao kufikiwa zaidi na watumiaji wasio wa kiufundi. Soko linatarajiwa kukua kutoka dola bilioni 8.3 mnamo 2022 hadi takwimu hii, kwa kiwango cha ukuaji wa kila mwaka (CAGR) cha 43.9% wakati wa utabiri. Athari za biashara: Changamoto na fursa katika uendeshaji otomatiki wa AI Hata hivyo, vikwazo vikubwa vinasalia kabla ya teknolojia kuona kupitishwa kwa biashara kwa wingi. Watafiti hutambua vikwazo kadhaa muhimu, ikiwa ni pamoja na masuala ya faragha wakati mawakala hushughulikia data nyeti, vikwazo vya utendakazi wa hesabu, na hitaji la dhamana bora za usalama na kutegemewa. “Ingawa zinafaa kwa utiririshaji wa kazi ulioainishwa, njia hizi zilikosa kubadilika na kubadilika kuhitajika kwa matumizi madhubuti, ya ulimwengu halisi,” karatasi hiyo inasema kuhusu mbinu za mapema za otomatiki. Timu ya utafiti inatoa ramani ya kina ya kushughulikia changamoto hizi, ikisisitiza umuhimu wa kuunda miundo bora zaidi ambayo inaweza kuendeshwa ndani ya kifaa, kutekeleza hatua thabiti za usalama, na kuunda mifumo sanifu ya tathmini. “Kwa kujumuisha ulinzi na vitendo vinavyoweza kubinafsishwa, mawakala hawa huhakikisha ufanisi na usalama wakati wa kushughulikia amri ngumu,” watafiti wanabainisha, wakionyesha maendeleo ya hivi majuzi katika kufanya teknolojia kuwa tayari biashara. Kwa viongozi wa teknolojia ya biashara, kuibuka kwa mawakala wa GUI inayoendeshwa na LLM kunawakilisha fursa na uzingatiaji wa kimkakati. Ingawa teknolojia inaahidi faida kubwa za tija kupitia otomatiki, mashirika yatahitaji kutathmini kwa uangalifu athari za usalama na mahitaji ya miundombinu ya kupeleka mifumo hii ya AI. “Sehemu ya mawakala wa GUI inaelekea kwenye usanifu wa wakala wengi, uwezo wa aina nyingi, seti tofauti za hatua, na mikakati ya riwaya ya kufanya maamuzi,” karatasi hiyo inaelezea. “Ubunifu huu unaashiria hatua muhimu za kuunda mawakala wenye akili, wanaoweza kubadilika na uwezo wa kufanya kazi kwa hali ya juu katika mazingira anuwai na yenye nguvu.” Wataalamu wa tasnia wanatabiri kuwa kufikia 2025, angalau 60% ya biashara kubwa zitakuwa zikifanya majaribio ya aina fulani ya mawakala wa kiotomatiki wa GUI, ambayo inaweza kusababisha ufanisi mkubwa lakini pia kuibua maswali muhimu kuhusu faragha ya data na uhamishaji wa kazi. Utafiti wa kina unapendekeza kuwa tuko katika hatua ya kubadilika ambapo miingiliano ya mazungumzo ya AI inaweza kubadilisha kimsingi jinsi wanadamu wanavyoingiliana na programu – ingawa kutambua uwezo huu kutahitaji maendeleo katika teknolojia ya msingi na mazoea ya kusambaza biashara. “Maendeleo haya yanaweka msingi kwa mawakala wanaobadilika zaidi na wenye nguvu wenye uwezo wa kushughulikia mazingira magumu, yenye nguvu,” watafiti walihitimisha, wakionyesha siku zijazo ambapo wasaidizi wa AI wanakuwa sehemu muhimu ya jinsi tunavyofanya kazi na kompyuta. VB Daily Kukaa katika kujua! Pata habari za hivi punde katika kikasha chako kila siku Kwa kujisajili, unakubali Sheria na Masharti ya VentureBeat. Asante kwa kujisajili. Angalia majarida zaidi ya VB hapa. Hitilafu imetokea.