Eoneren/Getty Imagicessince Deepseek alitoa changamoto kwa OpenAI wiki mbili zilizopita, mashindano ya wazi ya chanzo-AI yameonyesha hakuna dalili za kuacha.ALSO: Kwanini Mark Zuckerberg anataka kufafanua chanzo wazi siku mbili baada ya OpenAI kutangaza utafiti wa kina, mpya mpya Wakala wa AI ndani ya Chatgpt ambayo inaweza kupitia vyanzo vya mkondoni kwako, mwenzake wa chanzo wazi tayari ameibuka. Utafiti wa kina wa uso wa Jumanne, uso wa kukumbatia ulitoa sawa na kipengele kipya. Iliyotajwa waziwazi utafiti wa kina, mbadala hutumia mfano wa O1 wa One na mfumo wa wakala wa kuzunguka wavuti. Njia mbadala wazi ilipata usahihi wa 55% juu ya Benchmark ya Wasaidizi wa AI (GAIA), mtihani wa juu wa tathmini kwa mawakala, ikilinganishwa na 67% ya utafiti, na safu ya kwanza kwa uwasilishaji wazi. mshindani kamili kwa OpenAI. “Utafiti wa kina ni mafanikio makubwa na uzazi wake wazi utachukua muda,” jukwaa la msanidi programu lilisema katika blogi inayoitwa “Kuweka Mawakala wetu wa Utafutaji.” “Hasa, usawa kamili utahitaji matumizi bora ya kivinjari na mwingiliano kama Opene Operesheni inatoa, yaani zaidi ya mwingiliano wa sasa wa maandishi wa wavuti ambao tunachunguza katika hatua hii ya kwanza.” Utafiti wa kina wa OpenAI unasimamiwa na toleo la hivi karibuni na la juu zaidi Mfano wa hoja, O3, ambayo kwa sasa hakuna chanzo wazi cha wazi. Kulingana na blogi ya OpenAI, toleo hili la mfano pia liliboresha mifano ya juu juu ya mtihani wa mwisho wa ubinadamu, mtihani mpya wa AI uliotolewa wiki iliyopita, na ni changamoto zaidi kuliko vipimo vingine maarufu, na “juu mpya” ya usahihi wa karibu 27%. : Mfumo mpya wa usalama wa AI ya Jailbreak Anthropic kwa malipo ya $ 15,000 alisema, waundaji wa HLE wanaonyesha “uchafu” unaowezekana: O3 ilipimwa baada ya HLE kutolewa, ikimaanisha OpenAI ilipata ufikiaji wake. Uso wa kukumbatia haukutaja ikiwa ilikuwa imejaribu utafiti wa kina juu ya HLE. Ili kushindana vyema, jukwaa linasema ni ujenzi “mawakala ambao hutazama skrini yako na wanaweza kuchukua hatua moja kwa moja na panya na kibodi.” Ni bure kufikiria tag yake ya bei ya $ 200 kwa kila mwezi kupitia Chatgpt Pro, utafiti wa kina unaweza kuwa hauwezekani kwa wengi. Ikiwa unataka kujaribu kitu kama hicho bure, angalia demo ya moja kwa moja ya Utafiti wa kina hapa, ambayo uso wa kukumbatia unataja kama “toleo rahisi” la wakala kamili.Also: Je! Chatgpt Plus au Pro inafaa? Hapa ndivyo wanavyolinganisha na toleo la bure la kasi ambayo uso wa kukumbatia uliweza kuunda kitu cha mshindani – chini ya masaa 24 – alama ya mbio ambazo watengenezaji wa mifano ya wamiliki wanazidi kujikuta. Watafiti huko UC Berkeley walifanya mfano kulinganishwa na Maoni ya O1 katika masaa 19 tu mapema mwezi uliopita. Wakati halisi wa wakati wa Deepseek kwenye R1, mfano wake wa mpinzani wa O1, haijulikani, lakini inaeleweka kuwa rasilimali ya chini katika suala la wakati na matumizi.