OpenAion Siku ya mwisho ya siku 12 za OpenAI za ‘Shipmas,’ kampuni ilifunua mifano yake ya hivi karibuni, O3 na O3-mini, ambayo inazidi kwa hoja na hata kuzidisha O1 kwenye safu ya alama, pamoja na hesabu na sayansi. Wakati wa kuzinduliwa, Mkurugenzi Mtendaji wa OpenAI Sam Altman alisema O3 ilipangwa kushuka mwishoni mwa Januari, na leo, kampuni hiyo ilifanya vizuri kwa ahadi yake. Ijumaa ya O3-minion, OpenAI ilitoa mfano wake wa O3-mini, mfano wa gharama kubwa zaidi katika safu ya hoja ya OpenAI, kwa umma. Hadi sasa, safu hiyo imekuwa na O1 na O1-mini. Kama mtangulizi wake, mfano huo ni nguvu sana katika sayansi, hesabu, na kuweka coding, kulingana na kampuni. OpenAI O3-mini sasa inapatikana katika Chatgpt na watumiaji wa API.PRO watapata ufikiaji usio na kikomo wa O3-mini na Plus & Watumiaji wa Timu watakuwa na kiwango cha kiwango cha kiwango cha (vs O1-mini). Watumiaji wa Free wanaweza kujaribu O3-mini katika Chatgpt Kwa kuchagua kitufe cha Sababu chini ya mtunzi wa ujumbe. OpenAI (@Openai) Januari 31, 2025 Wakati O3-mini imechaguliwa, itatumia juhudi za hoja za kati, ambazo husawazisha kasi na usahihi. Wakati mfano wa asili wa O1 bado una maarifa mapana ya jumla kuliko O3-mini, faida kuu ya mfano mpya ni kasi yake ya haraka na utendaji wa juu ukilinganisha na O1-mini. Utendaji wa Benchmark Wakati kulinganisha utendaji wa O3-mini hadi O1-mini, wataalam wa wataalam waligundua kuwa O3-mini ilitoa majibu sahihi zaidi, ya kuhojiwa, na wazi kuliko O1-mini. Kulingana na chapisho, walipendelea majibu ya O3-mini 56% ya wakati huo na waliona kupunguzwa kwa 39% ya makosa makubwa. Zaidi ya tathmini ya upendeleo wa kibinadamu, katika alama kadhaa za shina, pamoja na Math Math (AIME 2024), Maswali ya Sayansi ya kiwango cha PhD (GPQA Diamond), na Nambari ya Ushindani (CodeForces), O3-mini na hoja za kati-ambayo ndio watumiaji wa Chatgpt watafanya Pata kwa chaguo-msingi-Overformed O1-mini. OpenAialso muhimu ni kwamba O3-mini, akiwa na juhudi kubwa za hoja katika alama, alikaribia utendaji wa O1, wakati mwingine hata kuzidi, kama inavyoonekana katika alama za AIME 2024 hapo juu na alama za uhandisi (SWE-Bench zilizothibitishwa). Mfano wa O3-mini na juhudi za hoja za kati zilifanana na utendaji wa O1 katika benchi la Codeforces. SalamaPenai ilitathmini usalama wa O3-mini kupitia kutolewa kwa umma kupitia mapumziko ya gereza na kutokubali tathmini ya yaliyomo. Kampuni iligundua kuwa mfano huo unazidi sana GPT-4O kwenye tathmini. OpenAI ilichapisha matokeo ya tathmini hapa chini na pia ilizindua kadi ya mfumo wa O3-mini, PDF ya kurasa 37 ambayo inajumuisha matokeo ya kina ya tathmini. Jinsi ya kupata wanachama wa AccessALL kwa OpenAI iliyolipwa tiers, pamoja na Chatgpt Plus, Timu, na Pro, inaweza kupata OpenAI O3-mini kuanzia leo. Pamoja na watumiaji wa timu sasa wana kikomo cha kiwango mara tatu, kutoka kwa ujumbe 50 kwa siku na O1-mini hadi ujumbe 150 kwa siku. Ufikiaji wa Biashara ya Chatgpt unakuja kwa wiki. Pia: Kipengele kipya cha nguvu cha Copilot cha ‘Fikiria zaidi’ ni bure kwa watumiaji wote-jinsi inavyofanya kazi kwa mfano wa O3-mini itachukua nafasi ya O1-mini kwenye kichungi cha mfano, kwani itakuwa muhimu kwa kazi zile zile, isipokuwa uzoefu huo sasa utaboreshwa na latency ya chini na mipaka ya kiwango cha juu. Kama mtumiaji aliyelipwa, wakati wa kuandika, sikuwa na uwezo wa kupata O3-mini, na badala yake bado ninaona chaguo la O1-mini. Ikiwa hauna usajili, hakuna wasiwasi: unaweza kuona ikiwa O3-mini inastahili hype kutoka kwa akaunti yako ya bure. Watumiaji wote wa bure wa Chatgpt wanapaswa kufanya ni kubonyeza “Sababu” kwenye sanduku la maandishi ya ujumbe au kuzaliwa tena majibu. Mkurugenzi Mtendaji wa OpenAI Sam Altman alithibitisha ufikiaji wa bure katika chapisho kwenye X. Hadi sasa, mifano yote ya hoja imewekwa nyuma ya malipo; OpenAI haikuelezea mapungufu yoyote karibu na mtindo mpya wa watumiaji wa bure.
Leave a Reply