Watu wengi wanajua kuwa roboti hazisikiki tena kama makopo ya takataka. Wanasikika kama Siri, Alexa, na Gemini. Zinasikika kama sauti katika miti ya simu ya wateja ya Labyrinthine. Na hata sauti hizo za roboti zinafanywa kuwa za kizamani na sauti mpya za AI-zinazozalishwa ambazo zinaweza kuiga kila sauti ya sauti na sauti ya kibinadamu, chini ya lafudhi maalum za kikanda. Na kwa sekunde chache tu za sauti, AI sasa inaweza kupiga sauti maalum ya mtu. Teknolojia hii itachukua nafasi ya wanadamu katika maeneo mengi. Msaada wa wateja wa moja kwa moja utaokoa pesa kwa kukata wafanyikazi katika vituo vya simu. Mawakala wa AI watapiga simu kwa niaba yetu, kuzungumza na wengine kwa lugha ya asili. Hayo yote yanafanyika, na yatakuwa kawaida hivi karibuni. Lakini kuna kitu kimsingi tofauti juu ya kuzungumza na bot kinyume na mtu. Mtu anaweza kuwa rafiki. AI haiwezi kuwa rafiki, licha ya jinsi watu wanaweza kuitibu au kuitikia. AI ni zana bora, na njia mbaya zaidi ya ujanja. Wanadamu wanahitaji kujua ikiwa tunazungumza na mtu aliye hai, anayepumua au roboti na ajenda iliyowekwa na mtu anayedhibiti. Ndio sababu roboti zinapaswa kusikika kama roboti. Hauwezi tu kuweka alama kwa hotuba iliyotokana na AI. Itakuja katika aina nyingi tofauti. Kwa hivyo tunahitaji njia ya kutambua AI ambayo inafanya kazi bila kujali hali ya kawaida. Inahitaji kufanya kazi kwa viunzi virefu au vifupi vya sauti, hata kwa muda mrefu wa pili. Inahitaji kufanya kazi kwa lugha yoyote, na katika muktadha wowote wa kitamaduni. Wakati huo huo, hatupaswi kulazimisha ugumu wa mfumo wa msingi au ugumu wa lugha. Tunayo pendekezo rahisi: AI zote za kuzungumza na roboti zinapaswa kutumia moduli ya pete. Katikati ya karne ya ishirini, kabla ya kuwa rahisi kuunda hotuba halisi ya sauti ya robotic, modulators za pete zilitumiwa kufanya sauti za watendaji zisikilize. Kwa miongo michache iliyopita, tumezoea sauti za robotic, kwa sababu tu mifumo ya maandishi-kwa-hotuba ilikuwa nzuri ya kutosha kutoa hotuba isiyoeleweka ambayo haikuwa ya kibinadamu kwa sauti yake. Sasa tunaweza kutumia teknolojia hiyo hiyo kufanya hotuba ya robotic ambayo haiwezi kutambulika kutoka kwa sauti ya kibinadamu tena. Modeli ya pete ina faida kadhaa: ni rahisi sana, inaweza kutumika kwa wakati halisi, haiathiri kueleweka kwa sauti, na-muhimu zaidi-ni “sauti ya roboti” kwa sababu ya matumizi yake ya kihistoria ya kuonyesha roboti . Kampuni zinazowajibika za AI ambazo hutoa muundo wa sauti au wasaidizi wa sauti ya AI kwa aina yoyote inapaswa kuongeza modeli ya pete ya frequency fulani ya kawaida (sema, kati ya 30-80 Hz) na ya kiwango cha chini (sema, asilimia 20). Hiyo ndio. Watu watashika haraka. Hapa kuna mifano kadhaa ambayo unaweza kusikiliza kwa mifano ya kile tunachopendekeza. Sehemu ya kwanza ni “podcast” iliyotengenezwa na AI-ya nakala hii iliyotengenezwa na daftari la Google iliyo na AI mbili “majeshi.” Daftari la Google liliunda hati ya podcast na sauti iliyopewa maandishi tu ya nakala hii. Sehemu mbili zifuatazo zinaonyesha podcast hiyo hiyo na sauti za AIS zilibadilishwa zaidi na kwa busara na modeli ya pete: tuliweza kutoa athari ya sauti na hati ya laini ya 50 ya maandishi yaliyotokana na Claude ya Anthropic. Moja ya sauti zinazojulikana zaidi za roboti ni zile za Daleks kutoka kwa Daktari ambaye miaka ya 1960. Hapo zamani sauti za roboti zilikuwa ngumu kuunganisha, kwa hivyo sauti ilikuwa sauti ya muigizaji kupitia modeli ya pete. Iliwekwa karibu 30 Hz, kama tulivyofanya katika mfano wetu, na kina tofauti cha moduli (amplitude) kulingana na jinsi athari ya robotic ina maana kuwa. Matarajio yetu ni kwamba tasnia ya AI itajaribu na kubadilika kwa usawa mzuri wa vigezo na mipangilio kama hiyo, na itatumia zana bora kuliko hati ya Python ya mstari 50, lakini hii inaonyesha jinsi ilivyo rahisi kufikia. Kwa kweli pia kutakuwa na matumizi mabaya ya sauti za AI. Kashfa ambazo hutumia kupiga sauti zimekuwa rahisi kila mwaka, lakini zimewezekana kwa miaka mingi na ujuaji sahihi. Kama tu tunajifunza kuwa hatuwezi kuamini tena picha na video tunazoona kwa sababu zingeweza kutengenezwa kwa urahisi, hivi karibuni sote tutajifunza kuwa mtu ambaye anasikika kama mtu wa familia anayeomba pesa haraka anaweza kuwa mtapeli anayetumia a Chombo cha Kufunga Sauti. Hatutarajii watapeli kufuata pendekezo letu: watapata njia bila kujali. Lakini hiyo ni kweli kila wakati kwa viwango vya usalama, na wimbi linaloongezeka huinua boti zote. Tunafikiria wingi wa matumizi utakuwa na API za sauti maarufu kutoka kwa kampuni kubwa-na kila mtu anapaswa kujua kuwa wanazungumza na roboti. Kutoka kwa nakala za tovuti yako zilizowekwa kwenye wavuti
Leave a Reply