Maganda ba o Masama ang Mga Super-Kahanga-hangang AI Audiobook na Ito?

Talaan ng mga Nilalaman:

Maganda ba o Masama ang Mga Super-Kahanga-hangang AI Audiobook na Ito?
Maganda ba o Masama ang Mga Super-Kahanga-hangang AI Audiobook na Ito?
Anonim

Mga Key Takeaway

  • Gumagamit ang DeepZen ng AI (artificial intelligence) para gumawa ng mga nakakagulat na makatotohanang audiobook mula sa text.
  • Gumagamit ang tech ng mga tunay na aktor ng boses ng tao para magbigay ng mga bloke sa pagbuo.
  • Ang Amazon at Audible ay kasalukuyang hindi tumatanggap ng mga audiobook na binuo ng computer.
Image
Image

Ang DeepZen ay isang kumpanyang gumagawa ng mga boses sa computer na ginagamit sa mga audiobook, batay sa mga tunay na boses ng mga taong aktor. Ang kalidad ay nakakatakot-madaling mahusay na pakinggan nang maraming oras sa isang pagkakataon. Ang gimik dito ay ang AI (artificial intelligence) component, na maaaring magbasa ng text at maghinuha ng tamang emosyonal na tugon batay sa konteksto. Pagkatapos ay inilalagay nito ang emosyon sa boses.

Ito ay kahanga-hanga at napakakombenyente. Ngunit gusto ba talaga natin ng homogenized na karanasan sa audiobook? At paano naman ang mga voice actor na iyon?

"Mula sa pananaw ng indie publisher, ang anumang nakakabawas sa gastos ng paggawa ng audiobook ay lubhang kawili-wili, " sinabi ni Rick Carlile, may-ari ng independiyenteng publisher na si Carlile Media, sa Lifewire sa pamamagitan ng email.

"Ngunit ipinapalagay ng atraksyong iyon na ang produkto ay magkakaroon ng pantay na kalidad sa tradisyonal na pagsasalaysay. Sa palagay ko ay hindi pa tayo isang daang porsyento doon. Huwag kang magkamali, ang DeepZen ay napakahusay. Ito ay isang napakalaking tagumpay, at ang mga tagalikha nito ay karapat-dapat sa napakalaking papuri at tagumpay. Ngunit hindi pa ito perpekto."

Audio na 'Good Enough'

Ang pinakamahusay na paraan upang maunawaan ang kalidad ng DeepZen ay makinig sa mga sample. Kung hindi mo alam na computer-generated sila, baka hindi mo namamalayan. Hindi naman saglit. Ipagpalagay natin na ang AI ng DeepZen ay perpekto at hindi nito kailanman binibigyang-kahulugan ang mga emosyonal na tala na dapat nitong tinatamaan.

Image
Image

Kahit na, ang isang tao ay maaaring mag-alok ng mas nuanced at kadalasang mas nakakagulat na mga interpretasyon. Maaaring maglagay ng hindi inaasahang twist ang isang aktor sa mga salitang hindi kailanman isasaalang-alang ng isang computer. At sa katotohanan, ang interpretasyon ng AI ay tiyak na hindi pa kasinghusay ng isang propesyonal na voice actor.

"Bilang isang nagtatrabaho sa mga pelikula at pinakakamakailan sa mundo ng pagsasalaysay ng audio, habang ako ay humanga sa AI-alam kong may malalim na kahulugan na hindi kayang bigyang-kahulugan ng isang makina," propesyonal na boses Sinabi ng aktor na si Paul Cram sa Lifewire sa pamamagitan ng email.

"Magkakaroon ba ng pagdagsa ng hindi kilalang mga may-akda na gumagamit nito? Ginagarantiya ko na magkakaroon ito dahil ito ay 'sapat na.'"

Ang pagiging sapat na mahusay, kasama ang kaginhawahan at pagtitipid sa gastos, ay maaaring sapat na upang himukin ang mga indie publisher sa serbisyo.

"Maaaring nagkakahalaga ang mga audiobook ng hanggang $500 bawat natapos na oras ng audio (higit pa para sa boses ng celebrity), at hindi kasama doon ang gastos sa oras ng pamamahala at admin, " sabi ni Carlile. "Ang kakayahang hatiin ang gastos na iyon sa pamamagitan lamang ng pag-upload ng manuskrito sa isang provider tulad ng DeepZen ay lubhang kaakit-akit."

Talking Trouble

Hindi pa ito kasing dali ng pagpapaputok sa iyong mga voice actor at pag-upload ng mga manuscript sa DeepZen. Sa kasalukuyan ay may isang hadlang sa madaling audiobook AI orasyon, at ito ay mula sa Amazon.

Image
Image

"Sa kasalukuyan, ang ACX, ang ruta ng self-publisher sa pamamahagi ng Audible at Amazon audiobook, ay hindi tatanggap ng mga audiobook na hindi nai-record ng isang tao, " sabi ni Carlile.

Bakit? Kalidad. Narito ang FAQ entry mula sa website:

"Text-to-speech o iba pang mga automated na pag-record ay hindi pinapayagan. Ang mga naririnig na tagapakinig ay pumipili ng mga audiobook para sa pagganap ng materyal, pati na rin ang kuwento. Upang matugunan ang inaasahan, ang iyong audiobook ay dapat na naitala ng isang tao."

Ito ay nangangahulugan na ang mga audiobook na binuo ng DeepZen ay wala na sa ngayon, hindi bababa sa. Ito ay purong haka-haka, ngunit ang DeepZen ay tila isang magandang pagkuha para sa Amazon, na hinahayaan itong ibenta ang serbisyo at panatilihin ito para lamang sa Audible na mga aklat. At kahit na hindi iyon mangyari, kung ang kalidad ng mga audiobook na binuo ng computer ay kasing ganda nito, kung gayon ay tila maliit na dahilan upang hindi gumawa ng pagbubukod sa panuntunang ito.

Masaya ka bang makinig sa mga audiobook na ginawa sa ganitong paraan? Kapag nangyari ito, karamihan sa mga tao ay hindi maghihinala. Maaaring mas gusto ng ilan ang pagiging perpekto ng mga boses na binuo ng computer dahil mas pipiliin nila ang mga vocal tics at gawi na minsan ay nakakagambala. Ang teknolohiya ay angkop din para sa mga video game, TV at radio ad, at anumang iba pang senaryo kung saan ka kukuha ng voice actor.

Ang teknolohiya ng DeepZen ay gagawa din ng isang mahusay na paraan upang awtomatikong gumawa ng mga podcast ng balita mula sa mga nakasulat na artikulo, na maaaring maging madaling gamitin para sa pag-commute.

At paano naman ang mga voice actor na iyon? Well, magkakaroon ng kahit isang pagkakataon: Maaari silang pumunta at magtrabaho para sa DeepZen.

Inirerekumendang: