Real-Time na Sub title at Pagsasalin ay Maaaring Kinabukasan ng Video Chat

Talaan ng mga Nilalaman:

Real-Time na Sub title at Pagsasalin ay Maaaring Kinabukasan ng Video Chat
Real-Time na Sub title at Pagsasalin ay Maaaring Kinabukasan ng Video Chat
Anonim

Mga Key Takeaway

  • Gumagamit ang Navi ng SharePlay, at ang built-in na speech-to-text ng Apple, upang mag-alok ng mga sub title at pagsasalin sa FaceTime.
  • Ito ay malayo sa perpekto ngunit sapat na.
  • Mahusay ang mga sub title para sa accessibility.
Image
Image

Ang Navi ay isang app na nagdaragdag ng mga live na sub title, at real-time na pagsasalin, sa iyong mga tawag sa FaceTime.

Gumagamit ang app ng SharePlay at built-in na Speech Recognition para magdagdag ng mga sub title at pagsasalin sa 20 wika sa iyong mga tawag sa FaceTime. Ito ay isang hindi kapani-paniwalang paggamit ng SharePlay, na itinuturing ng karamihan sa atin bilang isang mapaglarong paraan upang manood ng mga naka-sync na pelikula kasama ng mga tao sa ibang mga lugar. Maaaring hindi mo pa kailangang paalisin ang iyong tagasalin, ngunit maaaring maging lubhang kapaki-pakinabang ang isang app na gumagawa nito.

Hindi ko nakukuha ang audio mula sa tawag sa FaceTime,” isinulat ng developer ng Navi na si Jordi Bruin sa Twitter, “ngunit ginagamit ang SharePlay upang ibahagi ito sa mga kalahok sa tawag.”

SharePlay

Ang SharePlay ay isang bagong feature sa iOS 15 at macOS 12.1 na hinahayaan kang magbahagi at mag-synchronize ng mga bagay sa mga tawag sa FaceTime. Sa halimbawa ng panonood ng pelikula sa itaas, maaaring i-pause o i-play ng sinumang kalahok ang pelikula, halimbawa, habang nakikipag-chat kayong lahat sa tawag sa FaceTime. Nananatiling bukas ang FaceTime video sa isang maliit, lumulutang, picture-in-picture na panel, at lokal na pinapatakbo ng bawat kalahok ang app sa kanilang device. Ang trick ng SharePlay ay i-sync ang anumang nangyayari sa mga lokal na app na ito, kaya lahat ay nagbabahagi ng karanasan, maging ito ay isang pelikula, isang Fitness+ workout, o isang spreadsheet.

Navi ay gumagamit ng parehong teknolohiya, tanging ang in-call na app ay hindi isang pelikula-ito ay isang real-time na translation engine. Para magamit ito, ilulunsad mo ang app habang nasa isang tawag sa FaceTime at i-tap ang button na 'I-on ang Mga Sub title'. Pagkatapos, ang ibang mga kalahok ay maaari ding sumali sa aksyon at makakita ng mga live na sub title para sa kasalukuyang speaker. Kung ang isang tao ay nagmomonologue, lumalaki ang kanyang speech bubble at nananatili nang mas matagal.

Image
Image

Para sa mga bingi, ito ay maaaring mangahulugan ng pagkakaiba sa pagitan ng pagtawag sa mga tao o hindi. At para sa sinuman, nangangahulugan ito na maaari kang magkaroon ng mga kapaki-pakinabang na pag-uusap sa pagitan ng mga taong hindi gumagamit ng wika.

Universal Text

Ang internet ay binuo sa text, at maganda iyon. Ito ay maliit at madaling gawin, basahin, at isalin. Simple lang din na maging synthesized speech. Ang resulta ay ang sinuman mula sa kahit saan ay maaaring lumahok sa anumang pag-uusap. Hindi hadlang ang wika, at hindi rin ang pagkabingi o anumang uri ng pagkabulag-basta gumagamit ka ng device na may mahusay na mga tool sa accessibility para sa may kapansanan sa paningin o pandinig.

Ngunit ang binibigkas na salita ay mas mahirap iproseso. Ang pagdidikta ng speech-to-text ay kahanga-hanga, ngunit kamakailan lamang ay naging sapat na ang pangkalahatang pagkilala sa pagsasalita para sa pangkalahatang paggamit-Ang Translate app ng Apple ay isang magandang halimbawa. Ipinakilala sa iOS 15, nag-aalok ito ng mga real-time na audio translation. Kung magbabakasyon pa rin tayo sa ibang bansa, magiging perpekto ito.

Ngayon, mas marami na kaming ginagamit na video para sa trabaho at para manatiling nakikipag-ugnayan sa mga kaibigan at pamilya. Gaano man tayo magtrabaho sa hinaharap, ang hadlang sa mga video call ay lubusang nasira. Isa na itong pangkaraniwang tool, ngunit kulang ito ng napakahusay sa mga nakasulat na tool sa komunikasyon.

Ang isang bagay tulad ng Navi, na nag-aalok ng mga real-time na sub title at pagsasalin, ay maaaring maging makabuluhan. Ang pagiging naa-access ay isang aspeto, ngunit ang kakayahang makipag-usap sa mga taong hindi mo ginagamit ang wika ay nagbubukas ng internasyonal na negosyo sa isang nakakagulat na antas.

Image
Image

In Action

Sinubukan ko ang Navi sa developer ng app, may-akda, at user ng hearing-aid na si Graham Bower. Ito ay medyo maganda ngunit hindi pa handa para sa mga kritikal na gawain. Ang ilan sa mga transkripsyon ay nakakatawang masama at masyadong bulgar upang maiugnay. Gayunpaman, habang nagpapatuloy ang aming pag-uusap, naging mas mahusay sa tumpak na pagkilala sa kanyang pananalita. Makatuwiran iyon dahil ang iOS dictation engine ay umaangkop sa iyong boses sa paglipas ng panahon.

Gumagana rin ang pagsasalin, bagama't nakadepende ang kalidad ng mga pagsasalin nito sa katumpakan ng input.

Madaling i-proyekto ang ganitong uri ng teknolohiya sa hinaharap na Apple Glasses o anumang napapabalitang produkto ng AR/VR na gumagana sa linggong ito.

"Nakikita kong gumagana ito sa AR glasses," sabi ni Bower sa aming pag-uusap. "Ang ilang mga tao, kahit na may normal na pandinig, ay mas gusto ang mga sub title sa mga pelikula. Ito ay magiging tulad ng mga sub title sa totoong buhay."

Habang isang kahanga-hangang tech demo, wala pa ang Navi. Para sa maaasahang paggamit sa negosyo, ang paunang pagkilala sa pagsasalita ng Apple ay kailangang makakuha ng mas tumpak. Ngunit sa bilis, ayos lang, at ang mga pagsasalin ay kasing ganda ng anupaman.

Ngunit nasa landas na tayo ngayon, at gagaling lang ang ganitong bagay.

Inirerekumendang: