Mga Key Takeaway
- Daming bilang ng mga programa ang makakaunawa sa iyong talumpati.
- Ang bagong teknolohiya ay bumubuo ng custom na ingay ng audio sa background habang nagsasalita ka para malito ang software na maaaring nakikinig.
-
Nakakamit ng bagong diskarte ang real-time na pagganap sa pamamagitan ng pagtataya ng pag-atake sa hinaharap ng signal o salita.
Maraming program ang makakaunawa sa iyong pagsasalita sa mga tawag sa telepono o video call, at sinasabi ng mga eksperto na maaari silang magdulot ng banta sa privacy.
Ang isang bagong teknolohiya na binuo ng mga mananaliksik ng Columbia University, na tinatawag na Neural Voice Camouflage, ay maaaring mag-alok ng depensa. Bumubuo ito ng custom na ingay ng audio sa background habang nagsasalita ka, na nakakalito sa artificial intelligence (AI) na nakikinig at nagsasalin ng mga boses.
"Ang pagkakaroon ng AI transcription ay naglalabas ng mga isyu ng tiwala," Michael Huth, co-founder ng Xayn, isang search engine na nagpoprotekta sa privacy, at pinuno ng Department of Computing sa Imperial College London, na hindi kasali sa ang pananaliksik, sinabi sa Lifewire sa isang panayam sa email. "Maaaring maging mas maingat ang mga kalahok sa pagpupulong kung aling mga punto ang kanilang itinataas at kung paano isinasalin ang kanilang pananalita. Ito ay maaaring maging isang magandang bagay dahil maaari itong mapabuti ang magalang na pag-uugali, ngunit maaari rin itong maging isang masamang bagay dahil ang pag-uusap ay maaaring hindi gaanong bukas dahil sa mga reserbasyon tungkol sa teknolohiyang ginamit."
Pakikinig at Pag-aaral
Nagsikap ang mga mananaliksik sa Columbia na magdisenyo ng algorithm na maaaring masira ang mga neural network sa real-time. Gumagamit ang bagong diskarte ng "mga mahuhulaang pag-atake"-isang senyales na maaaring makagambala sa anumang salita na sinasanay ng mga modelo ng awtomatikong pagkilala sa pagsasalita upang i-transcribe. Bilang karagdagan, kapag ang mga tunog ng pag-atake ay nilalaro sa himpapawid, kailangang sapat ang lakas ng mga ito upang maantala ang anumang mikroponong "nakikinig-in" na rogue na maaaring nasa malayo.
"Isang pangunahing teknikal na hamon sa pagkamit nito ay ang gawin itong lahat ng sapat na mabilis, " Carl Vondrick, isang propesor ng computer science sa Columbia at isa sa mga may-akda ng isang pag-aaral na naglalarawan sa bagong diskarte, sinabi sa isang balita palayain. "Ang aming algorithm, na namamahala upang harangan ang isang masamang mikropono mula sa tamang pagdinig sa iyong mga salita sa 80% ng oras, ay ang pinakamabilis at pinakatumpak sa aming testbed."
Nakakamit ng bagong diskarte ang real-time na pagganap sa pamamagitan ng pagtataya ng pag-atake sa hinaharap ng signal o salita. In-optimize ng team ang pag-atake, kaya mayroon itong volume na katulad ng normal na ingay sa background, na nagbibigay-daan sa mga tao sa isang kwarto na natural na makipag-usap at nang hindi matagumpay na sinusubaybayan ng isang awtomatikong speech recognition system.
Maaaring maging mas maingat ang mga kalahok sa pulong tungkol sa kung aling mga punto ang kanilang itinataas at kung paano isinasalin ang kanilang pananalita.
Sinabi ng mga siyentipiko na gumagana ang kanilang diskarte kahit na wala kang alam tungkol sa rogue na mikropono, gaya ng lokasyon nito, o maging ang computer software na tumatakbo dito. Itinatago nito ang boses ng isang tao over-the-air, itinatago ito mula sa mga sistema ng pakikinig na ito, at nang hindi nakakaabala sa pag-uusap ng mga tao sa silid.
"Sa ngayon, gumagana ang aming pamamaraan para sa karamihan ng bokabularyo ng wikang Ingles, at plano naming ilapat ang algorithm sa higit pang mga wika, at sa huli ay gawing ganap na hindi mahahalata ang tunog ng bulong, " Mia Chiquier, ang nangungunang may-akda ng pag-aaral at isang PhD na mag-aaral sa lab ni Vondrick, sinabi sa release ng balita.
Panatilihing Pribado ang Iyong Mga Pag-uusap
Parang hindi sapat ang lahat ng iyon, maaaring i-target ka rin ng mga advertisement batay sa audio na nakolekta mula sa iyong smartphone o mga smart home device, din.
"Gamit ang mga device tulad ng [ang Amazon Echo] at ang kanilang mga katapat, ang mga device na ito ay hindi lamang palaging nasa iyong tahanan, patuloy na nakikinig sa lahat ng iyong sinasabi o ginagawa, ngunit sila-sa loob ng mga taon ng pagkolekta ng data mula sa kanilang mga user-ay mayroon. perpektong pagpoproseso ng natural na wika (ginagawa ang pasalitang salita sa text/nagagamit na data para sa mga device sa pamamagitan ng kumbinasyon ng mga mikropono, software, at AI), " sabi ni Erik Haig, isang kasama sa Harbour Research, isang diskarte sa pagkonsulta at venture development firm, sa isang email.
Ang AI transcription ng conversational speech ay isa na ngayong karaniwang bahagi ng karaniwang komersyal na software, sabi ni Huth. Halimbawa, ang Microsoft Teams ay may opsyon sa record meeting na may built-in na AI transcription na makikita ng lahat ng kalahok sa real-time. Ang kumpletong transcript ay maaaring magsilbing talaan ng pulong. Karaniwan, pinapayagan ng mga naturang transcript ang pagkuha ng minuto (aka note-taking), kung saan maaaprubahan ang mga minuto sa susunod na pulong.
"Maaaring nag-aalala ang mga tao na matiktikan kapag naka-on ang transkripsyon ng AI, " dagdag ni Huth."Mukhang halos kapareho ito ng pag-aalala ng pagkakaroon ng pag-uusap na naitala nang walang pahintulot o patago."
Ngunit hindi lahat ay sumasang-ayon na ang mga smart device ay isang banta. Karamihan sa mga tao ay hindi kailangang mag-alala tungkol sa mga programang nakikinig sa iyong mga pag-uusap, si Brad Hong, isang customer success lead sa cybersecurity firm na Horizon3, ay nagsabi sa Lifewire sa pamamagitan ng email. Sinabi niya na ang pinakamahalagang alalahanin ngayon ay hindi kung sino ang nagre-record sa iyo, kundi kung paano nila iniimbak ang data.
"Lahat ng mga kuwentong naririnig tungkol sa isang mikropono sa kanilang computer o mga mobile device na ina-activate, nakikinig si Alexa o Google Home, o kahit na pagbabantay ng gobyerno, totoo na ang lahat ng ito ay nagpapakirot sa tiyan ng karaniwang tao," dagdag ni Hong. "Ngunit sa kabuuan, ang mga tao ay bihirang nasa isang sitwasyon na talagang nangangailangan ng pagbabalatkayo ng kanilang mga boses."