Mga Key Takeaway
- Ang isang bagong modelo ng machine learning ay nagha-hallucinate ng isang larawan ng hitsura ng isang pangungusap sa isang wika upang tumulong sa pagsasalin.
- Ang AI system, na tinatawag na VALHALLA, ay idinisenyo upang gayahin ang paraan ng pag-unawa ng mga tao sa wika.
- Ang bagong system ay bahagi ng lumalagong kilusan para gamitin ang AI para maunawaan ang wika.
Ang pamamaraan ng tao sa pag-visualize ng mga larawan habang nagsasalin ng mga salita ay maaaring makatulong sa artificial intelligence (AI) na mas maunawaan ka.
Ang isang bagong modelo ng machine learning ay nagha-hallucinate ng isang larawan ng kung ano ang hitsura ng isang pangungusap sa isang wika. Ayon sa isang kamakailang papel ng pananaliksik, ang pamamaraan ay gumagamit ng visualization at iba pang mga pahiwatig upang tumulong sa pagsasalin. Bahagi ng lumalagong kilusan ang paggamit ng AI para maunawaan ang wika.
"Natatangi ang paraan ng pagsasalita at pagsusulat ng mga tao dahil lahat tayo ay may bahagyang magkakaibang mga tono at istilo, " sinabi ni Beth Cudney, isang propesor ng data analytics sa Maryville University, na hindi kasama sa pananaliksik, sa Lifewire sa isang panayam sa email. "Ang pag-unawa sa konteksto ay mahirap dahil ito ay tulad ng pagharap sa hindi nakaayos na data. Dito ay kapaki-pakinabang ang natural na pagpoproseso ng wika (NLP). Ang NLP ay isang sangay ng AI na tumutugon sa mga pagkakaiba sa kung paano tayo nakikipag-usap gamit ang machine reading comprehension. Ang pangunahing pagkakaiba sa NLP, bilang isang sangay ng AI, ay hindi lamang nakatuon sa literal na kahulugan ng mga salitang binibigkas o isinusulat natin. Tinitingnan nito ang kahulugan."
Go Ask Alice
Ang bagong AI system, na tinatawag na VALHALLA, na ginawa ng mga mananaliksik mula sa MIT, IBM, at University of California sa San Diego, ay idinisenyo upang gayahin ang paraan ng pag-unawa ng mga tao sa wika. Ayon sa mga siyentipiko, ang paggamit ng pandama na impormasyon, tulad ng multimedia, na ipinares sa mga bago at hindi pamilyar na salita, tulad ng mga flashcard na may mga larawan, ay nagpapabuti sa pagkuha at pagpapanatili ng wika.
Pinapataas ng mga system na ito ang kapangyarihan ng mga chatbot na kasalukuyang sinanay lang at may kakayahan sa mga partikular na pag-uusap…
Inaaangkin ng team na pinapabuti ng kanilang pamamaraan ang katumpakan ng machine translation kaysa text-only na pagsasalin. Gumamit ang mga siyentipiko ng arkitektura ng encoder-decoder na may dalawang transformer, isang uri ng modelo ng neural network na angkop para sa data na umaasa sa sequence, tulad ng wika, na maaaring magbigay-pansin sa mga keyword at semantika ng isang pangungusap. Ang isang transformer ay bumubuo ng isang visual na guni-guni, at ang isa ay nagsasagawa ng multimodal na pagsasalin gamit ang mga output mula sa unang transformer.
"Sa totoong mundo na mga sitwasyon, maaaring wala kang larawan na may kinalaman sa pinagmulang pangungusap," sabi ni Rameswar Panda, isa sa mga miyembro ng research team, sa isang news release. "Kaya, ang aming motibasyon ay karaniwang: Sa halip na gumamit ng panlabas na larawan sa panahon ng hinuha bilang input, maaari ba kaming gumamit ng visual na guni-guni-ang kakayahang mag-isip ng mga visual na eksena-upang mapabuti ang mga sistema ng pagsasalin ng makina?"
Pag-unawa sa AI
Ang malaking pananaliksik ay nakatuon sa pagsulong ng NLP, itinuro ni Cudney. Halimbawa, co-founder ng Elon Musk ang Open AI, na gumagana sa GPT-3, isang modelo na maaaring makipag-usap sa isang tao at sapat na savvy upang bumuo ng software code sa Python at Java.
Nagsusumikap din ang Google at Meta na bumuo ng AI sa pakikipag-usap sa kanilang system na tinatawag na LAMDA. "Ang mga system na ito ay nagdaragdag ng kapangyarihan ng mga chatbot na kasalukuyang sinanay at may kakayahang mga partikular na pag-uusap, na malamang na magbabago sa mukha ng suporta sa customer at mga help desk," sabi ni Cudney.
Aaron Sloman, ang co-founder na CLIPr, isang kumpanya ng AI tech, ay nagsabi sa isang email na ang malalaking modelo ng wika tulad ng GPT-3 ay maaaring matuto mula sa napakakaunting mga halimbawa ng pagsasanay upang mapabuti ang mga buod ng teksto batay sa feedback ng tao. Halimbawa, aniya, maaari mong bigyan ang isang malaking modelo ng wika ng isang problema sa matematika at hilingin sa AI na mag-isip nang sunud-sunod.
"Maaasahan nating makukuha ang mas malalaking insight at pangangatwiran mula sa malalaking modelo ng wika habang natututo tayo ng higit pa tungkol sa kanilang mga kakayahan at limitasyon," dagdag ni Sloman. "Inaasahan ko rin na ang mga modelo ng wikang ito ay gagawa ng higit pang mga prosesong katulad ng tao habang ang mga modelo ay gumagawa ng mas mahuhusay na paraan upang i-fine-tune ang mga modelo para sa mga partikular na gawain ng interes."
Georgia Tech computing professor Diyi Yang ay hinulaang sa isang email interview na mas makikita natin ang paggamit ng natural language processing (NLP) system sa ating pang-araw-araw na buhay, mula sa NLP-based na personalized na mga katulong upang tumulong sa mga email at tawag sa telepono, sa mga sistemang may kaalaman sa pag-uusap para sa paghahanap ng impormasyon sa paglalakbay o pangangalaga sa kalusugan."Gayundin ang mga patas na AI system na maaaring magsagawa ng mga gawain at tumulong sa mga tao sa isang responsable at walang bias na paraan," dagdag ni Yang.
Napakalaking modelo ng AI na gumagamit ng trilyong parameter gaya ng GPT-3 at DeepText ay patuloy na gagana patungo sa isang modelo para sa lahat ng application ng wika, hinulaang si Stephen Hage, isang machine learning engineer sa Dialexa, sa isang panayam sa email. Sinabi niya na magkakaroon din ng mga bagong uri ng mga modelo na gagawin para sa mga partikular na gamit, gaya ng voice-commanded online shopping.
"Ang isang halimbawa ay maaaring isang mamimili na nagsasabing 'Ipakita sa akin ang eyeshadow na ito sa midnight blue na may higit pang halo, ' upang ipakita ang lilim na iyon sa mga mata ng tao na may kontrol sa kung paano ito inilalapat, " dagdag ni Hage.