Ang mga Hacker ay Nakatuon sa Pagpapabuti ng AI

Talaan ng mga Nilalaman:

Ang mga Hacker ay Nakatuon sa Pagpapabuti ng AI
Ang mga Hacker ay Nakatuon sa Pagpapabuti ng AI
Anonim

Mga Key Takeaway

  • Isang bagong kolektibo ng mga developer ang bumubuo ng mga open-source na modelo ng AI.
  • Gumagamit ang grupo ng malalaking modelo ng pagsasanay sa wika na ilalabas nito sa ilalim ng mga bukas na lisensya.
  • Maaaring makatulong ang open-source AI na gawing mas madaling kapitan ng mga bias at error ang potensyal na pagbabago sa laro ng bagong teknolohiya.
Image
Image

Maraming pananaliksik sa artificial intelligence ng malalaking kumpanya (AI), ngunit gustong gawing demokrasya ng isang online na grupo ang proseso.

Ang EleutherAI ay isang kamakailang nabuong kolektibo ng mga boluntaryong mananaliksik, inhinyero, at developer na nakatuon sa open-source na pananaliksik sa AI. Ginagamit ng organisasyon ang mga codebase ng GPT-Neo at GPT-NeoX para sanayin ang malalaking modelo ng wika na pinaplano nitong ilabas sa ilalim ng mga bukas na lisensya.

"Ang open source data ay nakikinabang sa mga mananaliksik dahil ang mga siyentipiko ay may mas maraming libreng mapagkukunan na magagamit upang sanayin ang mga modelo at kumpletuhin ang pananaliksik," sinabi ni Edward Cui, ang CEO ng kumpanya ng AI na Graviti, sa Lifewire sa isang panayam sa email. Ang kanyang kumpanya ay hindi kasali sa EueutherAI. "Alam namin na maraming mga proyekto ng AI ang napigilan ng pangkalahatang kakulangan ng mataas na kalidad na data mula sa mga totoong kaso ng paggamit, kaya mahalagang magtatag ng gabay na nagsisiguro sa kalidad ng data, sa tulong ng kalahok na komunidad."

Ito ang Daan

Ang mga simula ng EleutherAI ay mapagpakumbaba. Noong nakaraang taon, isang independiyenteng AI researcher na nagngangalang Connor Leahy ang nag-post ng sumusunod na mensahe sa isang Discord server: "Hey guys let [SIC] give OpenAI a run for their money like the good ol' days."

At sa gayon, nabuo ang grupo. Mayroon na itong daan-daang contributor na nagpo-post ng kanilang code sa online na software repository na GitHub.

Hindi na bago ang open-sourcing AI na mga pagsisikap. Sa katunayan, ang Airflow workflow management platform ng Airbnb at ang data discovery engine ng Lyft ay ang mga resulta ng paggamit ng mga open-source na tool para paganahin ang mga data team na gumawa ng mas mahusay na trabaho sa data, itinuro ni Ali Rehman, project manager para sa software company na CloudiTwins sa isang email interview sa Lifewire.

"Kung paanong ang open-source na rebolusyon ay humantong sa pagbabago ng software development, gayundin ang nagtulak sa pagbuo at demokratisasyon ng data science at artificial intelligence," sabi ni Rehman. "Ang open source ay naging isang kritikal na enabler ng enterprise data science solutions, kung saan ang karamihan ng data scientist ay gumagamit ng mga open-source na tool."

Pagbukas ng Pinto

Maaaring makatulong ang pagbuo ng open-source AI na gawing hindi gaanong madaling kapitan ng mga bias at error ang potensyal na pagbabago sa laro ng bagong teknolohiya, ang sabi ng ilang tagamasid.

Pangunahing nangyayari ngayon ang AI research sa bukas, kung saan halos lahat ng kumpanya, research lab, at unibersidad ay nagpapakita ng kanilang mga resulta kaagad sa mga scholarly publication, sinabi ni Kush Varshney, isang AI researcher sa IBM, sa Lifewire sa isang email interview.

"Ang bukas na komunidad na ito ay mahalaga, dahil nagbibigay ito ng mga pinahusay na antas ng mga pagsusuri at balanse upang matiyak na ang AI ay sinasaliksik, nilikha, inilalagay, at inilalapat nang responsable," dagdag ni Varshney. "Ito ay partikular na kritikal sa mga sitwasyon kung saan ang mga system na ito ay maaaring makaimpluwensya sa buhay ng ating mga pinaka-mahina na miyembro ng lipunan. Ang pagiging bukas na ito ay nalalapat hindi lamang sa pangkalahatang machine learning at malalim na mga algorithm sa pag-aaral kundi pati na rin sa mga elemento ng mapagkakatiwalaang AI."

Sinabi ni Rehman na ang isa sa mga kritikal na pagkakaiba sa pagitan ng proprietary at open-source na software ay ang flexibility at customization. Ang pagmamay-ari na pananaliksik sa AI ay magkakaroon ng mga isyu sa seguridad, mga update, at pag-optimize.

Image
Image

"Ito ay dahil ang open-source na community-based na diskarte ay nakakakuha ng mahalagang input mula sa libu-libong mga eksperto sa industriya na tumutukoy sa mga potensyal na kahinaan sa seguridad na pagkatapos ay nareremediate nang mas mabilis," dagdag ni Rehman."Ang pinagkasunduan ng komunidad ay nangangahulugan na ang kalidad ay ginagarantiyahan at ang mga bagong pagkakataon ay mas madaling matukoy."

Ang isa pang isyu ay hindi magiging interoperable ang pagmamay-ari na pananaliksik sa AI, ibig sabihin, hindi ito gagana sa iba't ibang format ng data at malamang na magkaroon ng lock-in ng vendor, na pumipigil sa mga kumpanya na subukan at subukan ang software bago gumawa ng solusyon, Sabi ni Rehman.

Ngunit hindi lahat ng aspeto ng AI research ay kailangang open-source, sinabi ni Chris Kent, ang CEO ng medical AI company na Reveal Surgical, sa Lifewire sa isang email interview. "Mahalagang protektahan ang mga pang-ekonomiyang insentibo na nagtutulak sa komersyal na pag-unlad ng mga pangunahing aplikasyon ng AI," aniya.

Gayunpaman, ang pananaliksik sa AI ay nangangailangan ng isang matatag na bahagi ng open-source, sabi ni Kent. Idinagdag niya na gumagana ang open source upang bumuo ng tiwala at gumamit ng mga dataset na hindi o hindi dapat kontrolin ng mga iisang institusyon o kumpanya.

"Ang isang open-source na diskarte ay ang pinakamahusay na paraan upang matukoy at mabayaran ang pinagbabatayan na bias na maaaring umiiral sa mga set ng pagsasanay at hahantong sa mas holistic, malikhain, at maaasahang mga aplikasyon ng AI," sabi ni Kent.

Inirerekumendang: