Ano ang Optical Character Recognition (OCR)?

Talaan ng mga Nilalaman:

Ano ang Optical Character Recognition (OCR)?
Ano ang Optical Character Recognition (OCR)?
Anonim

Ang Optical Character Recognition (OCR) ay tumutukoy sa software na lumilikha ng digital na bersyon ng isang naka-print, nai-type, o sulat-kamay na dokumento na mababasa ng mga computer nang hindi kailangang manu-manong mag-type o maglagay ng text. Karaniwang ginagamit ang OCR sa mga na-scan na dokumento sa format na PDF, ngunit maaari ding lumikha ng nababasa ng computer na bersyon ng text sa loob ng isang image file.

Ano ang OCR

Ang OCR, na tinutukoy din bilang text recognition, ay teknolohiya ng software na nagpapalit ng mga character gaya ng mga numero, titik, at bantas (tinatawag ding mga glyph) mula sa mga naka-print o nakasulat na dokumento tungo sa isang electronic form na mas madaling makilala at mabasa ng mga computer at iba pang mga software program. Ginagawa ito ng ilang OCR program habang ang isang dokumento ay na-scan o nakuhanan ng larawan gamit ang isang digital camera at ang iba ay maaaring ilapat ang prosesong ito sa mga dokumento na dati nang na-scan o nakuhanan ng larawan nang walang OCR. Binibigyang-daan ng OCR ang mga user na maghanap sa loob ng mga PDF na dokumento, mag-edit ng text, at muling mag-format ng mga dokumento.

Image
Image
Pag-scan ng makasaysayang pahayagan gamit ang OCR software.

Getty Images

Para Saan Ang OCR?

Para sa mabilis, pang-araw-araw na pangangailangan sa pag-scan, maaaring hindi malaking bagay ang OCR. Kung gagawa ka ng isang malaking halaga ng pag-scan, ang kakayahang maghanap sa loob ng mga PDF upang mahanap ang eksaktong kailangan mo ay makakatipid ng kaunting oras at gawing mas mahalaga ang OCR functionality sa iyong scanner program. Narito ang ilang iba pang bagay na nakakatulong sa OCR:

  • Awtomatikong pagpoproseso ng data at pagpasok ng data (Halimbawa: Mga sistema ng pagsubaybay sa aplikante ng trabaho para sa mga resume).
  • Paggawa ng mga na-scan na aklat na mahahanap.
  • Pag-convert ng mga sulat-kamay na pag-scan sa text na nababasa ng computer.
  • Paggawa ng mga dokumento na mas magagamit ng mga reader program na tumutulong sa mga user na may kapansanan sa paningin.
  • Pag-iingat ng mga makasaysayang dokumento at pahayagan, habang ginagawang mahahanap din ang mga ito.
  • Pagkuha ng data at paglilipat sa mga programa sa accounting (Halimbawa: Mga resibo at invoice).
  • Pag-i-index ng mga dokumento para magamit ng mga search engine.
  • Pagkilala sa mga plaka ng driver ng lisensya sa pamamagitan ng speed camera at red-light camera software.
  • Mga speech synthesizer para sa mga taong hindi marunong magsalita – ang theoretical physicist, si Stephen Hawking, ay marahil ang pinakakilalang user ng isang speech synthesizer program.

Bottom Line

Bakit hindi na lang magpa-picture, di ba? Dahil hindi mo magagawang mag-edit ng anuman o maghanap sa teksto dahil ito ay magiging isang imahe lamang. Ang pag-scan sa dokumento at pagpapatakbo ng OCR software ay maaaring gawing isang bagay na maaari mong i-edit at mahahanap.

History of OCR

Habang ang pinakaunang paggamit ng pagkilala sa teksto ay nagsimula noong 1914, ang malawakang pag-unlad at paggamit ng mga teknolohiyang nauugnay sa OCR ay nagsimula nang masigasig noong 1950s, partikular sa paglikha ng napakasimpleng mga font na mas madaling i-convert sa digital- nababasang teksto. Ang una sa mga pinasimpleng font na ito ay ginawa ni David Shepard at karaniwang kilala bilang OCR-7B. Ginagamit pa rin ngayon ang OCR-7B sa industriya ng pananalapi para sa karaniwang font na ginagamit sa mga credit card at debit card. Noong dekada ng 1960, nagsimulang gumamit ng teknolohiyang OCR ang mga serbisyo sa koreo sa ilang bansa upang mapabilis ang pag-uuri ng mail, kabilang ang United States, Great Britain, Canada, at Germany. Ang OCR pa rin ang pangunahing teknolohiyang ginagamit upang pagbukud-bukurin ang mail para sa mga serbisyong pang-koreo sa buong mundo. Noong 2000, ginamit ang pangunahing kaalaman sa mga limitasyon at kakayahan ng teknolohiya ng OCR upang bumuo ng mga programang CAPTCHA na ginamit upang ihinto ang mga bot at spammer.

Sa paglipas ng mga dekada, ang OCR ay naging mas tumpak at mas sopistikado dahil sa mga pagsulong sa mga nauugnay na larangan ng teknolohiya gaya ng artificial intelligence, machine learning, at computer vision. Ngayon, ang OCR software ay gumagamit ng pattern recognition, feature detection, at text mining para baguhin ang mga dokumento nang mas mabilis at mas tumpak kaysa dati.

FAQ

    Paano ako mag-i-scan ng mga dokumento gamit ang aking telepono o tablet?

    Sa iOS, buksan ang Notes app at gumawa ng bagong tala. Buksan ang camera, at pagkatapos ay i-tap ang Scan Documents. Sa Android, buksan ang Google Drive at piliin ang Plus (+), pagkatapos ay i-tap ang Scan upang i-scan ang dokumento gamit ang iyong telepono.

    Paano ko gagamitin ang OCR sa Adobe Acrobat?

    Magbukas ng PDF file na naglalaman ng na-scan na larawan, pagkatapos ay piliin ang Tools > Edit PDF. Awtomatikong ilalapat ng Acrobat ang OCR upang ma-edit mo ang teksto. Piliin lang kung saan mo gustong mag-edit at magsimulang mag-type.

    Ano ang pagkakaiba ng OCR at OMR?

    Ang Optical Mark Recognition (OMR) ay software na nakakakita ng mga marka sa papel, karaniwang isang bubble sheet. Ang OMR ay ginagamit upang iproseso ang mga resulta ng mga pagsusulit, mga survey, mga talatanungan, at maging ang mga halalan. Hindi tulad ng OCR, hindi matukoy ng OMR ang mga marka sa page, ngunit i-verify lang kung nandoon ang mga marka.

Inirerekumendang: