Ang Optical Character Recognition (OCR) nagtumong sa software nga nagmugna sa usa ka digital nga bersyon sa usa ka giimprinta, gi-type, o sinulat sa kamot nga dokumento nga mabasa sa mga kompyuter nga dili kinahanglang manang-tangan o ipasok ang teksto. Ang OCR sa kasagaran gigamit sa scan nga mga dokumento sa format sa PDF , apan mahimo usab nga maghimo sa usa ka computer nga mabasa nga bersyon sa teksto sulod sa usa ka file sa imahe.
Unsa ang OCR?
Ang OCR, nga gitawag usab nga text recognition, usa ka software technology nga nag-usab sa mga karakter sama sa mga numero, mga letra, ug punctuation (gitawag usab og glyphs) gikan sa giimprinta o nakasulat nga mga dokumento ngadto sa elektronik nga porma nga mas dali nga giila ug gibasa sa mga kompyuter ug uban pang mga programa sa software. Ang ubang mga programa sa OCR naghimo niini ingon nga usa ka dokumento ang gitan-aw o gipakita sa usa ka digital camera ug ang uban mahimo nga magamit kini nga proseso ngadto sa mga dokumento nga kaniadto na-scan o gihulagway nga walay OCR. Ang OCR nagtugot sa mga tiggamit sa pagpangita sulod sa mga dokumento sa PDF, pag-edit sa teksto, ug pag-format sa mga dokumento.
Unsa ang Gigamit sa OCR?
Alang sa dali, matag adlaw nga panginahanglan sa pag-scan, ang OCR dili usa ka dako nga kasabutan. Kung maghimo ka og daghang pag-scan, ang pagpangita sa sulod sa mga PDF aron mahibal-an ang eksakto nga imong gikinahanglan makaluwas og gamay nga oras ug makahimo sa OCR nga gamit sa imong scanner nga programa nga mas importante. Ania ang uban pang mga butang nga OCR nagtabang sa:
- Automated data processing ug data entry (Pananglitan: Job applicant tracking system alang sa resumes)
- Makita ang mga libro nga scan
- Pag-convert sa gisulat sa kamot nga sinulat ngadto sa teksto nga mabasa sa computer
- Ang paghimo sa mga dokumento nga mas magamit sa mga programa sa tigbasa nga motabang sa mga gumagamit nga may depekto sa panan-aw
- Pagpreserba sa mga makasaysayan nga mga dokumento ug mga pamantalaan, samtang naghimo usab kini nga pangitaon
- Data pagkuha ug pagbalhin ngadto sa mga programa sa accounting (Pananglitan: Mga resibo ug mga invoice)
- Pag-indeks sa mga dokumento nga gamiton sa mga search engine
- Pag-ila sa mga plaka sa lisensya sa drayber pinaagi sa speed camera ug red-light camera software
- Ang mga tigpasiugda sa sinultian alang sa mga tawo nga dili makasulti - ang teoretikal nga physicist, si Stephen Hawking, tingali ang labing inila nga tigpamaba sa usa ka speech synthesizer nga programa
Nganong Gamiton ang OCR?
Ngano nga dili lang pagkuha og litrato, dili ba? Tungod kay dili ka makahimo sa pag-edit sa bisan unsa o pagsiksik sa teksto tungod kay kini usa lamang ka imahen. Ang pag-scan sa dokumento ug pagpadagan sa OCR software makahimo sa maong file nga usa ka butang nga mahimo nimong i-edit ug makapangita.
Kasaysayan sa OCR
Samtang ang labing una nga paggamit sa pag-ila sa teksto petsa sa 1914, ang nagkalapad nga pag-uswag ug paggamit sa mga teknolohiya nga may kalabutan sa OCR nagsugod sa tinguha sa dekada 1950, ilabi na sa pagmugna sa mga gipasayon nga mga font nga sayon nga pag-convert sa digital nga mabasa nga teksto. Ang una niining gipasayon nga mga font gimugna ni David Shepard ug nailhan nga OCR-7B. Ang OCR-7B gigamit gihapon karon sa industriya sa panalapi alang sa standard font nga gigamit sa mga credit card ug mga debit card. Sa dekada 1960, ang mga serbisyo sa koreyo sa daghang mga nasod nagsugod sa paggamit sa teknolohiya sa OCR aron mapadali ang pag-sort sa mail, lakip ang Estados Unidos, Great Britain, Canada, ug Germany. Ang OCR mao gihapon ang uyok nga teknolohiya nga gigamit sa pagsulat sa mail alang sa mga serbisyo sa koreyo sa tibuok kalibutan. Niadtong 2000, ang mahinungdanong kahibalo sa mga limitasyon ug kapabilidad sa teknolohiya sa OCR gigamit sa pagpalambo sa mga programa sa CAPTCHA nga gigamit sa paghunong sa mga bot ug mga spammer.
Sulod sa mga dekada, ang OCR nagkadako nga mas tukma ug labi ka komplikado tungod sa mga kalamboan sa mga dapit nga may kalabutan sa teknolohiya sama sa artificial intelligence , pagkat-on sa makina , ug computer vision. Karon, ang OCR software naggamit sa pagkilala sa pattern, pagtuki sa feature, ug pagmina sa teksto aron sa pagbag-o sa mga dokumento nga mas paspas ug mas tukma kaysa kaniadto.