Skenuoto teksto atpažinimas su Google Docs

googleocr17.png

Ar žinote, kad Google Docs dabar gali įkelti į dokumentą ir paversti redaguojamu tekstą iš skenuoto originalo? Ši funkcija dar nėra oficialiai įdiegta, todėl reikia naudoti specialią skenuotos medžiagos įkėlimo formą (prieš tai reikia prisijungti prie Google paskyros). Bandomasis teksto atpažinimas kol kas veikia tik su lotynų abėcėlės ženklais ir minimalia žodyno pagalba, tačiau ryškiai ir kokybiškai skenuotą tekstą įkelti į dokumentus internete jau galima, ypač jei jie parašyti anglų kalba. Tokio sprendimo labai laukiau, nes specializuotos OCR programos yra per brangios asmeniniam naudojimui.

Google, tiesa, ne pirmoji siūlanti tokią tarnybą – daug anksčiau skenuoto teksto atpažinimo paslaugą pasiūlė užrašinė internete Evernote. Evernote nepamėgau dėl prastos sąsajos ir apribojimų nemokamai versijai – atrodo nesaugu dėti dokumentus į tarnybą, kuri gali pareikalauti pinigų pačiu netinkamiausiu metu. Teksto atpažinimo integravimas į Google Docs – logiškas ir patrauklus žmonėms sprendimas, nes visiškai nemokamas. Kai, laikui bėgant, OCR atsiras įvairiomis kalbomis, neredaguojamą tekstą paveikslėliuose apskritai galėsime pamiršti.

This entry was posted in internetas and tagged , , , . Bookmark the permalink. Both comments and trackbacks are currently closed.

8 Comments

  1. Posted 2009.10.17 at 16:45 | Permalink

    O ką šiuo metu naudoji užrašams vietoje Evernote?

    • vienastoks
      Posted 2009.10.17 at 18:06 | Permalink

      Naudoju programėlę Yojimbo, sinchronizuojamą per MobileMe. Ji, tiesa, neturi OCR ir (kol kas) iPhone versijos.

  2. Marius
    Posted 2009.10.17 at 17:05 | Permalink

    Ar kas nors turėjo galimybę pažiūrėt, kaip atpažįstami tekstai lietuvių kalba? (pats neturiu galimybės patikrint, todėl ir klausiu).

  3. Tomas
    Posted 2009.10.17 at 17:31 | Permalink

    Lietuvisku raidziu neatpazista. http://www.ipix.lt/images/51551430.jpg

    • Marius
      Posted 2009.10.17 at 22:31 | Permalink

      Ačiū už atsakymą ir nepatingėjimą įdėt ir iliustraciją.
      Nujiena gera, bet, kadangi lietuvių kalba gūgliui kol kas svetima – man nebus naudinga.

  4. ewal
    Posted 2009.10.17 at 18:35 | Permalink

    paskutinis sakinys – kažkoks kliedesiukas. tipo kai atsiras OCR visomis kalbomis, bus galima redaguoti tekstą paveikslėliuose?

  5. Posted 2009.10.17 at 20:15 | Permalink

    Bandau jau kelintą kartą.
    Su puslapyje pateiktu pavyzdžiu veikia, su nuskenuotu lietuviškos knygos lapu išmeta tuščią dokumentą be nei vienos raidės.

  6. Paulius
    Posted 2009.10.17 at 20:38 | Permalink

    Puikios naujienos, pravers.