Google zoekt in gescande documenten

Vorig artikel Volgend artikel
Google zoekt in gescande documenten

Google maakt het mogelijk om voortaan ook gescande documenten te doorzoeken op relevante resultaten. Google maakt hiervoor gebruik van een door haar zelf sterk verbeterde OCR (Optical Character Recognition) technologie.

Met deze innovatie maakt Google het mogelijk om miljoenen documenten, veelal in de vorm van .pdf files met afbeeldingen, voortaan volledig te indexeren en daarmee te ontsluiten.

Op het officiele Google Blog staan inmiddels een 4-tal voorbeelden. Wanneer je op het eerste voorbeeld klikt, repairing aluminum wiring, zie je het document verschijnen als PDF bestand. Wanneer je echter kiest voor de HTML-versie, zul je zien dat het document nu ook als "platte tekst" is te bekijken en daarmee ook valt te bewerken (copy/paste).

Reageren is uitgeschakeld omdat er geen cookies opgeslagen worden.

Cookies toestaan Meer informatie over cookies