sobota 1. listopadu 2008

Google jako OCR

Oficiální blog společnosti Google předevčírem oznamil, že jejich vyledávač obohatil výsledky hledání ve formátu PDF o významnou novinku. V případě, že byl soubor PDF vytvořen spojením obrázků, pak se jej Google pokouší konvertovat do textové podoby a indexovat ho. Jak moc úspěšně není jasné, avšak můžete si to vyzkoušet sami. Stačí jen k hledanému termínu přidat filtr ext:pdf. Chcete-li tedy najít PDF soubory obsahující slovo Heidegger, vypište do hledáčku Google frazy v úvozovkách: "Heidegger ext:pdf" (vložte samozřejmě bez úvozovek).

Žádné komentáře: