Internet

Google Docs får OCR

Google Docs - online-tekstbehandleren fra søgegiganten - tilbyder nu brugerne at konvertere tekster fra PDF- og billedfiler til Google-dokumenter.

Siden oktober måned har Google-Docs-api understøttet optisk tegngenkendelse (OCR).

Men indtil nu har Google selv kun anvendt mulighederne eksperimentalt. Ifølge Google er kravene til tegngenkendelsen, at et bogstav er mindst ti pixel højt.

Billedmateriale skal helst foreligge som gråtone- eller sorthvid-billeder. Google understøtter i forbindelse med OCR-upload formaterne JPEG, PNG, GIF og PDF.