Google вече поддържа оптичното разпознаване на текст за над 200 езика

13:30, 09 май 2015 г.
2,443
0
0
Вече сте гласувал/а!

Системата за оптично разпознаване на текст (OCR) на Google Drive официално увеличи списъка с поддържаните езици и сега те са над 200. Разпознават се и 25 различни системи за писане на текст. За добавяне разпознаването на нови езици и подобряване на разпознаването на предишните, специалистите на Google прилагат марковски вериги, които се използват и за разпознаване на човешка реч и търсене с помощта на гласови команди.

Последователността на действията е елементарна: необходимо е да се подаде към онлайн-услугата файла със сканирания текст, който може да е изображение с JPG, PNG, GIF формати или PDF документ.

Следващата стъпка е неговото отваряне с помощта на Google Docs - в показания пример се използва фрагмент на хинди. Не е необходимо указването на езика, понеже системата го разпознава автоматично. Процесът е съвсем същият и за операционната система Android. Разпознатият текст се появява под сканираното изображение. Графичните файлове се обработват за около 30 секунди, а разпознаването на PDF-документи може да продължи около една минута.

Безплатно могат да се разпознават изображения с обем до 2 MB, а от PDF-документите се обработват първите десет страници.

Източник: kaldata.com

Google вече поддържа оптичното разпознаване на текст за над 200 езика

Видеа по темата

Facebook коментари

Коментари в сайта

Докладване на коментар

Още новини от Технологии

Още новини

Препоръчано видео

Случаен виц

Последни обяви

Случайна рецепта

За Asenovgrad.NET

Главен редактор

Телефони

Последвай ни