Автор: Роман Писаный, 08 Декабря 2010 в 17:35, реферат
Оптическое распознавание текста (англ. optical character recognition, OCR) — это механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе. Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учета в бизнесе или для публикации текста на веб-странице.
1. История.
2. Текущее состояние технологии оптического распознавания текста.
3. Программы распознавания текста.
4. Fine Reader
Введение:
Оптическое
распознавание текста (англ. op
Системы оптического
распознавания текста требуют калибровки
для работы с конкретным шрифтом;
в ранних версиях для программирования
было необходимо изображение каждого
символа, программа одновременно могла
работать только с одним шрифтом. В настоящее
время больше всего распространены так
называемые «интеллектуальные» системы,
с высокой степенью точности распознающие
большинство шрифтов. Некоторые системы
оптического распознавания текста способны
восстанавливать исходное форматирование
текста, включая изображения, колонки
и другие нетекстовые компоненты.
Содержание:
История :
В 1929 году Густав Таущек получил патент на метод оптического распознавания текста в Германии, после чего за ним последовал Гендель, получив патент на свой метод в США в 1933. В 1935 Таущек также получил патент США на свой метод. Машина Таущека представляла собой механическое устройство, которое использовало шаблоны и фотодетектор.
В 1950 году Дэвид Х. Шепард, криптоаналитик из агентства безопасности вооружённых сил Соединённых Штатов, проанализировав задачу преобразования печатных сообщений в машинный язык для обработки компьютером, построил машину, решающую данную задачу. После того как он получил патент США, он сообщил об этом в «Вашингтон Дэйли Ньюз» (27 Апреля 1951) и в «Нью-Йорк Таймс» (26 декабря 1953). Затем Шепард основал компанию, разрабатывающую интеллектуальные машины, которая вскоре выпустила первые в мире коммерческие системы оптического распознавания символов.
Первая коммерческая система была установлена на «Ридерс Дайджест» в 1955 году. Вторая система была продана компании «Стэндарт Ойл» для чтения кредитных карт для работы с чеками. Другие системы, поставляемые компанией Шепарда, были проданы в конце 1950-х годов, в том числе сканер страниц для национальных воздушных сил США, предназначенный для чтения и передачи по телетайпу машинописных сообщений. IBM позже получила лицензию на использование патентов Шепарда.
Примерно в 1965
«Ридерс Дайджест» и «Ар-Си-Эй»
Почтовая служба Соединённых Штатов с 1965 года для сортировки почты использует машины, использующие оптическое распознавание текста, созданные на основе технологий, разработанных исследователем Яковом Рабиновым. В Европе первой организацией, использующей машины с оптическим распознаванием текста, был британский почтамт. Почта Канады использует системы оптического распознавания символов с 1971 года. На первом этапе в центре сортировки системы оптического распознавания символов считывают имя и адрес получателя и печатают на конверте штрих-код. Он наносится специальными чернилами, которые отчётливо видимы в ультрафиолетовом свете. Это делается, чтобы избежать путаницы с полем адреса, заполненным человеком, которое может быть в любом месте на конверте.
В 1974 году Рэй
Курцвейл создал компанию «Курцвейл
Компьютер Продактс», и начал
работать над развитием первой системы
оптического распознавания
В 1978 году компания
«Курцвейл Компьютер Продактс»
начала продажи коммерческой версии
компьютерной программы оптического распознавания
символов. Два года спустя Курцвейл продал
свою компанию корпорации «Ксерокс», которая
были заинтересована в дальнейшей коммерциализации
систем распознавания текста. «Курцвейл
Компьютер Продактс» стала дочерней компанией
«Ксерокс», известной как «Скансофт».
Текущее
состояние технологии
оптического распознавания
текста:
Точное распознавание латинских символов в печатном тексте в настоящее время возможно только если доступны чёткие изображения, такие как сканированные печатные документы. Точность при такой постановке задачи превышает 99 %, абсолютная точность может быть достигнута только путем последующего редактирования человеком. Проблемы распознавания рукописного «печатного» и стандартного рукописного текста, а также печатных текстов других форматов (особенно с очень большим числом символов) в настоящее время являются предметом активных исследований.
Точность работы методов может быть измерена несколькими способами и поэтому может сильно варьироваться. К примеру, если встречается специализированное слово, не используемое для соответствующего программного обеспечения, при поиске несуществующих слов, ошибка может увеличиться.
Распознавание символов он-лайн иногда путают с оптическим распознавания символов. Последний — это офф-лайн метод, работающий со статической формой представления текста, в то время как он-лайн распознавание символов учитывает движения во время письма. Например, в он-лайн распознавании, использующем PenPoint OS или планшетный ПК, можно определить, с какой стороны пишется строка: справа налево или слева направо.
Он-лайн системы для распознавания рукописного текста «на лету» в последнее время стали широко известны в качестве коммерческих продуктов. Алгоритмы таких устройств используют тот факт, что порядок, скорость и направление отдельных участков линий ввода известны. Кроме того, пользователь научится использовать только конкретные формы письма. Эти методы не могут быть использованы в программном обеспечении, которое использует сканированные бумажные документы, поэтому проблема распознавания рукописного «печатного» текста по-прежнему остается открытой. На изображениях с рукописным «печатным» текстом без артефактов может быть достигнута точность в 80 % — 90 %, но с такой точностью изображение будет преобразовано с десятками ошибок на странице. Такая технология может быть полезна лишь в очень ограниченном числе приложений.
Ещё одной широко
исследуемой проблемой
Для решения более сложных проблем в сфере распознавания используются как правило интеллектуальные системы распознавания, такие как искусственные нейронные сети.