Автоматическое чтение текста. Системы распознавания электронных документов

Автор: Пользователь скрыл имя, 19 Января 2011 в 13:15, реферат

Описание работы

В настоящее время наиболее известными программами для обработки и распознавания текстов являются соответственно Word и Fine Reader.
В данной работе я хочу рассмотреть Word 97, как самый надежный; и сравнить Fine Reader 5.0 и Cuneiform 2000, как конкурирующие программы. Рассмотрим их по порядку.

Работа содержит 1 файл

реферат.doc

— 142.50 Кб (Скачать)

Автоматическое  чтение текста. Системы  распознавания электронных  документов. 

   В настоящее время наиболее известными программами для обработки и распознавания текстов являются соответственно Word и Fine Reader.

   В данной работе я хочу рассмотреть Word 97, как самый надежный; и сравнить Fine Reader 5.0 и Cuneiform 2000, как конкурирующие программы. Рассмотрим их по порядку.

Общие положения 

   Программа Microsoft Word является многофункциональной системой обработки текстов. Поскольку текстовый процессор Word работает в среде Windows то на первом месте среди ее достоинств стоит исключительная дружественность пользователю.

   Управление всеми пунктами меню и командами может выполняться как с помощью мыши, так и с помощью горячих клавиш (Short-Cuts), для экономии времени пользователя на выполнение определенного набора операций. 

Представление 

   WYSIWYG (Wat You See Is What You Get) позволяет просмотреть на экране готовый к печати документ не затрачивая время и бумагу на распечатку пробных страниц.

   Форматирование символов, например курсивное или жирное имеет адекватное представление на экране. И это справедливо для любых гарнитур и кеглей.

   Редактор Microsoft Word так же как и Microsoft Wondows разработаны одной корпорацией. Это позволяет обеспечить максимальную согласованность этих систем друг с другом, а так же с другими программами совместимыми с Microsoft Windows. Тексты и иллюстрации многих форматов могут быть импортированы в Word непосредственно из других программ и встроены в текст документа. В результате такой процедуры они становятся частью текстового файла WinWord или продолжают при этом существовать отдельно благодаря механизму объективного связывания и встраивания (Objekt Linking And Embeding).

   Так же присутствует ряд хорошо зарекомендовавших себя функций, такие как возможность не прерывая работу с документом распечатать некоторые страницы. В этом случае программа управления печатью с буферизацией берет на себя наблюдение за печатью на заднем плане.

   Письма и факсы, записки и отчеты, публикации и web страницы – вот далеко не полный перечень документов с над которыми пользователь имеет возможность работать используя текстовый процессор Word. 

Автоматизация выполнения задач  и получение помощи 

   В Word 97 имеется широкий выбор средств автоматизации, упрощающих выполнение типичных задач. 

Автозамена 

   Ниже перечислены некоторые типы ошибок, которые могут быть исправлены автоматически при вводе:

   Последствия случайного нажатия клавиши CAPS LOCK (впервые появилась в Word 95). Например, в начале предложения слово этот автоматически заменяется на Этот, а режим ввода прописных букв (соответствующий нажатой клавише CAPS LOCK) автоматически отключается.

   Типичные опечатки в словосочетаниях. Например, слова почтовый адрес автоматически заменяются словами почтовый адрес.

   Грамматически не сочетаемые пары слов. Например, слова этот слово автоматически заменяются словами это слово.

Автоформат  при вводе 

   В Word предусмотрена возможность автоматического форматирования текста при вводе.

   Автоматическое создание нумерованных и маркированных списков (впервые появилось в Word 95). Например, если в начале первого элемента списка ввести звездочку, будет создан маркированный список.

   Автоматическое создание границ (впервые появилось в Word 95). Например, если ввести три и большее число дефисов (-) или знаков равенства (=) подряд, а затем нажать клавишу ENTER, будет автоматически создана одинарная или двойная граница.

   Автоматическое присвоение тексту встроенных стилей (впервые появилось в Word 95). Например, если завершить строку текста не знаком препинания, а двойным нажатием клавиши ENTER, ей будет автоматически присвоен стиль “Заголовок 1”.

   Автоматическое форматирование порядковых номеров и дробей (впервые появилось в Word 95; применимо только к английскому тексту). Например, сочетание “1st” автоматически заменяется сочетанием , а дробь “1/4” — символом ј.

   Автоматическое оформление сетевых путей и адресов Интернета (например, \\Reports\May\Week1.doc и http://www.microsoft.com/) как гиперссылок. При выборе гиперссылки на адрес Интернета автоматически запускается имеющееся средство просмотра Web и открывается указанная Web-страница. При выборе гиперссылки на сетевой путь автоматически запускается программа, необходимая для открытия файла назначения, и открывается указанный файл.

   Автоматическое применение форматирования, используемого для оформления начала первого элемента списка, к началу последующих элементов этого списка.

   Например:

1. Word 97 выполнит  всю работу за вас.

2. Word 97 сделает  ваши документы красивыми.

   Автоматическое изменение начертания символов. Например, текст *Жирный* автоматически преобразуется в Жирный, а _Курсив_ — в Курсив.

   Автоматическое преобразование последовательности плюсов и дефисов (+----+----+) в таблицу. Каждой паре плюсов (+) соответствует один столбец.

   Автоматическая замена пробелов в начале элемента маркированного или нумерованного списка соответствующим отступом слева.

Автозаполнение 

   Автоматическое предложение полного варианта слова или фразы после ввода нескольких первых букв. Чтобы принять предложенный вариант, нажмите клавишу ENTER.     Ниже перечислены некоторые элементы, к которым применимо автозаполнение:

   текущая дата;

   дни недели;

   названия месяцев;

   имя автора и название организации;

   элементы списка автотекста. 
 

Автореферат 

   В Word 97 появилась возможность выполнения статистического и лингвистического анализа документа с целью выделения его ключевых положений. На основании этого анализа составляется реферат. Таким образом можно выделить ключевые положения в электронном документе и просматривать его с разной степенью детализации или поместить автоматически составленный реферат в отдельный документ. Размер реферата устанавливается пользователем и может варьироваться.

   При составлении рефератов необходимо соблюдать законы об авторском праве.

   Ответственность за точность реферата возлагается не на программу, а на пользователя. 

Автоматическое  создание и предварительный  просмотр стилей 

   При работе со стилями в Word 97 используйте следующие новые возможности:

   В случае применения нового форматирования к тексту автоматически создается новый стиль.

   В случае изменения форматирования текста соответствующие изменения автоматически вносятся в определение стиля.

   Список стилей на панели форматирования содержит образцы стилей.

Мастер  писем 

   Мастер писем позволяет легко и быстро создать нужное письмо путем выбора готовых элементов письма. Кроме того, раз введенные сведения об адресате (имя, фамилия, адрес, должность и т. п.) автоматически сохраняются. При создании следующего письма этому адресату достаточно будет выбрать его имя из списка; все остальные данные будут добавлены автоматически. 

Помощник 

   Новое средство Office 97 — помощник — использует технологию IntelliSense. Его основное назначение — автоматическое предоставление советов и справочных сведений, которые могут понадобиться по ходу выполнения задачи. Например, если помощник решит, что вы собираетесь приступить к созданию письма, то предложит запустить мастера писем. Помощник является основным средством получения справочных сведений о работе в Word 97, а также советов по повышению эффективности работы, наглядных примеров и пошаговых инструкций по выполнению конкретных задач. 

Проверка  правописания 

   Ниже перечислены основные средства проверки правописания и правки текста, используемые в Word 97.

     1. Проверка орфографии при вводе

   Проверка на наличие орфографических ошибок по ходу ввода текста и выделение возможных ошибок прямо в документе (впервые появилось в Word 95).

     2. Проверка грамматики при вводе

   Проверка на наличие грамматических ошибок по ходу ввода текста и выделение возможных ошибок прямо в документе. Как и при автоматической проверке орфографии, при проверке грамматики автоматически предлагаются возможные варианты правильного написания. Для вывода списка вариантов следует щелкнуть выделенный текст правой кнопкой мыши.

     3. Пропуск определенных элементов текста при проверке правописания

   По желанию пользователя при проверке орфографии пропускаются слова, состоящие из прописных букв и/или содержащие цифры.

   Пропуск имен файлов и адресов Интернета.

     4. Проверка грамматики

   Выделение ошибок и автоматическое предложение вариантов правильного написания позволяет существенно сократить время правки. По сравнению с предыдущими версиями улучшен синтаксический анализ, более точными стали предлагаемые варианты правильного написания, а также расширен набор грамматических и стилистических правил.

     5. Совместная проверка орфографии и грамматики

   В тексте одновременно выполняется поиск и орфографических, и грамматических ошибок. Все ошибки устраняются за один сеанс проверки. 
 
 

Таблицы, границы и заливка 

   В Word 97 появились следующие средства, упрощающие работу с таблицами, границами и заливкой. 

Таблицы  

     1. Рисование таблиц

   Позволяет создавать таблицы — столбцы, строки и ячейки, — рисуя их с помощью мыши, как карандашом. Теперь отдельные ячейки таблицы могут иметь любую ширину и высоту.

     2. Ластик

   Позволяет легко удалить границу любой ячейки, строки или столбца таблицы, что дает тот же эффект, что и объединение ячеек. В предыдущих версиях Word можно было объединять только ячейки, находящиеся в одной строке. В Word 97 можно объединять любые соседние ячейки — как по вертикали, так и по горизонтали.

     3. Выравнивание по вертикали

   Позволяет быстро выровнять содержимое выделенных ячеек таблицы по верхнему или нижнему краю либо по середине ячейки, используя кнопки выравнивания, расположенные на панели инструментов. Если текст в ячейках ориентирован вертикально, назначение этих кнопок меняется автоматически: используйте их для выравнивания по верхнему или нижнему краю либо по центру ячейки.

     4. Вертикальная ориентация текста

   Позволяет расположить вертикально (с поворотом на 90 градусов) текст в ячейках таблиц, надписях и рамках. Это средство может оказаться очень полезным при создании наклеек, а также печатных документов, содержащих сведения об авторских правах и т. п., расположенные вертикально.

     5. Изменение размера строки таблицы

   Позволяет регулировать высоту любой строки непосредственно в таблице посредством перетаскивания границы строки вверх или вниз подобно тому, как можно изменить ширину столбца. Если при перетаскивании удерживать нажатой клавишу ALT, на вертикальной линейке будет показана фактическая высота строки. 
 
 

Границы 

     1. Новые типы границ

   Для оформления документов предлагается более 150 различных типов границ, в том числе объемные границы и границы, состоящие из нескольких линий, которые особенно популярны в профессиональных документах.

Информация о работе Автоматическое чтение текста. Системы распознавания электронных документов