Метод анализа документов. Традиционный анализ. Контент-анализ

Автор: Пользователь скрыл имя, 22 Ноября 2011 в 08:15, контрольная работа

Описание работы

Анализ (греч. «analysis» – разложение) – метод научного исследования (познания) явлений и процессов, в основе которого лежит изучение составных частей, элементов изучаемой системы.
Аналитические методы широко распространены в социуме, поэтому термин «Анализ» часто воспринимается как синоним исследования вообще и особенно при решении познавательных задач. Анализа является составной частью любого научного исследования, образуя, как правило, его первую стадию, когда исследователь выявляет в описании изучаемого объекта его строение, состав, свойства, признаки и т.п. Он используется как метод получения новых результатов в процессе мыслительной деятельности человека.

Содержание

Введение
1. Метод анализа документов. Традиционный анализ.
2. Контент-анализ.
Список рекомендуемой литературы

Работа содержит 1 файл

контрольная.docx

— 32.08 Кб (Скачать)

    Таким образом, основой контент-анализа является подсчёт встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа – это выяснение того, что считать – иными словами, определение единиц анализа.

    От  единиц контент-анализа обычно требуется некоторая субъективная, зависящая от контекста значимость, то есть единицы анализа должны быть интересными для последующей интерпретации. При этом такие единицы (например, темы) носят содержательный характер. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения.

    Конкретное  разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. Самый простой вариант контент-анализа предполагает количественный подсчёт встречаемости слов в тексте. К числу наиболее часто употребляемых единиц контент-анализа относят:  
1) Понятие, выраженное отдельным словом, термином или сочетанием слов.  
2) Тема, отражающая единичные суждения, смысловые абзацы или целостные тексты. Выбор темы в качестве единицы контент-анализа подразумевает внутреннее разделение изучаемого текста на определённые части, являющиеся органическими единицами контекста, внутри которых тема может быть более или менее честно определена. Темой контент-анализа изучаемого текста может быть как общая тема, так и определённая её часть.  
3) Персонаж («герой») некоего действия или отношений, отраженных в изучаемом тексте.  
4) Ситуация, например сложившаяся где-то экстремальная ситуация и др.  
5) Действие, осуществляемое отдельными индивидами или их группами, в пределах избранной для контент-анализа темы, например, действия читателей, библиотечных работников и др.

    В большинстве случаев контент-аналитик интересуется не словами как таковыми и не грамматическими категориями, а стоящими за словами значимыми для него понятиями, темами, проблемами. Их называют понятийно-тематическими единицами.

    Еще одним типом являются пропозициональные  единицы и оценки. Они представляют собой высказывания, в основе которых  лежат пропозиции – описания конкретных положений дел или ситуаций безотносительно  к их модальности (требования, констатации  и др.), например, «Карфаген должен быть разрушен» или «Ни шагу назад».

    Большой интерес для контент-анализа представляют оценки, например, «Это неверное решение». С логической точки зрения они обладают важными отличиями от пропозиций. При этом для контент-анализа пропозицию и оценку можно рассматривать как результат связывания некоторого объекта с некоторым атрибутом.

    Выделяют  также и макроструктурные единицы  – сложные понятийные конструкции, образующие «верхние этажи» человеческих представлений о мире.

    В ряде случаев (например, в социологии) используют два вида контент-анализа, отличающиеся характером представления содержания текста: качественный и количественный.

    Качественный  контент-анализ основан на использовании нечастотной модели содержания текста и позволяет выявить типы качественных характеристик содержания текста вне зависимости от частоты (т.е. количества) встречаемости каждого из этих типов.

    Количественный  контент-анализ основан на использовании количественных мер, его задача – получить количественную характеристику содержания изучаемого текста.

    Чаще  всего единицы контент-анализа являются содержательными и их выделение основывается на семантических (смысловых) критериях.

    Содержательная  интерпретация результатов зависит  от целей анализа. Она является, прежде всего, творческим актом, результаты которого во многом предопределены квалификацией  и интуицией аналитиков.

    Метод контент-анализа характеризуется высокой степенью формализованности и возможностью массового охвата исследуемых объектов, поэтому он часто применяется при анализе материалов СМИ. При этом не исключена возможность проведения контент-анализа единичных документов, например, при изучении поступающих в различные организации и органы управления писем, в политологии, библиотечном деле, педагогике и т.д. Следует отметить наличие методологических проблем, возникающих в процессе практической реализации этого метода.

    Аналитиков  обычно интересуют не одномоментные  срезы, а различные макроединицы (темы и/или проблемы, образы и т.д.). Их в отдельно взятых текстах обычно бывает немного. Метод контент-анализа применяется как к отдельно взятому тексту, так и к информационному массиву или информационному потоку, состоящему из большого количества текстов. При этом статистические закономерности в выборке более проявляются в большом её объеме, поскольку оценить их динамику можно на большом временном промежутке или при сопоставлении большого количества документов.

    Специалисты отмечают, что контент-анализ занимает особое место среди аналитических методов, поскольку является самым технологичным из них и в силу этого в наибольшей степени подходящим для систематического мониторинга больших информационных потоков. В истории контент-анализа отмечается проект, связанный с анализом 427 школьных учебников и др. Таким образом, идея контент-анализа предполагает анализ больших информационных массивов.

    С точки зрения лингвистов и специалистов по информатике, контент-анализ являет собой типичный пример прикладного информационного анализа текста, сводящегося к извлечению из всего разнообразия имеющейся в нём информации специально интересующих исследователя компонентов и представлению их в удобной для восприятия и последующего анализа форме.

    Будучи  в основе своей количественным методом, контент-анализ в определённой степени поддаётся формализации, а значит и компьютеризации.

    Очевидно, что наибольший эффект от использования  данного метода можно получить, применяя соответствующие технические (компьютерные) средства. Подобные методы применяются  с 1950-х годов. Для осуществления  компьютерного контент-анализа необходимо наличие электронных или оцифрованных и распознанных текстовых материалов.

    А. Н. Петров выделяет два метода контент-анализа: «метод для автоматической классификации документов по содержанию и метод для раскрытия значения слов и идей».

    Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. Это могут быть, например, результаты подсчёта частоты упоминания одних и тех же тем для различных выпусков одного и того же печатного издания. Перевод данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе стандартными статистическими пакетами типа SPSS.

    Помимо  анализа частотного распределения, можно осуществлять анализ корреляций между переменными, ассоциаций, сопряженности  и др. Единицы контент-анализа могут объединяться в различные более широкие категории. В сочетании с результатами контент-анализа оценка использованных единиц анализа (тематических) по указанным шкалам даёт трёхмерную схему.

    Возвращаясь к рассмотрению проблем, непосредственно  связанных с анализом документов, следует заметить, что к различным  видам отражения популярной, научной  и других форм деятельности социума  относят справки и отчёты, статьи и доклады, тезисы и записки, аннотации, рефераты и монографии, правила, законы и другие документы.

    Выделим в них два основных вида:  
1. Текстовые или смешанные документы (тексты с графиками, диаграммами, таблицами и т.п.), в которых анализируются только текстовые материалы с целью выявления значимой информации (например, цитат), а главным образом, для сжатия этих текстов на предмет получения таких типов документов, как: отчёты, справки, аннотации, рефераты, учебные и учебно-научные (курсовые, дипломные и иные подобные) работы. Последние аспекты рассматриваются в данной главе.  
2. Смешанные документы или только табличные данные, необходимые для получения из них таких документов, как отчёты и справки. Главным образом эти документы включают табличные материалы (электронные таблицы, базы и банки данных), на основе которых формируются вторичные данные, входящие в состав различных отчётов, справок и т.п. аналитических материалов, используемых как для формирования некоторых статистических данных, так и для подготовки вариантов принятия решений. Этот вид данных может представлять собой только компьютерные табличные данные. Обычно такие данные сопровождаются текстовыми материалами. Аналитические компьютерные системы, нацеленные на работу с данным видом документов, рассматриваются в четвёртой главе настоящего пособия.

    С этой целью используются разные системы, разновидности которых представлены ниже.

    Системы подготовки текстовых документов включают: текстовые редакторы и текстовые  процессоры (Microsoft Word); настольные издательские системы (PageMaker).

    Системы математических расчётов, моделирования  и анализа экспериментальных  данных, включают также редакторы  математических формул, программы статистического  анализа данных и др.

    Системы обработки финансово-экономической  информации предназначены для обработки  числовых данных, характеризующих различные  производственно-экономические и  финансовые явления и объекты, и  для составления соответствующих  управленческих документов и информационно-аналитических  материалов.

    Системы управления базами данных служат для  создания, хранения и манипулирования  массивами данных большого объёма. Различаются способами организации  хранения данных и обработки запросов на поиск информации, а также характером данных, хранящихся в базе. На их основе создаются базы и банки данных, информационно-поисковые системы.

    Экспертные  системы (ЭС) и системы поддержки  принятия решений (СППР) используются для реализации технологий информационного обеспечения процессов принятия управленческих решений на основе применения экономико-математического моделирования и принципов искусственного интеллекта.

    Личные  информационные системы предназначены  для информационного обслуживания рабочего места пользователя. Они  направлены не только на сбор и поиск  необходимых личности данных, но и  на развитие таких личностных качеств, как компетентность, уверенность  поведения, креативность и т. п.

    Из  сказанного очевидно, что не только целесообразно, но и, как никогда ранее, возможно и необходимо сохранять информацию в электронной форме, например, в электронных базах данных (БД). Очевидно, что любая подобная БД фактически может быть представлена и как личная (личностная) база сведений (ЛБС). В учебных заведениях она ориентирована, в первую очередь, на своевременное и успешное выполнение студентами учебных письменных заданий. Накопленные в ней сведения (данные, информация, знания и т.д.) в дальнейшем могут и должны использоваться в различных направлениях.

    ЛБС – это не склад электронных  материалов, которые порой не только не структурированы, но и не имеют  никаких связей между собой. Известно, что любая БД хоть каким-либо образом структурирована. Однако к внутренней структуре отдельных материалов (в нашем случае учебных работ), входящих в состав таких БД каких-либо системных требований обычно не предъявляется. В лучшем случае внутренняя структура материалов в БД представляет традиционное содержание работ, подобных сочинениям или дипломам (введение, главы и параграфы, заключение и т.д.). Этот способ вполне приемлем, но его следует дополнить более мелкими элементами. Такая работа осуществляется путём глубокого анализа, на основе которого реализуется оптимальная структуризация подобных текстов.

 

Список  рекомендуемой литературы:

1. Зимин К. 2010: архитектура бизнеса и архитектура/ К. Зимин, М. Шантаренкова //Корпоративные системы.–май, 2005.–С. 6–7.

2. Брачевский С.М. Современные информационные потоки: актуальная проблематика/С.М. Брачевский, Д.В. Ландэ//НТИ. Сер.1.–№11.–2005.–С. 21–33 [С. 23].

3. Румянцева С.А. Информационное обеспечение руководителя. реферирование//Справочник секретаря и офис-менеджера.–№2.–2007.–20–25 [С. 20–21].

4. Е.С. Коноплев Информационные практики в современном обществе: социально-философский анализ: Дис ... кан. фил. наук.– М.: МГТУ им. Н.Э. Баумана, 2007.– 168 с. [С. 92].

5. Розов Н.С. Методика контент-анализа и визуализации понимания философских текстов [Электронный ресурс].– Режим доступа: http://www.nsu.ru/filf/rpha/syllabi/ method.htm.

Информация о работе Метод анализа документов. Традиционный анализ. Контент-анализ