Автор: Пользователь скрыл имя, 26 Января 2013 в 12:59, реферат
Під терміном "комп'ютерна лінгвістика" (computational linguistics) зазвичай розуміється широка область використання комп'ютерних інструментів - програм, комп'ютерних технологій організації та обробки даних - для моделювання функціонування мови в тих чи інших умовах, ситуаціях, проблемних областях, а також сфера застосування комп'ютерних моделей мови не тільки в лінгвістиці, а й у суміжних з нею дисциплінах. Власне, т
1. Комп'ютерна лінгвістика як прикладна лінгвістична дисципліна
2. Когнітивний інструментарій комп'ютерної лінгвістики
3. Деякі напрямки комп'ютерної лінгвістики
4. Гіпертекстові технології подання тексту
Тема роботи: Комп'ютерна лінгвістика як прикладна лінгвістична дисципліна
Зміст
1. Комп'ютерна лінгвістика як прикладна лінгвістична дисципліна
2. Когнітивний інструментарій комп'ютерної лінгвістики
3. Деякі напрямки комп'ютерної лінгвістики
4. Гіпертекстові технології подання тексту
Література
1. Комп'ютерна лінгвістика як прикладна лінгвістична дисципліна
Під терміном "комп'ютерна лінгвістика" (computational linguistics) зазвичай розуміється широка область використання комп'ютерних інструментів - програм, комп'ютерних технологій організації та обробки даних - для моделювання функціонування мови в тих чи інших умовах, ситуаціях, проблемних областях, а також сфера застосування комп'ютерних моделей мови не тільки в лінгвістиці, а й у суміжних з нею дисциплінах. Власне, тільки в останньому випадку мова йде про прикладної лінгвістики в строгому сенсі, оскільки комп'ютерне моделювання мови може розглядатися і як сфера застосування теорії програмування (computer science) в галузі лінгвістики. Проте загальна практика така, що сфера комп'ютерної лінгвістики охоплює практично все, що пов'язано з використанням комп'ютерів у мовознавстві: "Термін" комп'ютерна лінгвістика "задає загальну орієнтацію на використання комп'ютерів для вирішення різноманітних наукових і практичних завдань, пов'язаних з мовою, ніяк не обмежуючи способи вирішення цих завдань ".
Інституційний аспект комп'ютерної лінгвістики. Як особливу науковий напрямок комп'ютерна лінгвістика оформилася в 60-і рр.. Потік публікацій в цій області дуже великий. Крім тематичних збірок, в США щоквартально виходить журнал "Комп'ютерна лінгвістика". Велику організаційну і наукову роботу проводить Асоціація з комп'ютерної лінгвістики, яка має регіональні структури по всьому світу (зокрема, європейське відділення). Кожні два роки проходять міжнародні конференції з комп'ютерної лінгвістики - КОЛІНГ. Відповідна проблематика широко представлена також на міжнародних конференціях з штучного інтелекту різних рівнів.
2. Когнітивний інструментарій комп'ютерної лінгвістики
Комп'ютерна лінгвістика як особлива прикладна дисципліна виділяється перш за все з інструменту - тобто з використання комп'ютерних засобів обробки мовних даних. Оскільки комп'ютерні програми, що моделюють ті чи інші аспекти функціонування мови, можуть використовувати різні засоби програмування, то про загальний метамови говорити начебто не доводиться. Однак це не так. Існують загальні принципи комп'ютерного моделювання мислення, які так чи інакше реалізуються в будь-якої комп'ютерної моделі. В основі цієї мови лежить теорія знань, розроблена в штучному інтелекті і утворює важливий розділ когнітивної науки.
Основна теза теорії знань свідчить, що мислення - це процес обробки й породження знань. "Знання" або "знання" вважається невизначуваним категорією. У якості "процесора", обробного знання, виступає когнітивна система людини. У епістемології та когнітивної науці розрізняють два основних види знань - декларативні ("знання що") і процедурні ("знання як" 2)). Декларативні знання представляються зазвичай у вигляді сукупності пропозицій, тверджень про що-небудь. Типовим прикладом декларативних знань можна вважати тлумачення слів в звичайних тлумачних словниках. Наприклад, чашка] - 'невеликий посуд для пиття округлої форми, зазвичай з ручкою, з порцеляни, фаянсу і т.п. '[MAC]. Декларативні знання піддаються процедурі верифікації в термінах "істина-неправда". Процедурні знання представляються як послідовність (список) операцій, дій, які слід виконати. Це деяка загальна інструкція про дії в деякій ситуації. Характерний приклад процедурних знань - інструкції по користуванню побутовими приладами.
На відміну від декларативних знань, процедурні знання неможливо верифікувати як істинні або хибні. Їх можна оцінювати тільки по успішності-неуспішності алгоритму.
Більшість понять когнітивного інструментарію комп'ютерної лінгвістики омонімічно: вони одночасно позначають деякі реальні сутності когнітивної системи людини і способи подання цих сутностей на деяких метамови. Іншими словами, елементи метамови мають онтологічний і інструментальний аспект. Онтологічно поділ декларативних і процедурних знань відповідає різним типам знань когнітивної системи людини. Так, знання про конкретні предмети, об'єктах дійсності переважно декларативні, а функціональні здібності людини до ходіння, бігу, водінню машини реалізуються в когнітивної системі як процедурні знання. Інструментально знання (як онтологічно процедурне, так і декларативне) можна представити як сукупність дескрипцій, описів і як алгоритм, інструкцію. Іншими словами, онтологічно декларативне знання про об'єкт дійсності "стіл" можна уявити процедурно як сукупність інструкцій, алгоритмів з його створення, складання (= креативний аспект процедурного знання) або як алгоритм його типового використання (= функціональний аспект процедурного знання). У першому випадку це може бути керівництво для початківця столяра, а в другому - опис можливостей офісного столу. Вірно і зворотне: онтологічно процедурне знання можна представити декларативно.
Потребує окремого обговорення, всяке чи онтологічно декларативне знання представимо як процедурне, а будь-яке онтологічно процедурне - як декларативне. Дослідники сходяться в тому, що всяке декларативне знання в принципі можна уявити процедурно, хоча це може виявитися для когнітивної системи дуже неекономним. Зворотне навряд чи справедливо. Справа в тому, що декларативне знання істотно більш експліцитно, воно легше усвідомлюється людиною, ніж процедурне. На противагу декларативним знання, процедурне знання переважно імпліцитно. Так, мовна здатність, будучи процедурних знанням, прихована від людини, не усвідомлюється ім. Спроба експлікувати механізми функціонування мови призводить до дисфункції. Фахівцям у галузі лексичної семантики відомо, наприклад, що тривала семантична інтроспекція, необхідна для вивчення плану змісту слова, призводить до того, що дослідник частково втрачає здатність до розрізнення правильних і неправильних вживань аналізованого слова. Можна навести й інші приклади. Відомо, що з точки зору механіки тіло людини є складною системою двох взаємодіючих маятників.
У теорії знань для вивчення і представлення знання використовуються різні структури знань - фрейми, сценарії, плани. Згідно з М. Мінському, "фрейм - це структура даних, призначена для представлення стереотипної ситуації" [Мінський 1978, с.254]. Більш розгорнуто можна сказати, що фрейм є концептуальною структурою для декларативного подання знань про типізованої тематично єдиної ситуації, що містить слоти, пов'язані між собою певними семантичними відносинами. З метою наочності фрейм часто представляють у вигляді таблиці, рядки якої утворюють слоти. Кожен слот має своє ім'я і зміст (див. табл.1).
Таблиця 1
Частковий фрейму "стіл" у табличному поданні
Ім'я слота |
Зміст слота |
кількість ніжок |
чотири, щонайбільше, мінімум три |
матеріал |
дерево, пластмаса, скло |
поверхню |
прямокутник, овал, коло, квадрат |
наявність тумб |
факультативно |
функції |
обідній, журнальний, робітник і пр. |
і т.д. |
Залежно від конкретного завдання структуризація фрейму може бути істотно більш складною; фрейм може включати вкладені подфрейми і відсилання до інших фреймах.
Замість таблиці часто використовується предикатну форма подання. У цьому випадку фрейм має форму предиката або функції з аргументами. Існують і інші способи подання фрейму. Наприклад, він може представлятися у вигляді кортежу наступного виду: {(ім'я фрейма) (ім'я слота)) (значення слота ,),..., (ім'я слота п) (значення слота л)}.
Зазвичай такий вигляд мають фрейми в мовах уявленнях знань.
Як і інші когнітивні категорії комп'ютерної лінгвістики, поняття фрейму омонімічно. Онтологічно - це частина когнітивної системи людини, і в цьому сенсі фрейм можна зіставити з такими поняттями як гештальт, прототип, стереотип, схема. У когнітивної психології ці категорії розглядаються саме з онтологічної точки зору. Так, Д. Норман розрізняє два основних способи побутування і організації знань у когнітивній системі людини - семантичні мережі і схеми. "Схеми, - пише він, - представляють собою організовані пакети знання, зібрані для репрезентації окремих самостійних одиниць знання. Моя схема для Сема може містити інформацію, що описує його фізичні особливості, його активність та індивідуальні риси. Ця схема співвідноситься з іншими схемами, які описують інші його боку "[Норман 1998, с.359]. Якщо ж брати інструментальну сторону категорії фрейму, то це структура для декларативного подання знань. У наявних системах ШІ фрейми можуть утворювати складні структури знань; системи фреймів допускають ієрархію - один фрейм може бути частиною іншого фрейму.
За змістом поняття фрейму дуже близько категорії тлумачення. Дійсно, слот - аналог валентності, заповнення слота - аналог актанта. Основна відмінність між ними полягає в тому, що тлумачення містить тільки лінгвістично релевантну інформацію про план змісту слова, а фрейм, по-перше, не обов'язково прив'язаний до слова, і, по-друге, включає всю релевантну для даної проблемної ситуації інформацію, в тому числі і екстралінгвістичну (знання про світ) 3).
Сценарій представляє собою концептуальну структуру для процедурного представлення знань про стереотипної ситуації або стереотипному поведінці. Елементами сценарію є кроки алгоритму чи інструкції. Зазвичай говорять про "сценарії відвідування ресторану", "сценарії покупки" і т.п.
Спочатку фрейм також використовувався для процедурного подання (пор. термін "процедурний кадр"), проте зараз в цьому сенсі частіше вживається термін "сценарій". Сценарій можна уявити не тільки у вигляді алгоритму, але і у вигляді мережі, вершин якої відповідають деякі ситуації, а дуг - зв'язки між ситуаціями. Поряд з поняттям сценарію, деякі дослідники залучають для комп'ютерного моделювання інтелекту категорію скрипта. За Р. Шенк, скрипт - це деяка загальноприйнята, загальновідома послідовність причинних зв'язків [Schank 1981]. Наприклад, розуміння діалогу
На вулиці ллє як з відра.
Все одно доводиться виходити у магазин: в будинку їсти нічого - вчора гості все підмели.
грунтується на неекспліцірованних семантичних зв'язках типу 'якщо йде дощ, на вулицю виходити небажано, оскільки можна захворіти'. Ці зв'язки формують скрипт, який і використовується носіями мови для розуміння мовного і немовного поведінки один одного.
У результаті застосування сценарію до конкретної проблемної ситуації формується план). План використовується для процедурного представлення знань про можливі дії, що ведуть до досягнення визначеної мети. План співвідносить мету з послідовністю дій.
У загальному випадку план включає послідовність процедур, які переводять початковий стан системи в кінцеве і ведуть до досягнення певної підцілі та цілі. У системах ШІ план виникає в результаті планування або плануючої діяльності відповідного модуля - модуля планування. В основі процесу планування може лежати адаптація даних одного або декількох сценаріїв, активізованих тестуючими процедурами, для вирішення проблемної ситуації. Виконання плану проводиться екзекутивність модулем, керуючим когнітивними процедурами та фізичними діями системи. У елементарному випадку план в інтелектуальній системі представляє собою просту послідовність операцій; в більш складних версіях план зв'язується з конкретним суб'єктом, його ресурсами, можливостями, цілями, з докладною інформацією про проблемну ситуацію і т.д. Виникнення плану відбувається в процесі комунікації між моделлю світу, частину якої утворюють сценарії, які планують модулем і екзекутивність модулем.
На відміну від сценарію, план пов'язані з конкретною ситуацією, конкретним виконавцем і переслідує досягнення певної мети. Вибір плану регулюється ресурсами виконавця. Здійснимість плану - обов'язкова умова його породження в когнітивної системі, а до сценарію характеристика здійсненності непріложіма.
Ще одне важливе поняття - модель світу. Під моделлю світу зазвичай розуміється сукупність певним чином організованих знань про світ, властивих когнітивної системи або її комп'ютерної моделі. У кілька більш загальному вигляді про моделі світу говорять як про частину когнітивної системи, що зберігає знання про устрій світу, його закономірності і пр. В іншому розумінні модель світу зв'язується з результатами розуміння тексту або - ширше - дискурсу. У процесі розуміння дискурсу будується його ментальна модель, яка є результатом взаємодії плану змісту тексту та знань про світ, властивих даному суб'єкту [Джонсон-Лерд 1988, с.237 і далі]. Перше і друге розуміння часто об'єднуються. Це типово для дослідників-лінгвістів, що працюють у рамках когнітивної лінгвістики та когнітивної науки.
Тісно пов'язане з категорією фрейму поняття сцени. Категорія сцени переважно використовується в літературі як позначення концептуальної структури для декларативного подання актуалізована в мовному акті і виділених мовними засобами (лексемами, синтаксичними конструкціями, граматичними категоріями і пр) ситуацій та їх частей5). Будучи пов'язана з мовними формами, сцена часто актуалізації певним словом або виразом. У граматиках сюжетів (див. нижче) сцена постає як частина епізоду або розповіді. Характерні приклади сцен - сукупність кубиків, з якими працює система ШІ, місце дії в оповіданні і учасники дії і т.д. У штучному інтелекті сцени використовуються в системах розпізнавання образів, а також у програмах, орієнтованих на дослідження (аналіз, опис) проблемних ситуацій. Поняття сцени отримало широке поширення в теоретичній лінгвістиці, а також логіці, зокрема у ситуаційній семантиці, в якій значення лексичної одиниці безпосередньо пов'язується зі сценою.
3. Деякі напрямки комп'ютерної лінгвістики
Звернімося до тих областях комп'ютерної лінгвістики, які безпосередньо пов'язані з оптимізацією когнітивної функції мови. Нижче як приклад розглядаються три сфери комп'ютерного моделювання, в яких використовуються знання про функціонування мовної системи: моделювання спілкування, моделювання структури сюжету і гіпертекстові технології представлення тексту.
Моделювання спілкування. У вузькому сенсі проблематика комп'ютерної лінгвістики часто пов'язується з моделюванням спілкування, зокрема, із забезпеченням спілкування людини з ЕОМ на природній або обмеженою природною мовою. Це відноситься до оптимізації мови як засобу спілкування. Втім, комп'ютерні моделі спілкування часто використовуються для вивчення самого процесу спілкування. Зупинимося докладніше на досвіді створення та використання саме таких моделей.
Информация о работе Комп`ютерна лінгвістика як прикладна лінгвістична дисципліна