Повнотекстові бази даних

Автор: Пользователь скрыл имя, 11 Декабря 2011 в 10:40, реферат

Описание работы

Для впровадження АБІС необхідно визначити конфігурацію системи і засобів її програмного забезпечення. Нормативні документи передбачають наступну послідовність етапів робіт:
• дослідження та обгрунтування створення системи (проектне обстеження);
• розробка технічного завдання;
• ескізне проектування;
• робоче проектування;
• виготовлення несерійних компонентів комплексу засобів автоматизації;
• введення в дію.

Содержание

ВСТУП
1.Етапи впровадження засобів автоматизації.
2.Програмне забезпечення.
3.Бібліотечні системи. Стан автоматизації.
ЛІТЕРАТУРА

Работа содержит 4 файла

Документ Microsoft Word (2).doc

— 10.50 Кб (Скачать)

Документ Microsoft Word.doc

— 217.50 Кб (Скачать)
 
 
 
 
 

      Доповідь на тему:

  “Повнотекстові бази даних” 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 
 
   Віртуальне середовище, що забезпечує швидкий і надійний доступ до ресурсів з будь-якої точки планети, стала каталізатором розвитку різних форм електронного бізнесу. Одними з перших оцінили переваги Інтернет компанії, що спеціалізуються на виробництві та продажу різного роду баз даних. Створенням подібних баз з початку 80-х років займалося безліч зарубіжних корпорацій, головним продуктом яких була інформація.         Існували фактографічні бази даних, що містять фактичні відомості (передусім статистику), бібліографічну інформацію (відомості про документи) і повнотекстові (повні тексти книг і статей з газет, журналів та збірників). Серед найбільш відомих виробників і постачальників баз даних в "доінтернетовскій" період виділялися LEXIS / NEXIS, Dialog, Silver Platter, EBSCO Information Services, STN Internetional, HWWilson, UMI (нині ProQuest). Інформаційні продукти доставлялися користувачам на магнітних стрічках, за допомогою модемного зв'язку, а з другої половини 80-х років - на CD-ROM. 
   З поширенням Інтернету інформаційний бізнес набув небачених до того часу масштаби.   До вже існували гігантам інформаційної індустрії додалися молоді компанії, серед яких найбільш помітні netLibrary і ScienceDirect. Для постачальників інформаційних продуктів Мережа стала ідеальним середовищем ведення бізнесу: інформаційні корпорації здобули можливість вести цілодобове обслуговування клієнтів незалежно від їх місцезнаходження.      Потенційний ринок одномоментно розширився до меж усієї земної кулі. При цьому з'явилася можливість надавати інформаційні послуги клієнтам безпосередньо, обходячись в більшості випадків без залучення посередників, в особі яких раніше виступали бібліотеки.

 
Перша сторінка роману Жюля Верна "Двадцять тисяч льє під водою" з фондів netLibrary:

    З усього переліку представлених в Мережі комерційних інформаційних продуктів для професійної інформаційної діяльності найбільший інтерес представляють повнотекстові бази даних. У них містяться тексти книг, статей з журналів, газет та збірників, повідомлення інформаційних агентств, аналітичні звіти різних установ та інші документи. Для традиційних бібліотек отримання доступу до цих баз в значній мірі змінює підходи до інформаційної роботи в цілому, так як дозволяє читачам обходитися без звернення до друкованих оригіналів видань і, отже, позбавляє потенційних клієнтів від необхідності фізичного відвідування бібліотек. 
    Число та галузевої спектр комерційних повнотекстових електронних зборів постійно розширюються. Якщо на зорі цього виду бізнесу в 1960 роки їх створення починалося з правової та економічної областей, в 1980-1990 роки були освоєні природні, точні і найбільш динамічно розвиваються гуманітарні дисципліни, то в даний час черга дійшла до колекцій рідкісних і стародрукованих книг, повних зібрань творів античних і середньовічних авторів, поетичних антологій і подібних до цього матеріалів. 
   Компанії, безпосередньо мають доступ до повнотекстових зборам, мають в арсеналі відразу кілька десятків або навіть сотень баз даних від різних виробників. Їх число нестабільно, хоча спостерігається зрима тенденція до збільшення загальної кількості. Залежно від призначеного для користувача попиту і, отже, економічної виправданості, різні бази даних з'являються або видаляються з доступу. Найчастіше одну і ту ж відому базу даних можна зустріти у різних постачальників. В даному випадку компанії конкурують один з одним за рівнем комфортності доступу і, звичайно ж, в області цін, що, безумовно, вигідно кінцевим користувачам. 
    Наповнення повнотекстових баз даних здійснюється двома способами. Перший полягає в скануванні друкованих оригіналів та отримання електронних копій документів, виконаних в більшості випадків у форматі PDF. Ці документи відтворюються (читаються) з використанням безкоштовно поширюваної програми Adobe Acrobat, яку можна легко отримати з Інтернет або знайти на більшості випускаються в даний час компакт-дисків (в цьому випадку диск маркується логотипом Adobe Acrobat). Сканування друкованих оригіналів застосовується при оцифровування існуючих тематично і логічно закінчених зборів, що зберігаються, як правило, у фондах найбільших бібліотек або архівів. При цьому масштаби і темпи оцифровки документальних масивів у рамках комерційних проектів в різних країнах дають всі підстави вважати, що вже в найближчі роки буде оцифровано більшість значущих для людства матеріалів. Для користувачів стане принципово можливим отримати доступ до будь-яких джерел - від німецьких стародруків XVI століття до замітки в завтрашньому номері японської газети.

.

Вид статті у форматі PDF з бази даних ProQuest

    Другий метод - купівля електронних копій книг, газет або журналів безпосередньо у видавництвах. За попереднім договором видавництва передають електронну версію документа (найчастіше готовий оригінал-макет) постачальнику і отримують певний відсоток від коштів, отриманих за звернення до поставлених файлів. Завантаження документів у систему здійснюється, як правило, в момент опублікування друкованого оригіналу або навіть раніше. Після фізичного завантаження в базу інформаційний масив індексується, після чого електронні документи стають доступними для пошуку і вивантаження. Подібний спосіб "комплектування" застосовується при роботі з сучасними періодичними виданнями та повідомленнями агентств новин. 
     Професійні цифрові бібліотеки, на відміну від безкоштовних колекцій, відрізняє набагато більше чітка політика у відборі джерел, високий ступінь повноти і оперативність актуалізації матеріалів. Граматичні помилки украй рідкісні, за винятком випадків, коли документи зберігаються не в PDF, а в HTML-форматі. 
     Як і більшість бізнес-проектів, повнотекстові бази даних забезпечують для клієнтів високий рівень сервісу. Пошуковий механізм дозволяє здійснювати багатоаспектний пошук з можливістю поєднання даних з різних полів. Розвідку може здійснюватися за окремими словами, словосполученнями і точним фразам. Результати пошуку видаються у вигляді списку бібліографічних записів із зазначенням всіх необхідних елементів. Існує можливість формування із загального переліку списку релевантних документів.

 
Вигляд списку результатів пошуку в ProQuest.

    У професійних базах даних повні тексти постають перед користувачем у вигляді HTML-документів або PDF-файлів. Особливістю останніх є здатність представляти документ саме в тому вигляді, як він існує в друкованій копії, із збереженням колонок, таблиць, ілюстрацій і т.д. У той же час весь зміст такого документа може бути доступно для пошуку (проіндексовано). Джерела в PDF можна не тільки переглядати (читати) в онлайновому режимі, але і зберігати на власному комп'ютері для подальшої роботи. 
Користування комерційними базами здійснюється за попередньою передплатою, яка оформляється, як правило, на один рік. Технічно доступ здійснюється за попередньо виданими імені користувача та паролю або по IP-адресою. Останній спосіб найбільш вигідний для організацій, зокрема, бібліотек, оскільки дозволяє надавати користування такими базами даних з будь-яких комп'ютерів, розташованих в установі (що знаходяться за однією IP-адресою). 
      В даний час вартість доступу до повнотекстових баз даних досить висока. Серйозні витрати на сканування і розпізнавання тексту, опис та індексування документів, придбання ліцензій від власників авторських прав роблять собівартість кінцевого продукту досить високою. Порівняно мала кількість передплатників змушує власників електронних зборів тримати високі ціни, щоб окупити власні витрати і отримати прибуток     При істотному підвищенні кількості передплатників вартість доступу для кожного окремого користувача може бути значно знижена (пряма аналогія зі стільниковою телефонією). Проте вже сьогодні можливість отримання величезного масиву даних у будь-якій точці земної кулі, де є доступ до Інтернет, привертає все більш значне число користувачів, серед яких безумовне лідерство тримають великі корпорації, діяльність яких грунтується на аналізі інформації. Висока вартість доступу для інших категорій користувачів кілька пом'якшується позицією традиційних бібліотек (насамперед університетських), які в ряді випадків воліють підписку на повнотекстові бази даних безпосереднього придбання книг і журналів у власний фонд. 
    В даний час до найбільш значущих комерційним повнотекстових проектів відносяться наступні: 
 
Зарубіжні комерційні повнотекстові бази даних. 
Dialog (www.dialog.com) 
Dialog - перша онлайнова інформаційно-пошукова система в світі. Відкриття датується 1972 роком, коли в складі було всього дві бази. В даний час Dialog включає більше 570 повнотекстових, бібліографічних та фактографічних баз даних, що представляють інтерес, перш за все, для бізнес-структур. Представлені джерела, пов'язані з самим різних галузей знання. У їх число включені урядові документи, архіви періодичних видань, матеріали по бізнесу та фінансів, енергетики, хімії, фармацевтики, медицини, інтелектуальної власності, техніці, природних і суспільних наук. Dialog створювався в доінтернетовскую і, тим більше, в довебовскую пору, тому його механізм пошуку побудований на основі протоколу telnet. Природно, текстової інтерфейс і необхідність знання цілого набору складних команд ускладнює користування системою, проте ця трудність в значній мірі компенсується глибиною інформаційного наповнення. Нині Dialog є власністю Thomson Corporation. 
LexisNexis (www.lexis-nexis.com) 
     Одна з найбільших інформаційних корпорацій світу. Комплекс баз даних LexisNexis включає в загальній складності понад 31 тисячі файлів, багато з яких мають форму повнотекстове зміст провідних періодичних видань. Проект починався як повнотекстова база даних юридичної тематики, яка була потім доповнена матеріалами новинних агентств, урядовими документами, фінансовими звітами, відомостями про корпорації та академічними зборами. В даний час з різним ступенем повноти охоплені практично всі галузі знання. Поряд з іншими, в LexisNexis включені деякі російськомовні видання. В даний час LexisNexis - власність Reed Elsevier Inc. 
ProQuest (www.proquest.com) 
Лінія продуктів ProQuest включає близько сотні основних баз даних, серед яких галузеві і тематичні повнотекстові зборів, реферативні і бібліографічні бази даних, електронні архіви найвідоміших газет і журналів. Має договори з більш ніж 8.500 видавництв з усього світу, відповідно до яких отримує комп'ютерні версії видань в момент або навіть до появи друкованих оригіналів. Подібним чином поповнюються бази періодичних видань, серед яких Washington Post, Wall Street Journal, USA Today, галузеві бази даних Accounting and Tax Database, Criminal Justice Periodical Index, ProQuest Religion, ProQuest Telecommunications і багато інших.

    ProQuest також цілеспрямовано займається оцифруванням мають велику історичну цінність закінчених зборів, які включаються в лінію продуктів під назвою "Digital Vault" ("Цифровий звід"). Прикладами можуть служити повнотекстові бази "Women's History Online", "Genealogy and Local History Online", "Early English Books Online", повні архіви газет Christen Science Monitor, New York Times та інші. 
      До теперішнього моменту сумарний обсяг ProQuest перевищує 5.5 мільярдів сторінок і число їх продовжує стрімко збільшуватися. Повні тексти представлені в декількох варіантах: HTML, HTML з вбудованою сканованої ілюстрацією і PDF. У перспективі передбачається повний перехід на PDF. 
Questel o Orbit (www.questel.orbit.com
    Компанія, яка існує більше 30 років, спочатку спеціалізується на наданні доступу до даних, пов'язаних з інтелектуальною власністю і бізнесом. Основу її інформаційного потенціалу становлять відомості про патенти, товарні знаки, стан ринків, компаніях, різного роду фінансова інформація, а також повнотекстові і реферативні бази в галузі нафтохімії, фізики, медицини, механіки, електроніки, геології, геофізики, архітектури та деяким іншим областям знання . Доступ забезпечується, як за допомогою telnet, так і через web-інтерфейс. 
ScienceDirect (www.sciencedirect.com) 
    Була спочатку утворена в 1999 році в якості бази даних, що надавала доступ до продукції видавничої корпорації Elsevier. Надалі її зміст розширилося і в даний час ScienceDirect є одним з найбільших джерел наукової і технічної інформації, а також інформації з медицини. Включає порядку 5500000 повних текстів наукових журналів і книг, бази даних рефератів, фундаментальні енциклопедичні та довідкові видання. Всі документи представлені у вигляді PDF-документів. Деякі матеріали також, поряд PDF версіями, мають HTML або TIFF версії. Незареєстровані користувачі (повноваження визначаються системою автоматично) мають можливість переглядати змісту всіх представлених в базі журналів, книг та енциклопедій, а також сплатити та отримати будь-який з представлених джерел (функція Pay per view). Система має дружній інтерфейс і працює дуже швидко.

EBSCO Information Services (www-ru.ebsco.com) 
   Має в складі більше 50 повнотекстових баз даних, в числі яких матеріали практично по всіх галузях знання. Повні тексти представлені у форматах HTML та PDF. В якості окремої послуги пропонується підписка на електронні журнали, що містять в сукупності близько 3.5 мільйонів статей. Серед інших ресурсів, надається доступ до російської повнотекстової бази даних "Інтегрум". Кожен місяць виділяється "База даних місяці", до якої, після попередньої реєстрації, надається безкоштовний доступ. 
Ovid (www.ovid.com) 
   Під цією маркою представлено цілий комплекс, з більш ніж 200 інформаційних продуктів. У їх числі бібліографічні бази даних, повні тексти книг і журналів, а також сервіси, що забезпечують комплексну інформаційну підтримку по окремих галузях і темами. При всій різноманітності змістовного наповнення (є ресурси, пов'язані з бізнесу та фінансів, сільського господарства, природничих та гуманітарних наук), пріоритет в Ovid віддається медицині та фармакології. Однією з важливих складових, є інформаційний масив, що раніше належав компанії SilverPlatter, яка увійшла в Ovid в 2001 році. Серед інших баз даних - MEDLINE з можливістю отримання доступу до повних текстів документів. Надається 30-денний безкоштовний пробний доступ. 
STN International (stnweb.fiz-karlsruhe.de) 
    Представлено більше 200 баз даних головним образів академічної спрямованості. У числі галузей, яким віддається пріоритет, значаться: хімія, фізика, геологія, матеріалознавство, біотехнологія, енергетика, фармакологія, токсикологія, математика та сільської господарство. В даний час Пошукова система поєднує в собі одночасно риси web-інтерфейсу і пошуковий механізм, близьке до telnet. Користувач становить запит до спеціальної рядку, використовуючи специфічні команди бази даних. При цьому, більшість матеріалів баз даних представлено у вигляді ASCII-файлів. До деяких ресурсів надається безкоштовний пробний доступ строком на 4 дні (визначається за IP-адресою) - STN Sneak Preview. 
NetLibrary (www.netLibrary.com) 
    Проект утворений в 1998 році як служба, орієнтована на роботу перш за все з реальними бібліотеками. Пропонується більше 37 тисяч електронних книг (eBooks). Допускаються пошук по повних текстів, звернення до словника, використання закладок і навіть записи на полях. У безкоштовному доступі знаходиться десяток книг, що демонструють можливості роботи з електронними виданнями. В даний час netLibrary є структурою OCLC.

Російські комерційні повнотекстові бази даних 
Наукова Електронна Бібліотека (elibrary.ru) 
   
Проект Російського Фонду фундаментальних досліджень, метою якого є забезпечення доступу російських наукових організацій, включаючи наукові бібліотеки, до зарубіжної академічної періодиці переважно природничо профілю. Включені повні тексти книг і журналів, що публікуються найвідомішими закордонними видавництвами, серед яких Blackwell, Kluwer, Elsevier, Springer, Royal Society of Chemistry, ISI (Інститут наукової інформації), а також півтора десятка російських академічних журналів. У загальній складності в бібліотеку включено понад 3700 назв журналів, що містять, в цілому, більше 5 мільйонів статей. Доступ до всього масиву надається безкоштовно після укладення договору між Наукової Електронної Бібліотекою та академічної організацією. Є також частковий безкоштовний тестовий доступ. 
Інтегрум-Техно (www.integrum.ru або www.integrum.com) 
    В даний час - найбільша інформаційна онлайнова служба Росії. Серед представлених баз даних архіви центральної, регіональної та зарубіжної преси, повідомлення агентств новин, текстові транскрипти передач радіо і телебачення, тексти законів, дані Держкомстату Росії, електронні каталоги бібліотек, відомості про патенти, адресні довідники, фотоархів і багато інші джерела. Всього в даний час представлено понад 4.5 тисяч баз даних, в сукупності включають близько 230 мільйонів документів. Слід, однак, пам'ятати, що значний масив цих записів складають бібліографічні описи книг і статей з бібліотечних каталогів. Всі джерела інтегровані в єдиний інформаційний масив, що функціонує під управлінням власної програмної розробки компанії - пошукової системи "Артефакт". Для отримання пробного доступу необхідно заповнити спеціальну реєстраційну форму. На вказану електронну адресу надсилається пароль, який дає можливість повного доступу до всіх ресурсів Інтегрум строком на 7 днів.
 

 
Інтерфейс введення запиту в базі даних Інтегрум-Техно.

Публічна  бібліотека (www.public.ru) 
    Проект призначений насамперед для бібліотек, яким пропонується оформити підписку на електронні версії російських центральних і регіональних періодичних видань. Публічна бібліотека дає можливість безкоштовного бібліографічного пошуку - "Відкритий доступ" та можливість користування повними текстами статей - "Професійний пошук". В даний час інтерфейс пошукової системи і більшість модулів потребують серйозного доопрацювання. Інтерес в даному проекті представляють архіви періодики за старі роки: деякі видання представлені у вигляді повних текстів з 1990 року. 
EastView (www.eastview.com або www.ebiblioteka.ru) 
   Перебуваючи у закордонній власності, EastView, тим не менш, концентрує основну увагу на російських джерелах. У складі бази даних центральні та регіональні російські газети, державні стандарти, журнали Російської Академії наук, художньо-публіцистичні (товсті) журнали Росії, карти, статистичні джерела, матеріали агентств новин, а також періодика Україні і деяких країн СНД. В окрему базу виділені періодичні видання та наукові публікації Китайської Народної Республіки. Всього на даний час в базу даних включені повні тексти більш ніж 500 російських газет і журналів, а також понад 70 українських періодичних видань. Система за замовчуванням має англомовний інтерфейс, а опису джерел наводяться в транслітерації. У ряді випадків можна отримати варіант записів російською мовою. Наприкінці 2003 року анонсовано появу в EastView змісту всіх Літописів Російської книжкової палати. Надалі передбачається зробити посилання від бібліографічних записів РКП до повних текстів відповідних статей. Для бібліотекарів та осіб з числа професорсько-викладацького складу надається безкоштовний пробний доступ терміном на 30-днів. 
    В останнє п'ятиріччя серед інформаційних компаній прокотилася низка злиттів і поглинань, що свідчить про високу інтенсивності розвитку даного сектора економіки. Інформаційні компанії постійно розширюють свій бізнес. Крім надання доступу до колекцій, власники повнотекстових баз даних створюють додаткові сервіси для сфер, де використання електронних бібліотек найбільш ефективно. Такі, наприклад, проект XanEdu компанії ProQuest, призначений для університетської спільноти, ReferenceLink компанії Thomson Corporation, розрахований на бібліотеки або NewsEdge Service компанії Dialog, орієнтований на користувачів, що бажають оперативно отримувати новини індивідуально сформованим запитам.

   У перспективності цифрових бібліотек можна не сумніватися. Швидкий доступ до достовірної і максимально повної інформації - невід'ємна складова фундаментальної науки, якісної освіти та ефективного бізнесу. Ряд бібліотек західних країн, насамперед, бібліотеки американських університетів, вже сьогодні забезпечують своїм читачам можливість користування подібними ресурсами. Поступово це стає стандартною бібліотечної послугою. Безсумнівно, що в майбутньому, з подальшим розширенням в бібліотеках доступу до Інтернет, передплата на повнотекстові комерційні бази даних буде складовою частиною бюджету, що витрачається на комплектування фонду.

ЛІТЕРАТУРА

корпоративны библ мережи).doc

— 91.00 Кб (Открыть, Скачать)

ПРОТОКОл.doc

— 63.00 Кб (Открыть, Скачать)

Информация о работе Повнотекстові бази даних