Автор: Пользователь скрыл имя, 26 Марта 2012 в 16:36, реферат
Интернеттің басты тапсырмасы бұл – әр тәуліктік, жоғары сенімді байланыс. Интернетке қосылған кез келген екі компьютер (немесе басқа құрылғылар) бір-бірімен кез келген уақытта хабарласа алады. Ары қарай “Желі” сөзін қолданғанда Интернет сөзіне синоним ретінде Желімен интернет арқылы екі компьютерді байланыстыру мүмкіндігін және олардың өзара байланысын қамтамасыз етуді түсінеміз. Интернетке қосылған әрбір компьютер – бұл Желінің бір бөлігі.
Индексті құруда дубликаттардың санын азайту тапсырмасы да шешіледі – қатесіз салыстыру үшін алдымен құжаттың кодировкасын анықтау қажеттігін ескерсек, тапсырма оңай емес. Бұдан да қиын тапсырмаға өте ұқсас құжаттарды айыру жатады (оларды “дубликат дерлік” деп атайды), мысалы оларға мазмұны бір ал тақырыбы әртүрлілер жатады.Бұл сияқты құжаттар Желіде өте көп – мысалы біреу рефератты көшіріп алып өз сайтында басқа атпен басып шығаруы мүмкін. Қазіргі заманғы іздеу машиналары барлық бұл проблемаларды шешуге мүмкіндік береді.
Индекс арқылы іздеу
Индекс арқылы іздеу мынадан құралады, яғни пайдаланушы сұраныс құрастырып оны іздеу машинасына береді. Бірнеше кілттік сөздерді қолдануда сұраныс тілін пайдаланған пайдалы, оның негізін буль операторлары құрайды.
Ең жиі қолданылатын буль операторлары:
o AND – бұл арқылы біріктірілген барлық терминдер ұсынылған құжатта қатысуы керек. Кейбір іздеу жүйелері “+” белгісін “AND” орнына қолданады;
o OR – кем дегенде бір кілттік сөз “OR ”-мен қатысты, ізделінетін құжатта болуы керек;
o NOT- “NOT”-тан кейінгі кілттік сөз ізделінетін құжатта кездеспеуі керек. Кейбір іздеу жүйелері “-” белгісін “NOT” орнына пайдаланады;
o FOLLOWED BY – кілттік сөздер бірінен кейін бірі кезектесіп келуі керек;
o NEAR – сөздердің бірі екінші сөзден белгілі санды сөздерден кейін келуі керек;
o Тырнақшалар – тырнақша ішіндегі сөздер- бұл текст фрагменті құжат немесе файл ішінде кездесуі тиіс. Айта кетейік, сұраныс тілі семантикасы нақты бір іздеу машиналарында бір біріне ұқсамауы мүмкін, әдетте ол туралы іздеу машинасының нұсқауында мәлімет келтіріледі.
Шектерінде логикалық комбинация анықталатын мәтін іздеу бірлігі деп аталады. Бұл сөйлем, абзац не бүкіл құжат болуы мүмкін. Түрлі іздеу жүйелерінде әртүрлі іздеу бірліктері қолданылуы мүмкін. Сөйлем шегіндегі іздеу тек индексінде толық мекенжай (адрес) бар жүйелерде ғана мүмкін.
Пайдаланушы іздеу жүйесіне сұраныс жібергеннен кейін, ол сұраныс синтаксисін өңдейді, кілттік сөздерді индекстегі сөздермен салыстырады. Содан кейін сұранысқа жауап беретін сайттар тізімі релеванттылығына қарай рангіленіп, пайдаланушыға берілетіндей іздеу нәтижесі құрастырылады.
Әдебиет: 2 нег [117-126].
Бақылау сұрақтары :
1. Интернетте қажетті ақпаратты іздеудің жалпы принциптері қандай?
2. Іздеу машинасының жұмыс механизмі қандай?
3. Интернетте ақпарат іздеу технологияларында индекс ұғымы нені білдіреді?
4. Индексті құру принциптері қандай?