Автор: Пользователь скрыл имя, 03 Ноября 2012 в 14:37, реферат
Интернет - кез келген компьютерлермен бүкіл әлем бойынша ақпарат алмасу мен беру мүмкіндігі, желілер жүйесі. Интернет - байланыс араларын өзара біріктіретін, тораптардың жиынтығы.
Әрбір топтарда көбінесе UNIX операциялық жүйесін басқару арқылы жұмыс істейтін бір немесе бірнеше қуатты компьютер-сервер болады. Мұндай торапты кейде хост деп атайды.
Торапты оның иесі - провайдер деп аталатын ұйым немесе Интернет қызметін жабдықтаушы басқарады.
Сілтемелердің тематикалық жинағы
Сілтемелердің тематикалық жинағы – бұл кәсіби топтармен немесе жеке жинақтаушылармен құрылған тізімдер. Шектелген кәсіби тақырыпты ірі каталогтің жұмыскерлер тобына қарағанда сол жұмыстың кәсіби маманы жақсы ашуы мүмкін.
== Домендік атты теру ==
Каталог – бұл ыңғайлы іздеу
жүйесі, бірақ егер сізге Intel немесе
IBM компаниясының сервері керек
болса, сіз каталогке қатынай
алмайсыз. Сәйкес сайттардың атын табу
қиын болмайды: www.intel.com, www.ibm.com.
Сол сияқты, сізге егер ауа райына арналған
сайт қажет болса, оны www.weather.com
серверінен іздеген дұрыс болады. Көп
жағдайларда кілттік сөз арқылы сайтты
табу мәтінде көп кездесетін сөзден тұратын
құжатты тапқаннан ыңғайлы. Іздеу кезінде
танымалы емес компаниялардың адресінің
атын интуитивті ойдан тергенде, бірде-бір
іздеу жүйесінде тіркелмеген сервермен
байланыс орнатуы мүмкін болғандықтан,
ол іздеудің басқа түрлерімен табысты
бәсекелесе алады. Осыған ұқсас іздеулер
тиімсіз, сондықтан ізделінетін сайттың
атын таба алмайтын болсаң, іздеу машинасын
қолдану керек.
Іздеу машиналары
Сұранысқа жауап ретінде сіз әдетте құжаттардың ұзын тізімін алаcыз, оның көбі сіздің сұрағыңызға жауап бермейді және сол тақырыпқа ешқандай қатысы болмайды. Сондай құжаттар релевантты емес (ағылшын сөзінен шыққан, relevant- лайықты, қатысты) деп аталады, ізденіс бойынша табылған құжаттар релевантты құжаттар деп аталады. Табылған сілтемелердің тізіміндегі релевантты құжаттардың проценті сұраныстың дұрыс қойылуына байланысты болады. Іздеу машинасы тапқан барлық құжаттардың ішіндегі релевант құжаттардың бөлігін іздеу дәлдігі деп атайды. Релевантты емес құжаттарды шуы бар құжаттар деп атайды. Егер табылған құжаттардың барлығы релевантты болып келсе (шуы жоқ құжаттар), іздеу дәлдігі 100% құрайды. Егер барлық релевантты құжаттар табылса, онда іздеу толымдығы 100% тең. Сайып келгенде, іздеу сапасы екі өзара тәуелді параметрлермен анықталады: дәлдікпен және іздеу толықтығымен . Толықтықтың артуы дәлдікті төмендетеді және керісінше. .
Іздеу машинасының жұмыс механизмі
Іздеу жүйелерін анықтама қызметімен салыстыруға болады, онда агенттер кәсіпорындарды аралап, мәліметтерді деректер базасына жинайды. Клиент анықтама қызметіне жолыққанда ақпарат сол деректер базасынан алынады. Мәліметтер базада ескіріп отырады, сондықтан агенттер оларды оқтын-оқтын жаңартады. Кейбір кәсіпорындар мәліметтерді өздері жібереді, сондықтан агенттердің оларға барудың қажеті болмайды. Басқаша айтқанда, анықтама қызметінің екі функциясы болады : жасау және деректер базасын тұрақты жаңарту және клиент сұранысы бойынша базадан хабар іздеу. Сол сияқты, іздеу машинасы да екі бөлімнен тұрады: робот - ол берілген серверлерді аралап деректер базасын қалыптастырады, және іздеу механизмі. Робот терминінің көптеген синонимдері бар, роботтан басқа оны желілі агент немесе торапта жүргеніне байланысты құрт немесе өрмекші дейді. Робот базасы негізі роботтың өзімен (робот өзі жаңа қорларға сілтемелер тауып алады) және аз дәрежеде өз сайттарын іздеу машиналарында тіркейтін қор иелерімен қалыптасады. Деректер базасын қалыптастыратын роботтан басқа табылған сілтемелердің рейтингісін анықтайтын программа бар. Іздеу машинасының жұмыс принципі пайдаланушы көрсеткен кілттік сөздер арқылы ішкі каталогтан (деректер базасы) релеванттігі бойынша сұрыпталған сілтемелер тізімін беру арқылы іске асырылады. Іздеу жүйесі тек ішкі каталогтармен операциялайтынын атап айтқан жөн. Іздеу машинасының мәліметтер базасы жүйедегі түйіндік адрестерді сұрау арқылы әрдайым жаңартылатынына қарамастан, іздеу машинасының ішкі қорларын және желі қорларын салыстыруға келмейді, сондықтан әрқашан машина ескірген адрес немесе қажетсіз ресурс табатыны өте ықтимал. Проблема тек қана ішкі қорлардың шектілігінде ғана емес, тағы роботтың жылдамдығының шектілігінде тұр. Іздеу машинасының ішкі қорларының көбеюі проблеманы шешпейді, себебі аралау жылдамдығы ақырлы.бірақ іздеу машинасының ішінде каталогтарға бөлінген Интернеттің кіріс қорларының белгілі бөлігінің көшірмесі болады деуге болмайды. Толық ақпарат (кіріс құжаттар) бәрі бірдей сақталмайды, көбіне жиі тек оның бөлігі – индекстенген тізім немесе индекс деп аталатын, құжат жолынан шағын бөлігі сақталады. Индекс құрау үшін кіріс мәліметтер қор көлемі минималды, ал іздеу тез әрі максималды пайдалы ақпарат беретіндей түрлендіріледі. Индеккстенген тізімді түсіндіру үшін оның қағаз аналогы – конкорданс, яғни сөздікті келтіруге болады, онда белгілі жасушымен қолданылатын сөздер алфавиттік тәртіпте болады, және де жазушы шығармасында келтірілгеніне сілтеме болады. Айтпаса да түсінікті, конкорданс (сөздік) шығарма тексінен шағын және одан керекті сөзді іздеген кітапты түгел парақтағаннан көп жеңіл.
Индексті құру
Желілік агенттер немесе робот-өрмекшілер Желі бойымен “өрмелейді”, Web – беттердіҫ талдайды және не әрі қай парақта табылғаны туралы ақпарат жинайды. Кезекті HTML-парақтарды табысымен көптеген іздеу машиналары (әр іздеу машиналарында әртүрлі) сөздерді, суреттерді, сілтемелерді және де басқа да элементтерді белгілейді. Сөздердің парақта барлығы ғана емес, әрі оның орналасуы, яғни бұл сөздің қайда орналасқаны: тақырыпта (title), тақырыпшаларда ( subtitles ), метатэгте ( meta tags ) немесе басқа орындарда . Әдетте негізгі сөз ескеріледі де, шылау мен одағайлар: “ ал ”,“ бірақ ” және “ немесе ” еленбейді. Метатегтер парақ иелерінің өзіне сол арқылы ізделінетін кілттік сөздер мен тақырыпты анықтауға мүмкіндік береді. Бұл әсіресе кілттік сөздің бірнеше мағынасы болғанда қажет. Метатегтер іздеу машинасын сөдердің бірнеше мағынасынан дұрысын таңдауға көмектеседі. Алайда метатегтер адал толтырылғанда ғана сенімді жұмыс істей алады. Web-парақтардың кейбір иелері өздерінің метатегтеріне Желіде көп аталатын өз сайт тақырыбына қатысы жоқ сөздермен толтырады, сол арқылы өзінің жаңа келушілерін тарту әрі қор қатысуы рейтингісін жоғарылату үшін жасайды. Іздеуден осы сияқты сайттарды шығару – жақсы іздеу жүйесінің тағы бір тапсырмасы. әрбір роботтың өз қараниетті жарнама үшін жазаланған қор тізімі бар. Тапсырма берілген Web-парақтарда ақпарат жиналғаннан кейін алынған мәліметтерді индекстеу жүреді. Робот-өрмекшілер Web-парақтардың ақпараттарын қарастырып, кілттік сөздер арқылы индекстенген іздеу базасын құрады, содан кейін пайдаланушы сұранысы арқылы жүйе дұрыстығына (релевантты) қарай сайттар тізімін береді. Айқын, егер сіз сайтты “гүл” деген кілттік сөзбен іздесеңіз, онда іздеу машинасы сол сөз бар парақтарды тауып қана қоймай, бұл сөздің қай жерде сайт тақырыбына қатыстылығын анықтай алуы керек. Сөздің Web-парақтың профиліне қатыстығын анықтау үшін оның парақта қаншалықты жиі ұшырасатынын, берілген сөз туралы сілтемелердің бар-жоқтығын бағалау керек. Қысқаша айтқанда, парақта табылған сөздерді маңыздылық дәрежесіне қарай рангілеу керек. Сөздерге салмақтылық коэфициенттері оның қанша және қайда кездесетініне қарай (парақ тақырыбында, беттің басы не аяғында, сілтемеде, метатегте және т.б) меншіктеледі. әрбір іздеу механизмі салмақ коэфициенттерін берудің өз алгоритмдері бар – бұл әртүрлі іздеу машиналарының бір кілттік сөз арқылы сұрауға әртүрлі қорлар тізімін берудің бір себебі. Парақтар әрдайым жаңартылып отыратындықтан, онда индекстеу үрдісі де жиі орындалып отырылуы керек. Робот-өрмекшілер сілтемелерді аралай жүріп, индекстен тұратын файлды құрады, ол үлкен болуы мүмкін. Оның көлемін азайту үшін ақпарат көлемін минимизациялау мен файлды сығуға жүгінеді. өңделгеннен кейін мәліметтер үнемі жанарып отыратын базада сақталады. Бірнеше роботтары бар іздеу машинасы секундына жүздеген парақтарды өңдей алады. Бүгінде мықты іздеу машиналары жүздеген миллион парақты сақтайды және күніне ондаған миллион сұранысты қабылдайды. Индексті құруда дубликаттардың санын азайту тапсырмасы да шешіледі – қатесіз салыстыру үшін алдымен құжаттың кодировкасын анықтау қажеттігін ескерсек, тапсырма оңай емес. Бұдан да қиын тапсырмаға өте ұқсас құжаттарды айыру жатады (оларды “дубликат дерлік” деп атайды), мысалы оларға мазмұны бір ал тақырыбы әртүрлілер жатады.Бұл сияқты құжаттар Желіде өте көп – мысалы біреу рефератты көшіріп алып өз сайтында басқа атпен басып шығаруы мүмкін. Қазіргі заманғы іздеу машиналары барлық бұл проблемаларды шешуге мүмкіндік береді.
Индекс арқылы іздеу
Индекс арқылы іздеу мынадан
құралады, яғни пайдаланушы сұраныс
құрастырып оны іздеу машинасына
береді. Бірнеше кілттік сөздерді
қолдануда сұраныс тілін
Internet желісінде қандай
да бір ақпаратты орналасқан
орнын білмей тұрып табу қиын.
Бұндай жағдайда миллиардтаған
веб-беттеріне қол жеткізуді
Internet-те алуан түрлі
ақпараттық-іздеу порталдары
Әдетте ақпараттық-іздеу
порталдарының бәрі ұқсас сұлба
бойына жұмыс істейді. Енгізу өрісіне
кілттік сөздерді жазып, Іздеу батырмасын
басамыз. Осыдан кейін сайттар тізімі
іріктеліп, бейне бетке шығарылады
Енгізу өрісінің астыңғы жағында
беттерді іздеу нәтижесі көрінеді.
Ол бейне бетке бөлшектеп
Google Inc. | |
| |
Түрі |
Ашық акционерлік қоғам |
Биржадағы листингі |
NASDAQ: GOOG |
Құрылған жылы |
1998 |
Орналасқан жері |
АҚШ Маунтин-Вью (Калифорния) |
Басты адамдары |
Ларри
Пейдж — басты атқарушы директор |
Саласы |
Интернет |
Меншікті капиталы |
USD 46,241 млрд (2010)[1] |
Айналым |
USD 29,321 млрд (2010)[1] |
Операциялық кірісі |
USD 10,381 млрд (2010)[1] |
Таза табыс |
USD 8,505 млрд (2010)[1] |
Қызметкерлер саны |
28 768 (1 шілде 2011)[2] |
Еншілес компания |
YouTube, DoubleClick, On2 Technologies, Google Voice, Picnik, Aardvark, AdMob |
Сайты |
Google.com |
Google Inc.([ɡuːɡl], қаз. Гугл) – Google Inc. Америка қоғамдық корпорациясына тиесілі кеңейтілген іздеу жүйесі.[3] Танымалдығы бойынша бірінші орында тұр (79.65 %), айына 41 млрд 345 млн сұраныс қабылдайды (нарық бөлігі 62,4 % ), 25 миллиардтан астам веб-беттерді индекстейді, (2009 жылдың 15 қазанынан бастап) ақпараттарды 191 тілде іздеу мүмкіндігіне ие.
Google іздеу жүйесі PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint және т. б. форматтағы құжаттарды тауып беру мүмкіндігіне ие.
Мазмұны 1 Құрылу тарихы 2 Google компаниясы 3 Қызметі 4 Логотипі 5 Сайт индексациясы 6 Дереккөздер |
Құрылу тарихы
Негізгі мақала: Google тарихы
Google іздеу жүйесін Стэнфорд университетінің аспиранттары Ларри Пейдж және Сергей Брин оқу жобасы ретінде шығарған еді. Олар 1996 жылы BackRub іздеу жүйесімен жұмыс істеп, 1998 жылы аталмыш іздеу жүйесінің негізінде Google-дың негізін салады. Алғаш рет Google жеке-меншік корпорация ретінде 1998 жылы 4 қыркүйекте құрылады, Ларри Пейдж, Сергей Брин және Эрик Шмидт Google-да 2014 жылға дейін бірлесіп жұмыс істеуге келіседі. Компанияның көздеген мақсаты «әлемдік ақпаратты жинап, халық тұтынуына мол мүмкіндік беру. Google инженері Амит Патель ойлап тапқан компанияның бейресми ұраны –"Don't be evil" (Қатыгез болма!)». 2006 жылы компания қазіргі Штаб-пәтері орналасқан Калифорния штаты, Маунтин-Вьюға көшеді. Google.com домені 1997 жылы 15 қыркүйекте тіркеледі, іздеу жүйесі (2000 жылдан бастап) туған күнін 7 де және 27 қыркүйекте де атап өтеді.
Google компаниясы
Google сондай-ақ Gmail электронды поштасы қызметін және Orkut, Google Buzz және Google+ әлеуметтік желілер қызметін, Google Chrome веб-браузерін ұсынады, сонымен қатар Google Motorola Droid ұялы телефондарына, Samsung Galaxy смартфондар серияларына, сондай-ақ Google Chrome OS, 5 Samsung серияларына және Acer AC700 Android ұялы операциялық жүйесін қондырумен жұмыс жасауда. Қазіргі кезде Google-дың бүкіл әлем бойынша миллионнан астам серверлері және миллиардтан астам іздеу сұраныстары қызмет көрсетуде. Alexa-ның тізімі бойынша, google.com сайты интернеттегі ең көп қолданылатын веб-сайт ретінде анықталды. Сондай-ақ YouTube (Alexa: 3), Blogger (Alexa:. 6), және Orkut сияқты Google - дың көптеген халықаралық жеке сайттары (Үндістанда google.co.in сайты, Ұлы Британияда google.co.uk сайты) ең көп қолданылады. 2011 жылы Google-ге кірушілер саны 1 миллиардқа жетеді. Google атауын Гугол (Googol) – Сергей Брин берген. Google «гугол» сөзінің жазылуында өрескел қате кеткен. Жүз нөл біреуінде дегенді көрсетеді, яғни іздеу жүйесі халықты мол ақпаратпен қамтамасыз етеді дегенді білдіреді. Алғашында Google Стэндфорд университеті сайтында google.stanford.edu доменімен жұмыс істейді. 2001 жылдан бері Google көптеген компанияларға ие болады. 2004 жылы Google компаниясы Keyhole, Inc компаниясын иемденіп Жердің 3D көрінісін беретін Earth Viewer деп аталатын өнімін шығарады.
Қызметі
Викиіздеу Пайдаланушыға іздеу сұранысы бойынша берген нәтижелерді реттеуге мүмкіндік беретін іздеу технологиясы. Пайдаланушы шыққан нәтижелерді тізімнен өшіріп, тізімді жоғары көтере алады. Аталмыш технологияны 2009 жылы Google компаниясы шығарады, технология сол жылдың күзіне дейін қызмет атқарып келеді. 2010 жылы, 4 мамырда іздеу баптауларында «Викиіздеу» қызметін қосумен жұмыс істеуді бастайды.
Google Аудармашы - мәтіндерді немесе веб-беттерді аударуға арналған машиналық аудармашы. SYSTRAN технологиясын қолданатын Babel Fish және AOL аударма сервистеріне қарағанда Google де Translate.ru сияқты өзіндік бағдарламалық қамтамасыз етуін қолданады. Компания қызметкерлері веб дизайнерлер үшін сайттың аудармасын бірден басқа тілдерге аударуын қамтамасыз етеітн скрипт ойлап шығарған. Google Аудармашының да басқа автоматты аударма құралдар сияқты өзіндік шектеулері бар. Әрдайым аударманың сапасына қатысты жұмыстар жүргізіп отырады, басқа да тілдерге аудару жұмыстары жасалуда.
Дыбыстық іздеу 2010 жылы 22 қыркүйекте компания Ресейде дыбыс іздеуін шығарады. Іздеу үшін телефондағы іздеу түймесін басып, өз сұранысыңызды дыбыстайсыз. Телефон сіздің дыбысыңызды серверге жіберіп, браузер дыбыс бойынша іздеу нәтижелерін тауып береді.
Логотипі
Google Doodle Google логотипі мейрамдарда немесе танымал тұлғалардың туылған күндерінде өзгеріп отырады. (әр аймақтық домендер өз мейрамдарына, белгілі бір атаулы күндерге байланысты өзгеріп отырады) Мысалы, Наполеон Орданың туылған күнінде 2010 жылы 11 ақпанда Google-дың белорусь домені логотипінде атақты суретшінің акварельдері шығады. Сондай-ақ, 2011 жылы 22 наурызда Қазақстандағы Google домені логотипінде 22 Наурыз қазақтың төл мерекесіне байланысты көктемнің суреті шығады. Ал сол жылы 16 желтоқсанда Қазақстан Республикасының тәуелсіздігіне 20 жылдығына арналған жаңа логотипі шықты.