Поиск информации в сети internet – 16. Поиск информации в интернете

Содержание

16. Поиск информации в интернете

16.Поиск информации в интернете

Информация, размещенная во Всемирной сети, исчисляется огромным количеством байт. Для поиска информации во Всемирной сети используются специальные веб-сайты – информационно-поисковые системы. Они позволяют по ключевым словам найти информационные ресурсы, связанные с ключевыми словами. Это может быть текст, содержащий ключевые слова, или графическое изображение одного из ключевых слов. Примерами информационно-поисковых систем являются системы Google и Yandex.

Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.

Существуют три основных способа поиска информации в Интернет:

1. Указание адреса страницы.

2. Передвижение по гиперссылкам.

3. Обращение к поисковой системе (поисковому серверу).

Способ 1: Указание адреса страницы

Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).

Способ 2: Передвижение по гиперссылкам

Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.

Способ 3: Обращение к поисковой системе

Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.

На помощь приходят специальные поисковые системы (ихеще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы:Яндекс (yandex.ru), Google (google.ru) и Rambler (rambler.ru

Поисковая система — веб-сайт, предоставляющий возможность поиска информации в Интернете.

Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы.

Поисковые каталоги служат для тематического поиска.

Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных.

Катало́г ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог — структурированный набор ссылок на сайты с кратким их описанием.

Каталог в котором ссылки на сайты внутри категорий сортируются по популярности сайтов называется рейтинг (или топ).

Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, — и получает список ссылок на web-страницы, содержащие указанные термины.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, разработанный Мэтью Грэйем из Массачусетского технологического института в 1993.

Как работает поисковой индекс?

Поисковые индексы автоматически, при помощи специальных программ(веб-пауков), сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных.

Поисковый робот ( «веб-паук») — программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы.

В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, ведущих web-страницам, на которых нужная информация имеется или упоминается. Обширность списка может быть любой, в зависимости от содержания запроса.

http://www.yandex.ru/

Яндекс — российская система поиска в Сети. Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года. Головной офис компании находится в Москве. У компании есть офисы в Санкт-Петербурге, Екатеринбурге, Одессе и Киеве. Количество сотрудников превышает 700 человек.

Слово «Яндекс» (состоящее из буквы «Я» и части слова index; обыгран тот факт, что русское местоимение «Я» соответствует английскому «I») придумал Илья Сегалович, один из основателей Яндекса, в настоящий момент занимающий должность технического директора компании.

Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, румынском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.

По умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска можно увеличить размер страницы до 20, 30 или 50 найденных документов.

Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам.

http://www.google.ru/

Лидер поисковых машин Интернета, Google занимает более 70 % мирового рынка. Cейчас регистрирует ежедневно около 50 млн поисковых запросов и индексирует более 8 млрд веб-страниц. Google может находить информацию на 115 языках.

По одной из версий, Google — искажённое написание английского слова googol. «Googol (гугол)» – это математический термин, обозначающий единицу со 100 нулями. Этот термин был придуман Милтоном Сироттой, племянником американского математика Эдварда Каснера, и впервые описан в книге Каснера и Джеймса Ньюмена «Математика и воображение»(Mathematics and the Imagination). Использование этого термина компанией Google отражает задачу организовать огромные объемы информации в Интернете.

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

http://www.rambler.ru/

Rambler Media Group — интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный портал.

Rambler создан в 1996 году.

Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова.

studfile.net

Поиск информации в интернете — способы поиска информации с применением языка запросов

Обновлено: 17 ноября 2019, в 18:28

Становимся профессионалами поиска информации в интернете

Всем привет! В сегодняшней статье я расскажу вам о том, как научиться быстрее и качественнее отыскивать нужную вам информацию. Однажды мне, по долгу службы, пришлось выполнять заказ, информации по которому было совсем мало и найти ее было тяжело. Приходилось перелопачивать пол интернета, чтобы найти нужную информацию. Именно в тот момент, я решил поближе познакомиться с расширенными возможностями поисковых систем. В результате знакомства были найдены интересные способы поиска, которые в дальнейшем очень помогли закончить тот сложный  проект.

Содержание статьи

Существуют три основных способа поиска информации в Интернет:

  1. Указание адреса страницы.
  2. Передвижение по гиперссылкам.
  3. Обращение к поисковой системе (поисковому серверу).

О последнем пункте и поговорим дальше. В этой статье речь пойдет об известных поисковиках, о принципах их работы и о расширенных возможностях поисковых систем. Вы узнаете некоторые интересные способы поиска и получите массу полезных советов, которые непременно облегчат вам поиск нужной информации в интернете.

Как работают системы веб-поиска

По данным сервиса статистики LiveInternet.ru распределение поисковых систем в России примерно следующее:

  1. Яндекс — 53.9%
  2. Гугл — 35.0%
  3. Поиск Mail.ru — 8.3%
  4. Рамблер — 0.9%
  5. Яндекс (картинки) — 0.6%
  6. Гугл (картинки) — 0.2%
Данные сервиса статистики LiveInternet.ru

Теперь, чтобы лучше понять, как работают поисковые системы, сделаем краткий обзор механизма работы. Поисковая система работает в следующем порядке:

  • Сбор данных поисковым роботом пауком (Web crawling)
  • Индексация найденных данных (Indexing)
  • Поиск по индексированным данным (Searching)

Сбор данных поисковым роботом пауком

Обычно делится на 2 этапа – скачивание веб-страницы и анализ ссылок. Первый этап выполняет Spider (быстрый поисковый паук) – программа для последовательного перебора и скачивания веб-страниц для анализа. Она получает веб-страницы с сайтов по определенному алгоритму и отдает их другой программе Crawler-у. После этого в дело вступает Crawler (медленный паук анализатор), который находит все ссылки и составляет дальнейший маршрут для spider-а. У spider-а есть определенный список сайтов для посещения, заранее подготовленный другими подсистемами поиска. Из этого списка spider получает все необходимые данные.

Индексация найденных данных

После того, как проходит первый этап, в дело вступает вторая подсистема – подсистема индексации. Она размещает найденную пауками информацию так, чтобы было удобно в дальнейшем к ней обращаться. Для этого программа Индексатор разбирает страницу на различные ее части и анализирует их. Из страницы выделяются заголовки страниц, ссылки, текст, структурные элементы и т.д. Все полученные данные структурируются по определенному алгоритму и затем полученные данные заносятся в базу данных.

Поиск по индексированным данным

Эта подсистема выдачи результатов, которая использует сформированную индексатором базу данных. Она определяет, какие страницы удовлетворяют запросу пользователя и показывает результаты поиска. Когда вы вводите ключевое слово и делаете поиск, поисковая система отбирает результаты на основании следующих критериев:

  1. Title (заголовок): Есть ли ключевое слово в заголовке?
  2. Domain/URL (Домен/адрес): Есть ли ключевое слово в имени домена или в адресе страницы?
  3. Style (стиль): Анализ стиля текста на страницы. Используется ли
    Жирный
    текст или Курсив, используются ли заголовки h2, h3 и т.д.
  4. Density (плотность): Как часто употреблено ключевое слово на странице? Какова величина плотности ключевого слова?
  5. MetaInformation (мета данные) – поиск совпадений в метаданных.
  6. Outbound Links (ссылки наружу): Есть ли ссылки на странице и на кого они ведут, а также встречается ли ключевое слово в тексте ссылки?
  7. Inbound Links (внешние ссылки): Кто ссылается на искомую страницу? Каков текст ссылки?
  8. Insite Links (ссылки внутри страницы): На какие страницы данного сайта содержит ссылки эта страница?

В результате этого сравнения подсистема поиска выбирает нужные веб-страницы и показывает их пользователю, который осуществляет поиск.

Что можно найти через поисковики

Технически найти можно любую информацию, которая проиндексирована поисковиком, находиться в общем доступе в сети интернет и не запрещена политикой поисковой системы. При поиске в интернете имейте ввиду следующее:

  • Большая часть информации в интернете не контролируется и любой человек с компьютером и доступом в интернет может публиковать информацию. Поэтому нужно понимать, что данные могут быть недостоверными.
  • Не всегда легко узнать кто автор найденной информации.
  • Вы не всегда знаете откуда приходит информация.
  • Информация может быть предвзятой, специально вводящей в заблуждение или просто неверной.
  • Дата публикации данных может быть не указано и будет трудно понять, является ли информация актуальной.

Чаще всего люди ищут через поиск (расположено примерно по убыванию):

  1. Всевозможные социальные сети – Вконтакте, Facebook, Одноклассники, mail.ru и т.д
  2. Порно
  3. Фильмы
  4. Картинки
  5. Музыку
  6. Интернет
  7. Авто
  8. Youtube
  9. Игры онлайн
  10. Компьютеры
  11. Деньги, финансы
  12. Отдых
  13. Недвижимость
  14. Спорт
  15. Реклама
  16. Строительство
  17. Здоровье
  18. Информацию о знаменитостях
  19. Приготовление еды, кулинария
  20. Логистика
  21. Заработок в интернете

Примерно 2-3% от всех введенных запросов обычно сформулированы как вопрос. Больше всего вопросительных запросов начинаются с:

  • какой
  • сколько
  • кто

В последнее время все больше запросов (около 10%) стали содержать прямое указание – купить, продать или получить что-то. Самые распространённые уточнения сегодня в рунете – это скачать и бесплатно. Примерно 4% от всех запросов. Самыми часто встречающимися ошибками при поиске – ошибки, возникающие из-за неверной раскладки клавиатуры, недописанные запросы и синтаксические ошибки.]

Методы поиска информации в интернете

5 полезных способов поиска в Google

Итак, давайте рассмотрим несколько хитрых способов поиска информации через поисковую систему. Для примера, используем Google (наверное не совсем удачный пример, ну да ладно 🙂 ).

Ситуация 1 – Поиск по изображению: Есть изображение или логотип какой-то программы или компании и вы хотите найти подробную информацию о нем.

Приведу пример. Я однажды увидел на стенах во дворе примерно следующее изображение:

Значок пацифистов

и никак не мог вспомнить, откуда оно взялось. Написать в поиске – «Кружочек, внутри которого палочка и еще 2 палочки» вряд ли что-нибудь дал 🙂 . Вот здесь и приходит нам на помощь сервис поиска картинок по цифровому коду изображения от Google. Рисуем на скорую руку изображение в любом графическом редакторе и перетаскиваем его в поиск гугл по картинкам.

 

Поиск по картинке

Обычно, в результатах поиска по картинкам можно всегда найти искомое, главное — это более-менее сносно нарисовать. Т.к. художник из меня никакой, то результаты поиска оставлю в секрете 🙂

Другой пример. Есть логотип компании, например такой:

Логотип Инфинити

Логотип лишь для примера, потому как его наверное многие знают. Перетаскиваем его мышкой в поле для поиска и видим что получилось:

Поиск компании по логотипу

Иногда изображения наложены друг на друга в одной картинке. Чтобы найти по нужному изображению, придется его аккуратно скопировать каким-нибудь графическим редактором, выделив нужную область. Если вы хорошо владеете каким-нибудь графическим редактором, то прежде чем искать по изображению, можно его обработать и почистить от лишнего «шума». Тогда результат поиска будет намного качественнее.

Ситуация 2 – Поиск внутри файлов с определенным расширением. Для того, чтобы искать текст в файлах, нужно ввести в поисковую строку следующую команду: filetype:xls искомый текст. Xls в данном случае – это расширение файлов Excel. Т.е. поисковая машина будет искать текст внутри файлов с указанным расширением. Например: filetype:xls отчет. В итоге получаем все Excel файлы, в которых встречается слово отчет:

Поиск по типу файла

Таким образом можно, например скачать шаблон какого-нибудь документа, ну или сам документ 🙂 , если его специально в общий доступ положили или просто забыли защитить.

Для поиска доступны следующие типы файлов:

  • pdf – поиск указанного текста внутри pdf файлов
  • dwf – файлы программы AutoCAD
  • ps – файлы Adobe Post Script, специальные сценарии для вывода высококачественной векторной графики на принтеры и плоттеры
  • kml и kmz – файлы программы Гугл Планета Земля(Google earth)
  • xls – файлы программы Microsoft Office Excel
  • ppt – файлы программы Microsoft Office Power Point
  • doc – файлы программы Microsoft Office Word
  • rtf – файлы Rich Text Format, поддерживаемые большинством текстовых редакторов
  • swf – файлы проигрывателя флеш-плеера Shockwave Flash
  • txt – поиск внутри обычных текстовых файлов

Ситуация 3 – Ищем точное вхождение поисковой фразы. Иногда нужно найти точное вхождение фразы в каком то тексте. В принципе здесь два пути. Первый подход – вводите в поисковую строку точную и достаточно длинную поисковую фразу и поисковик найдет текст, который наиболее точно содержит то, что мы ищем. Чем больше и точнее будет поисковый запрос, тем более точное совпадение найдет поисковая машина (если конечно такая информация присутствует в сети интернет).

Второй подход – обрамлять кавычками поисковую фразу. В этом случае фраза может состоять из небольшого количества слов. Например, вводим – “Большие города”, получаем:

Поиск по точному вхождению фразы

Но если мы попытаемся ввести между этими двумя словами в кавычках что-то бессмысленное, то поиск не даст результатов. И даже если вставить одну бессмысленную букву, поиск не даст результатов, хотя поисковая система и попытается предложить нам подходящие варианты.

Ситуация 4 – Поиск информации только по одному определенному сайту или домену. Если вам нужно найти информацию по определенному сайту, то… можно воспользоваться поиском, который есть на сайте ну или попробовать найти что-то при помощи поисковый системы Google. Глядишь, и найдется что-то, что не хотел (или не смог) искать встроенный в сайт поиск. Для этого вводим в поисковую строку следующее выражение: Разное site:livejournal.ru  Разное – это текст, который вы ищете, все что после site: это доменное имя сайта, на котором нужно искать.

Поиск по сайту

Тот же механизм работает для доменов. Вместо имени сайта можно указать в каком домене искать информацию, например: Закон site:gov, где .gov — общий домен верхнего уровня для правительственных организаций.

Ситуация 5 – Поиск информации по электронной почте. Иногда необходимо найти информацию по человеку или организации, но на руках есть только адрес электронного почтового ящика (email). Если ввести в поисковую строку адрес почтового ящика, то можно найти все сайты и ресурсы, где человек оставлял свой email. Можно также найти домены, которые зарегистрированы на этот ящик.

Поиск по email

Еще один способ поиска – это использование оператора *, который позволяет заполнить поисковый запрос произвольным текстом и частью почтового адреса. Например можно найти почтовые ящики сотрудников компании, написав *@имякомпании.ru, для примера *@microsoft.com

7 полезных советов при поиске информации

  1. Составлять поисковый запрос нужно так, чтобы максимально сузить количество вариантов в выдаче
  2. Используйте фильтрацию по времени – это позволит найти более-менее актуальную информацию. Благо сейчас все крупные поисковые системы предоставляют расширенный поиск, в котором можно установить диапазон дат.
  3. Корректный вопрос, задаваемый поисковику, должен состоять как минимум из двух ключевых слов тогда поисковику будет гораздо проще отыскать нужную информацию
  4. Для поиска информации используйте разные поисковые машины. Несмотря на то, что все поисковики построены на общих принципах, алгоритмы у них могут различаться. Поэтому может случиться так, что то, что не смог найти Yandex, выдаст Google
  5. Если вы ищете какие-либо товары или услуги в вашем городе, уточняйте регион поиска(например Москва). Это уменьшит количество результатов, но найденные результаты будут более релеванты вашим поисковым запросам
  6. Используйте больше существительных для поиска.
  7. Используйте синонимы, если по запросу не было найдено то, что нужно

Главный фактор успешного и быстрого поиска – это формулировка запроса для поисковой системы. Если вы умеете сообразить, какие нужны ключевые слова для устраивающего вас результата – вы король поиска!

«Горячий» расширенный поиск от Google. 16 способов

Некоторые методы я уже затрагивал выше, некоторые еще нет. Привожу для полноты весь список.

Исключение из Google поиска

Чтобы исключить из поисковой выдачи какое либо слово, фразу, символ и т.п., достаточно перед ним поставить знак “-” (минус), и оно не появится в результатах поиска. Для примера, я ввёл в строку поиска следующую фразу: “бесплатный хостинг – ru” и в поисковой выдаче нет ни одного .ru сайта, кроме оплаченных рекламных объявлений.

Поиск по синонимам

Используйте символ “~” для поиска схожих слов к выбранному. Например в результате выражения: “~лучшие фильмы -лучшие” вы увидите все ссылки на страницы, содержащие синонимы слова “лучшие”, но ни одно из них не будет содержать этого слова.

Неопределённый поиск

На тот случай, если вы не определились с конкретным ключевым словом для поиска, поможет оператор “*”. Например фраза “лучший редактор * изображений” подберёт лучшие редакторы для всех типов изображений, будь то цифровые, растровые, векторные и т.д.

Поиск на выбор из вариантов

Используя оператор “|”, можно осуществить Google поиск по нескольким сочетаниям фраз, заменяя несколько слов в различных местах. Например, введём фразу “купить чехол | ручку” выдаст нам страницы, содержащие либо “купить чехол”, либо “купить ручку”

Значение слова

Чтобы узнать значение того или иного слова, достаточно ввести в поисковую строку “define:” и после двоеточия искомую фразу.

Точное совпадение

Для нахождения точного совпадения поисковой выдачи с запросом достаточно заключить ключевики в кавычки.

Поиск по определённому сайту

Чтобы осуществить поиск ключевых слов только по одному сайту, достаточно прибавить к искомой фразе следующий синтаксис – “site:”.

Обратные ссылки

Чтобы узнать расположение ссылок на интересующий сайт, достаточно ввести следующий синтаксис: “links:” и далее адрес интересующего сайта.

Конвертер величин

Поисковая система Google также умеет конвертировать величины по запросу пользователя. Например, нам нужно узнать, сколько составляет 1 кг в фунтах. Набираем следующий запрос: “1 кг в фунтах”

Конвертер валют

Для того, чтобы узнать курс валют по официальному курсу, набираем следующий поисковой запрос: “1 [валюта] в [валюта]”

Время по городу

Если хотите узнать время по какому либо городу, то используйте синтаксис: “time” или русский аналог “время” и название города.

Google калькулятор

Google умеет считать онлайн! Достаточно вбить пример в строку поиска и он выдаст результат.

Поиск по типам файлов

Если вам необходимо найти что-то по конкретному типу файла, то у Google есть оператор “filetype:” который осуществляет поиск по заданному расширению файла.

Поиск кэшированной страницы

У Google есть собственные сервера, где он хранит кэшированные страницы. Если нужна именно такая, то воспользуйтесь оператором: “cached:”

Прогноз погоды по городу

Ещё одним оператором поиска у Google является оператор погоды. Достаточно вбить “weather” и город, как вы увидите, будет у вас дождь или нет

Переводчик

Можно переводить слова сразу, не отходя от поисковика. За перевод отвечает следующий синтаксис: “translate [слово] into [язык]”

P.S. Комбинируя различные варианты параметров можно очень сильно сократить диапазон поиска и найти то что нужно. Надеюсь, приведенные выше примеры помогут вам в поиске информации.

promotiger.ru

Поиск информации в сети интернет

Проблема поиска

    Говорят, что в Интернете есть все. На самом деле – это не так. Материалы для размещения в сети готовят живые люди, и потому там можно найти лишь то, что они сочли нужным опубликовать. Впрочем, река питается ручьями, и, благодаря их творчеству сегодня в Интернете уже образовалось около двух миллиардов Web-страниц. В результате каталогизация имеющихся в сети ресурсов стала серьезной проблемой. Несмотря на то, что проблемой занимаются тысячи организаций, она не только не приближается к разрешению, но и становится острее. Процент каталогизированных ресурсов неуклонно падает. В последние годы это падение стало катастрофическим. Так, если в 1999 году процент каталогизированных ресурсов приближался к 40%, то всего лишь за один следующий год он опустился до 25 %.

    Вывод простой: пространство Web быстрее наполняется, чем систематизируется.

     К сожалению, у нас нет оснований предполагать, что в ближайшее время что-нибудь может измениться к лучшему. В итоге поиск информации в Интернет можно считать одной из самых трудных задач.

Поисковые системы

    Для поиска интересующей вас информации необходимо указать браузеру адрес Web-страницы, на которой она находится. Это самый быстрый и надежный вид поиска. Для быстрого доступа к ресурсу достаточно запустить браузер и набрать адрес страницы в строке адреса.

    Адреса Web-страниц приводятся в специальных справочниках, печатных изданиях, звучат в эфире популярных радиостанций и с экранов телевизора.

    Если вы не знаете адреса, то для поиска информации в сети Интернет существуют поисковые системы, которые содержат информацию о ресурсах Интернета.

    Каждая поисковая система – это большая база ключевых слов, связанных с Web-страницами, на которых они встретились. Для поиска адреса сервера с интересующей вас информацией надо ввести в поле поисковой системы ключевое слово, несколько слов или фразу. Тем самым вы посылаете поисковой системе запрос. Результаты поиска выдаются в виде списка адресов Web-страниц, на которых встретились эти слова.

    Как правило, поисковые системы состоят из трех частей: робота, индекса и программы обработки запроса.

Робот (Spider, Robot или Bot) — это программа, которая посещает веб-страницы и считывает (полностью или частично) их содержимое.

    Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы.

Индекс — это хранилище данных, в котором сосредоточены копии всех посещенных роботами страниц.

    Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.

Программа обработки запроса — это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы.

    Множество ссылок на выходе системы распределяется программой в порядке убывания от наибольшей степени соответствия ссылки запросу к наименьшей.

    В России наиболее распространенными поисковыми системами являются:

     За рубежом поисковых систем гораздо больше. Самыми популярными являются:

     Яндекс является пожалуй наилучшей поисковой системой в российском Интернете. Эта база данных содержит около 200 000 серверов и до 30 миллионов документов, которые система просматривает в течение нескольких секунд. На примере этой системы покажем как осуществляется поиск информации.

    Поиск информации задается введением ключевого слова в специальную рамку и нажатием кнопки «Найти», справа от рамки.

    Результаты поиска появляются в течение нескольких секунд, причем ранжированные по значимости – наиболее важные документы размещаются в начале списка. При этом ранг найденного документа определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше).

    Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой системой сайтов.

    Содержательную часть сайта можно косвенно оценить по краткому его описанию, размещаемому Поисковой системой под адресом Сайта. Некоторые недобросовестные авторы сайтов, для того, чтобы повысить вероятность появления своей Web-страницы на первых местах Поисковой системы, умышленно включают в документ бессмысленные повторы ключевого слова. Но как только поисковая система обнаруживает такой «замусоренный» документ, она автоматически исключает его из своей базы данных.

    Даже ранжированный список документов, предлагаемый поисковой системой в ответ на ключевую фразу или слово, может оказаться практически необозримым. В связи с этим в Яндекс (как и других мощных Поисковых Машинах) предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска. Например, на ключевое слово список из 34 899 Веб-страниц. После ввода в команду «Искать в найденном» уточняющего ключевого слова список сокращается до 750 страниц, а после ввода в эту команду еще одного уточняющего слова этот список сокращается до 130 Веб-страниц.

Поиск по рубрикатору поисковой системы

    Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, npeдставляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию.

    Приведем в качестве примера структуру поискового интернет-каталога Яндекс.

    Это каталог общего назначения, так как в нем представлены ссылки на ресурсы Интернета практически по всем возможным направлениям. В этом каталоге выделены следующие темы:

  • Бизнес и экономика;

  • Общество и политика;

  • Наука и образование;

  • Компьютеры и связь;

  • Справочники и ссылки;

  • Дом и семья;

  • Развлечения и отдых;

  • Культура и искусство.

    Каждая тема включает множество подразделов, а они, в свою очередь, содержат рубрики и т. д.

    Предположим, вы готовите мероприятие ко Дню победы и хотите найти в Интернете слова известной военной песни Булата Окуджавы «Вы слышите, грохочут сапоги». Поиск можно организовать следующим образом:

    Яндекс > Каталог > Культура и искусство > Музыка > Авторская песня

    Такой способ поиска является достаточно быстрым и эффективным. В конце вам предлагается всего несколько ссылок, среди которых есть ссылки на сайты с песнями известных бардов. Остается только найти на сайте архив с текстами песен Б. Окуджавы и выбрать в нем нужный текст.

    Другой пример. Предположим, вы собираетесь приобрести мобильный телефон и хотите сравнить характеристики аппаратов разных фирм. Поиск мог бы вестись по следующим рубрикам каталога:.

    Яндекс > Каталог > Компьютеры и связь > Мобильная связь > Мобильные телефоны

    Получив ограниченное количество ссылок, можно достаточно оперативно их просмотреть и выбрать телефон, исследовав характеристики по фирмам и модификациям аппаратов.

Поиск по ключевым словам

    Большинство поисковых машин имеют возможность поиска по ключевым словам. Это один из самых распространенных видов поиска.

Для поиска по ключевым словам необходимо ввести в специальном окне слово или несколько слов, которые следует искать, и щелкнуть на кнопке Найти.

    Поисковая система найдет в своей базе и покажет документы, содержащие эти слова. Таких документов может оказаться множество, но много в данном случае не обязательно означает хорошо.

    Проведем несколько экспериментов с любой из поисковых систем. Предположим, что мы решили завести аквариум и нас интересует любая информация по данной теме. На первый взгляд самое простое — это поиск по слову «аквариум». Проверим это, например, в поисковой системе Яндекс. Результатом поиска будет огромное количество страниц — огромное количество ссылок. Причем, если посмотреть внимательнее, среди них окажутся сайты, упоминающие группу Б. Гребенщикова «Аквариум», торговые центры и неформальные объединения с таким же названием, и многое другое, не имеющее отношения к аквариумным рыбкам.

    Нетрудно догадаться, что такой поиск не может удовлетворить даже непритязательного пользователя. Слишком много времени придется потратить на то, чтобы отобрать среди всех предложенных документов те, что касаются нужного нам предмета, и уж тем более на то, чтобы ознакомиться с их содержимым.

    Можно сразу сделать вывод, что вести поиск по одному слову, как правило, нецелесообразно, ведь по одному слову очень сложно определить тему, которой посвящен документ, веб-страница или сайт. Исключение составляют редкие слова и термины, которые практически никогда не используются вне своей тематической области.

    Имея определенный набор наиболее употребительных терминов в нужной области, можно использовать расширенный поиск. На рис. показано окно расширенного поиска в поисковой системе Яндекс. В этом режиме возможности языка запросов реализованы в виде формы. Подобный сервис, включающий словарные фильтры, предлагается почти всеми поисковыми системами.

    Попробуем уточнить условия поиска и введем словосочетание «аквариумные рыбки». Количество ссылок уменьшится более чем в 20 раз. Этот результат нас устраивает больше, но все равно среди предложенных ссылок могут встретиться, например, русские сувенирные наборы спичечных этикеток с изображениями рыбок, и коллекции заставок для Рабочего стола компьютера, и каталоги аквариумных рыбок с фотографиями, и магазины аквариумных аксессуаров. Очевидно, что следует продолжить движение в направлении уточнения условий поиска.

    Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Эти языки во многом похожи. Изучить их все достаточно сложно, но любая поисковая машина имеет справочную систему, которая позволит вам освоить нужный язык.

Правила формирования запросов в поисковой системе Яндекс

    Приведем несколько простых правил формирования запроса в поисковой системе Яндекс.

Ключевые слова в запросе следует писать строчными (маленькими) буквами.

    Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы.

При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе.

Например, если в запросе было указано слово «знаю», то условию поиска будут удовлетворять и слова «знаем», «знаете» и т. п.

Для поиска устойчивого словосочетания следует заключить слова в кавычки.

Например, «фарфоровая посуда».

Для поиска по точной словоформе перед словом надо поставить восклицательный знак.

Например, для поиска слова «сентябрь» в родительном падеже следует написать «!сентября».

Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &

Например, «приключенческий роман» или «приключенческий&роман». Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа.

Если вы хотите, чтобы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, поставьте перед каждым из них знак плюс «+». Если вы, наоборот, хотите исключить какие-либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки « + » и «-» надо писать через пробел от предыдущего и слитно со следующим словом.

Например, по запросу «Волга -автомобиль» будут найдены документы, в которых есть слово «Волга» и нет слова «автомобиль».

При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|».

Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов.

Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки

Например, «(ребенок | малыш | дети | младенец) +(уход | воспитание)».

Знак «~» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе.

Например, по запросу «книги ~ магазин» будут найдены все документы, содержащие слово «книги», рядом с которым (в пределах предложения) нет слова «магазин».

Если оператор повторяется один раз (например, & или ~), поиск производится в пределах предложения. Двойной оператор (&&,~~ ) задает поиск в пределах документа.

Например, по запросу «рак ~~ астрология» будут найдены документы со словом «рак», не относящиеся к астрологии.

    Вернемся к примеру с аквариумными рыбками. После про¬чтения нескольких предлагаемых поисковой системой документов становится понятно, что поиск информации в Интернете следует начинать не с выбора аквариумных рыбок. Аквариум — сложная биологическая система, создание и поддержание которой требует специальных знаний, времени и серьезных капиталовложений.

    На основании полученной информации человек, производящий поиск в Интернете, может кардинально изменить стратегию дальнейшего поиска, приняв решение изучить специальную литературу, относящуюся к исследуемому вопросу.

    Для поиска литературы или полнотекстовых документов возможен следующий запрос:

    «+(аквариум | аквариумист | аквариумистика) +начинающим +(советы | литература) +(статья | тезис | полнотекстовый) -(цена | магазин | доставка | каталог)».

    После обработки запроса поисковой машиной результат оказался весьма успешным. Уже первые ссылки приводят к искомым документам.

    Теперь можно подытожить результаты поиска, сделать определенные выводы и принять решение о возможных действиях:

  • Прекратить дальнейший поиск, так как в силу различных причин содержание аквариума вам не под силу.

  • Прочитать предлагаемые статьи и приступить к устройству аквариума.

  • Поискать материалы о хомячках или волнистых попугайчиках.

Вопросы.

  1. Какой вид поиска является самым быстрым и надежным?

  2. Где пользователь может найти адреса Web-страниц?

  3. Каково основное назначение поисковой системы?

  4. Из каких частей состоит поисковая система?

  5. Какие поисковые системы вы знаете?

  6. Какова технология поиска по рубрикатору поисковой системы?

  7. Какова технология поиска по ключевым словам?

  8. Когда в критерии поиска надо задавать + или -?

  9. Какие критерии поиска в Яндексе заданы следующей фразой:

 (няня|воспитатель|гувернантка)++(уход|воспитание|присмотр)?

  1. Что означает удвоение знака (~~ или ++) при формировании сложного запроса?

Задание.

Задание 1. Поиск по каталогам.

    Пользуясь каталогом поисковой системы, найдите следующую информацию (по указанию учителя):

  1. Текст песни популярной музыкальной группы

  2. Репертуар Мариинского театра на текущую неделю

  3. Характеристики последней модели мобильного телефона известной фирмы (по вашему выбору)

  4. Рецепт приготовления украинского борща с галушками

  5. Долгосрочный прогноз погоды в вашем регионе (не менее чем на 10 дней)

  6. Фотография любимого исполнителя современной песни

  7. Примерная стоимость мультимедийного компьютера (прайс)

  8. Информация о вакансиях на должность секретаря в вашем регионе или городе

  9. Гороскоп своего знака зодиака на текущий день

    По результатам поиска составьте письменный отчет в Word: представьте в документе найденный, скопированный и отформатированный материал. Предъявите отчет учителю.

Задание 2. Формирование запроса по точному названию или цитате.

    Вам известно точное название документа, например «Гигиенические требования к персональным электронно-вычислительным машинам и организации работы». Сформулируйте запрос для поиска в Интернете полного текста документа.

    Результат поиска сохраните в своей папке. Предъявите учителю.

Задание 3. Формирование сложных запросов.

  • В любой поисковой системе составьте запрос для поиска информации о русской бане. Исключите предложения об услугах, рекламу банных принадлежностей и прочую рекламу. Сосредоточьте поиск на влиянии русской бани на организм.

  • Составьте сложный запрос на поиск информации по уходу за домашними кошками. Исключите из поиска крупных кошек (например, львов), а также предложения о покупке, продаже, фотографии для обоев и т. п.

  • Текст запроса и результат поиска оформите в Word и представьте учителю.

Задание 4. Тематический поиск.

    Всеми известными вам способами выполните поиск в Интернете информации по истории развития вычислительной техники. Поиск производите по различным направлениям: историческая обстановка, техника, личности. Результаты поиска оформите в виде презентации. Используйте в презентации многоступенчатой оглавление в виде гиперссылок.

infourok.ru

Электронный учебникПоиск информации в Интернете

Поиск информации в Интернете

Для поиска информации в обычно используются три способа (См. Рис.1). Первый из них — поиск по адресу. Он применяется, когда пользователю известен адрес информационного ресурса, содержащего необходимую ему информацию. При организации поиска информации по адресу (форма адреса — IP, доменный или URL — в этом случае значения не имеет) пользователю достаточно просто ввести адрес ресурса в соответствующее поле браузера – программы, предназначенной для обеспечения доступа к сетевым ресурсам.

Рис. 1. Способы поиска информации в гипертекстовых базах данных

Второй – поиск с помощью навигации по гиперсвязям. При использовании этого вида поиска случае пользователь сначала должен получить доступ к серверу, связанному с соответствующей БД. После этого можно найти документ, используя гиперссылки. Очевидно, что этот способ удобен, когда адрес ресурса неизвестен пользователю. Для использования в качестве исходной точки для поиска при реализации этого способа предназначены Web-порталы — серверы, предоставляющие прямой доступ к некоторому множеству серверов, включая установленные на них информационные ресурсы, а также Web-приложения, которые реализуют Web-сервисы, соответствующие назначению портала. Доступные через портал серверы могут относиться к определенной системе (например — корпоративной) или различным системам и быть специально подобраны по видовому, тематическому или другим признакам документов и данных, содержащихся на их сайтах. Обычно порталы совмещают в себе разнообразные функции с целью удержать клиента как можно дольше. Доминирующим сервисом портала является сервис справочной службы: поиск, рубрикаторы, финансовые индексы, информация о погоде и т.д. Если Web-сайты в большинстве случаев представляют собой наборы статических Web-страниц, то порталы являются совокупностями программных средств и заранее неструктурированной информации, которую эти средства превращают в структурированные данные по запросу конкретных пользователей.

Третий способ поиска предполагает использование поисковых серверов Интернета. Поисковыми серверами называют выделенные хост — компьютеры, в которых размещаются базы данных ресурсов Интернета. Пользовательский интерфейс такого сервера имеет поле для ввода ключевых слов, описывающих тему, интересующую пользователя (См. Рис. 2).

Рис.2. Вид окна поискового сервера системы Яндекс

Эти слова сервер воспринимает как информационный запрос, в соответствии с которым он осуществляет поиск ресурсов и представляет список найденных документов пользователю. Очевидно, что при реализации этого способа возможны ошибки как 1-го (пропуск цели), так и 2-го рода (информационный шум). Следует упомянуть, что различаются две группы поисковых серверов: поисковые машины и предметные каталоги. Их отличие обусловлено способом создания и последующего пополнения базы данных ресурсов Интернета, которой данный сервер осуществляет информационный поиск. Так, поисковые машины имеют в своем составе специальную программу — поисковый робот. Она осуществляет постоянный мониторинг сети, собирает информацию с Web- страниц, индексирует их и фиксирует их поисковый образ в своей базе данных. В предметных каталогах база данных о документах Интернета формируется «вручную» специалистами-редакторами. Поскольку в Интернете отсутствует единое администрирование, постольку его информационные ресурсы постоянно меняются. В нём могут появляться новые и исчезать существующие документы. Частота обновления информации в документах для разных сайтов различна: для некоторых — это несколько раз в час, для некоторых — раз в сутки, день, месяц и т.д. Поэтому очень важно понимать, что при использовании информационно-поисковых систем для нахождения информации в Интернете, поиск осуществляется не на реальном пространстве документов Сети, а в некоторой модели, содержание которой может значительно отличаться от действительного содержания Интернет в момент проведения поиска. По степени охвата индексируемых ресурсов поисковые системы можно разделить на две группы: международные и русскоязычные. Первые индексируют все опубликованные в Интернете документы подряд. Вторые индексируют ресурсы, расположенные в доменных зонах с преобладанием русского языка. Список наиболее популярных систем приведен в Табл. 1.

Табл. 1. Наиболее популярные поисковые системы

Примечание: Рунет – это русскоязычная часть Интернета, составляющая домены с именами ru и рф.

Необходимо упомянуть, что существует особая категория поисковых серверов – метапоисковые системы. Их принципиальное отличие от поисковых машин и предметных каталогов состоит в том, что у них отсутствует собственная индексная база данных, и поэтому они, получив запрос пользователя, перенаправляют его сразу к нескольким поисковым серверам (См. Рис. 3).

Рис. 3. Схема работы метапоисковой системы

Возможность одновременного использования нескольких поисковых серверов по одному запросу является очевидным преимуществом метапоисковых систем. В настоящее широкое применение время нашла система Metabot.ru, интерфейс которой представлен на Рис. 4. Эта система позволяет использовать для поиска ресурсов как международные, так и русскоязычные поисковые серверы.

Рис.4. Окно метапоисковой системы Metabot.ru

 

help.rgsu.net

Поиск информации в Интернете

Поиск информации в интернет

Общие сведения.

В настоящее время Интернет объединяет сотни миллионов серверов, на которых размещены миллиарды различных сайтов и отдельных файлов, содержащих различного рода информацию. Это гигантское хранилище информации. Существуют различные приемы поиска информации в Интернет.

Поиск по известному адресу. Необходимые адреса берутся из справочников. Зная адрес, достаточно ввести его в адресную строку Браузера.

Пример 1.

www.gov.ru — сервер органов государственной власти России.

Конструирование адреса пользователем. Зная систему формирования адреса в Интернет, можно при поискеWeb-сайтов конструировать адреса.

К ключевому слову (названию фирмы, предприятия, организации или простому английскому существительному) необходимо добавить домен тематический или географический, при этом необходимо подключать интуицию.

Пример 2.

Адреса коммерческих Web-страниц:

www.cnn.com (всемирные новости CNN),

www.sony.com (фирма SONY),

www.mtv.com (музыкальные новости MTV).

Пример 3.

Адреса учебных заведений:

www.ntu.edu (Национальный университет США).

Пример 4.

Адреса региональных серверов:

www.poland.net (Польша),

www.israil.net (Израиль).

Поисковые системы Интернет

Для поиска информации в Интернет разработаны специальные информационно-поисковые системы. Поисковые системы имеют обычный адрес и отображаются в виде Web-страницы, содержащей специальные средства для организации поиска (строку для поиска, тематический каталог, ссылки). Для вызова поисковой системы достаточно ввести ее адрес в адресную строку Браузера.

По способу организации информации информационно-поисковые системы делятся на два вида: классификационные (рубрикаторы) и словарные.

Рубрикаторы (классификаторы) — поисковые системы, в которых используется иерархическая (древовидная) организация информации. При поиске информации пользователь просматривает тематические рубрики, постепенно сужая поле поиска (например, если необходимо найти значение какого-то слова, то сначала в классификаторе нужно найти словарь, а затем уже в нем найти нужное слово).

Словарные поисковые системы — это мощные автоматические программно-аппаратные комплексы. С их помощью просматривается (сканируется) информация в Интернет. В специальные справочники-индексы заносятся данные о местонахождении той или иной информации. В ответ на запрос осуществляется поиск в соответствии со строкой запроса. В результате пользователю предлагаются те адреса (URL), на которых в момент сканирования найдены искомые слово или группа слов. Выбрав любой из предложенных адресов-ссылок, можно перейти к найденному документу. Большинство современных поисковых систем являются смешанными.

Наиболее известные и популярные системы поиска:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Существуют системы, специализирующиеся на поиске информационных ресурсов по различным направлениям.

Поиск людей в Интернет:

www.whowhere.ru ww. bigfoot.com

Поиск по телеконференциям (Usenet):

www.dejanews.com

Предметные поисковые системы:

www.webring.org

Поиск программного обеспечения:

www.files.com

www.files.ru

Поиск по файловым архивам:

http://ftpseach. city.ru, http://ftpsearch. licos.com

Каталоги (тематические подборки ссылок с аннотациями):

http://www.atrus.ru

www.aup.ru

Часто эффективный поиск информации можно провести с помощью региональных каталогов — специализированных серверов, содержащих данные о предприятиях или Web-ресурсах какого-то города или региона. Например, для Санкт-Петербурга такой каталог располагается по адресу http://www.spb.ru.

Список ИПС можно найти на сайте www.monk. newmail.ru

Более подробный перечень поисковых систем и каталогов представлен в табл. 3.2.

Правила выполнения запросов

В каждой поисковой системе в разделе Помощь (Help) можно получить сведения о том, как искать, как составить строку запроса. Ниже приведена информация о типовом, «усредненном» языке запросов.

Простой запрос.

Ввести одно слово, определяющее тему поиска. Например, в поисковой системе Rambler.ru достаточно ввести: автоматика.

Находятся документы, в которых встречаются слова, указанные в запросе. Распознаются все формы слов русского языка, как правило, регистр букв игнорируется.

В запросе можно использовать символ «*» или «?». Знаком «?» в ключевом слове заменяется один символ, на место которого может быть подставлена любая буква, а знаком «*» — последовательность символов.

Например, запрос автомат* позволит найти документы, включающие слова автоматический, автоматика и т.д.

Сложный запрос.

Часто возникает необходимость комбинирования ключевых слов для получения более определенной информации. В этом случае используются дополнительные слова-связки, функции, операторы, символы, комбинации операторов, разделенные скобками.

Например, запрос музыка & (beatles | битлз) означает, что пользователь ищет документы, содержащие слова музыка и beatles или музыка и битлз.

В табл.3.1 приведены правила формирования запросов, принятые в системе Апорт (http://www.aport.ru).

Таблица 3.1

Операторы для формирования запросов

Таблица 3.2

Список поисковых серверов и каталогов

Поиск информации в Интернете: подводные камни

Проблемы, не лежащие на поверхности, нередко дают о себе знать лишь «задним числом», после того как определенный этап поисковых работ завершен и, возможно, исходя из его результатов уже принято какое-либо решение. Что же мешает сделать ситуацию прозрачной с самого начала эксплуатации той или иной информационно-поисковой системы (ИПС)? Ответ довольно прост: отсутствие исчерпывающей информации подобного рода со стороны разработчика. Прямым следствием этого становятся недостоверность получаемых данных и их неконтролируемая потеря. Редко удается встретить в Сети поисковую систему, которая не обладала бы некоторыми «недокументированными» особенностями. Казалось бы — пользователю необходимо не так уж много сведений, а именно:

как происходит наполнение базы данных ИПС и каков ее объем;

полный спектр возможностей поискового языка системы;

основные особенности представления результатов поиска, прежде всего алгоритма ранжирования записей из списка отклика на поисковый запрос.

Увы, источником подобной информации обычно является не документ, доступный с головной страницы поискового сервера, а разбросанные по Сети, книгам и компьютерным журналам публикации отдельных авторов. К причинам такого положения дел, по-видимому, можно отнести не только небрежность разработчика, но и фактор, именуемый маркетинговой политикой. Проще говоря, предоставление поисковой системой наиболее полной информации о самой себе не всегда положительно сказывается на ее рейтинге. Тем не менее, взять ситуацию под контроль в ряде случаев пользователю оказывается вполне по силам. Выяснить особенности работы избранного поискового сервиса часто удается с помощью тестирования. Построение специальных тестовых запросов, быстро проясняющих именно тот аспект работы системы, который наиболее важен для текущей задачи, во многих случаях оказывается нетривиальным. Тому, как избежать некоторых неприятностей при работе с ИПС, мы и посвятим наше обсуждение. В качестве примеров, иллюстрирующих изложение, будут рассмотрены широко известные поисковые системы Интернета.

mirznanii.com

Поиск информации в сети Internet Поисковые системы

Поисковая система– это система, которая занимается сбором информации о ресурсах Internet и ее систематизацией для того, чтобы упростить пользователю доступ к интересующей его информации.

Поисковые системы обычно состоят из трех компонент:

  • агент (паук или кроулер), которая сканирует Internet и собирает информацию;

  • база данных, которая содержит собираемую информацию;

  • поисковый механизм и интерфейс для взаимодействия с базой данных.

Принципы определения соответствия запроса найденному документу (релевантности):

  1. Количество слов запроса в текстовом содержимом документа (т.е. в HTML-коде).

  2. Тэги, в которых эти слова располагаются (например, в <title>)

  3. Местоположение искомых слов в документе (например, в начале страницы).

  4. Время – как долго страница находится в базе поискового сервера.

  5. Индекс цитируемости – как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковой системы.

На запрос пользователя поисковая система формирует упорядоченный список документов в соответствии с перечисленными принципами.

Организация и проведение поиска информации в Internet

Метапоисковая информационно-поисковая система – поддерживающая поиск нескольких индексов поискового механизма одновременно

Главная задача информационно-поисковой системы – поиск информации, релевантной информационным потребностям пользователя.

Язык поисковых запросов – язык формирования запроса для информационно-поисковой системы. Поисковый запрос может состоять из одного или нескольких слов, в нем могут присутствовать знаки препинания. В общем случае, регистр написания поисковых слов и операторов значения не имеет, то есть дом и ДОМ, Not и nOt воспринимаются одинаково. Рассмотрим язык запросов на примере поисковой системы Rambler (www.rambler.ru).

Операторы. Запрос, состоящий из нескольких слов, может содержать операторы. Поиск операторов в документе не производится, они служат лишь инструкцией поисковой машине. Все операторы поисковой машины бинарные, то есть имеют левую и правую часть, каждая из которых также является запросом (по умолчанию состоящим из одного слова). Для изменения сферы действия операторов (группировки нескольких слов запроса в аргумент оператора) применяются скобки и кавычки.

Два запроса, соединенные оператором AND (логическое И) образуют сложный запрос, которому удовлетворяют только те документы, которые одновременно удовлетворяют обоим этим запросам. Иными словами, по запросу <собака AND кошка> найдутся только те документы, которые содержат и слово <собака>, и слово <кошка>.

Каждый из операторов имеет сокращенное обозначение.

Оператор

Сокращенное обозначение

AND

&

OR

|

NOT

!

Запрос из нескольких слов, перемежающихся операторами, будет истолкован в соответствии с их приоритетом. Операторы AND и NOT традиционно имеют более высокий приоритет, поэтому запрос из нескольких слов при обработке сначала группируется по операторам AND и NOT, и лишь потом по операторам OR. Изменить порядок группировки можно использованием скобок.

Кавычки. Для поиска цитат можно использовать двойные кавычки. Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они встретились в запросе.

Скобки. При построении запросов иногда возникает необходимость объединения слов запроса в группы, которые будут аргументами некоторого оператора. Такие группы заключаются в скобки. Часть запроса, заключенная в скобки, сама является запросом, и на нее распространяются правила языка построения запросов. Использование скобок позволяет строить вложенные запросы и передавать их операторам в качестве аргументов, а также перекрывать приоритеты операторов, принятые по умолчанию.

Метасимволы. Поддержка поиска строк с использованием метасимволов (‘*’, ‘?’), которые обычно используются в значении «любая подстрока» и «произвольный одиночный символ» соответственно.

Морфология. По каждому слову запроса поиск ведется с учетом правил словоизменения соответствующего языка. Поисковая машина понимает и различает слова русского и английского языков – по умолчанию, поиск ведется по всем формам слова.

Стоп-слова. Некоторые слова и символы по умолчанию исключаются из запроса в связи с их малой информативностью. Это так называемые “стоп-слова” – самые частотные слова русского и английского языков, например, предлоги, частицы и артикли.

Ограничение расстояния. Если запрос составлен из одного или нескольких слов без применения операторов и конструкций языка запросов, то будут найдены документы, в которых встречаются все слова запроса. При этом для каждого запроса всегда существует так называемое ограничение контекста – положительное число, по умолчанию равное расстоянию в сорок слов. Документ, в котором встретились все слова запроса, будет выдан только в том случае, если расстояние в словах между вхождениями слов запроса будет меньше этого числа. Например, по запросу <красная армия> будут найдены те документы, в которых слова <красная> и <армия> хотя бы один раз встретятся менее чем в сорока словах друг от друга. Запрос в данном случае может быть записан <(40, красная армия)>. Т.о., значение ограничения контекста можно изменять конструкцией <(число, запрос)>.

Расширенный поиск. Форма расширенного поиска дает возможность: задавать дополнительные параметры поиска; редактировать параметры поиска и поля, заданные по умолчанию; выбирать наиболее удобную форму показа результатов поиска.

При оперативном поиске, как и в большинстве попыток, вы получите лучшие результаты, когда потратите некоторое время на выработку стратегии.

Стратегия проведения поиска:

  1. Сформулировать понятие о том, что ищете (в письменной форме).

  2. Уточнить категорию информации (общая, специальная и др.)

  3. Определить тип искомого ресурса (web-сайт, ftp-архив, e-mail адрес, документ и др.)

  4. Сформировать список ключевых слов, синонимов и отношений между ними.

  5. Выбрать инструментальное средство поиска.

  6. Выбрать способ поиска в поисковой системе.

  7. Выбрать поисковую систему.

  8. Выполнить поиск.

  9. Просмотреть найденные ресурсы.

  10. Создать закладки избранного.

  11. Изменить элементы стратегии поиска при необходимости (например, вернитесь к пункту 5).

studfile.net

Урок+ПР «Поиск информации в интернет»

Урок «Поиск информации в Интернете»

Цель:

Освоить основные методы поиска в сети; знать способы представления информации в Интернете.

уметь ориентироваться в логических уровнях организации информации

Задачи:

Образовательная – формирование навыков поиска информации в сети Интернет;

Развивающая – развитие у учащихся умения ориентироваться в логических уровнях организации информации.

Воспитательная – воспитание у учащихся ответственности к делу, интереса к информатике.

Тип урока:

изучение нового материала.

Формы обучения:

Фронтальная, индивидуальная.

Методы обучения:

Словесный, наглядный, практический, частично-поисковый.

Оборудование:

  • Компьютер с выходом в Интернет, мультимедийный проектор, кабинет, оснащённый персональными компьютерами с выходом в Интернет из расчёта 1 ученик – 1 компьютер.

  • Презентация к уроку

Краткий план урока:

  1. Организационный момент, ТБ – 5 мин.

  2. Технологии поиска информации в сети Интернете – 30 мин.

  3. Решение задач по теме.

  4. Работа в группах по поиску информации в Интернет. Анализ поиска. – 15 мин.

  5. Сообщения от учащихся результатов поиска – 10 мин.

  6. Подведение итогов урока – 10 мин.

Ход урока

1. Организационный момент.

Учитель:

  1. Какие виды компьютерных сетей вам известны?

  2. Что такое Интернет?

  3. Какие программы для выхода в Интернет вам известны? Какое общее название у этих программ?

  4. Почему Интернет так популярен в сегодняшнем мире?

2. Изучение новой темы

Учитель:

Существуют три способа поиска информации в Интернете :

  1. Указание адреса страницы.

  2. Передвижение по гиперссылкам.

  3. Обращение к поисковой системе (поисковому серверу).

Остановимся на каждом из них:

Указание адреса страницы – это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Передвижение по ссылкам – Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.

Но этот способ очень простой и подходит для начинающего пользователя.

Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.

Здесь на помощь приходят специальные поисковые системы (их еще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернета популярны следующие поисковые серверы: Яндекс (yandex.ru), Google (google.ru), Rambler (rambler.ru) и некоторые другие.

Что же такое – поисковая система?

Во всемирной паутине Интернет находится несколько тысяч поисковых систем. У каждой системы свои достоинства и недостатки. Критерием выбора поисковой системы могут служить такие характеристики, как:

  • Принцип работы поисковой системы.

  • Удобство использования.

  • Сложность языка запросов.

  • Скорость работы.

Существуют 2 основных типа поисковых систем Интернет: индексные и классификационные (каталоговые).

Индексные поисковые системы, работая в автоматическом режиме обновления своей информации, просматривают в сети Интернет содержимое серверов, индексируют всю информацию, содержащуюся в них и вносят информацию о расположении слов на страницах сайтов в свои базы данных.

Каталоговые системы поиска содержат тематически структурированный каталог серверов и чаще всего пополняются вручную.

Основные понятия и характеристики результатов поиска.

Информационная потребность – сведения и данные, необходимые пользователю в данный момент.

Свойство релевантности – совокупность документов, которая соответствует запросу.

Полнота поиска – отражает отношение релевантных откликов к количеству всех возможных документов, удовлетворяющих информационную потребность потребителя.

Точность поиска – выражает отношение совокупности релевантных откликов, к количеству всех выданных документов.

А теперь давайте попробуем вывести правила поиска информации в сети Интернет?

  1. Учитывать особенности естественного языка.

  2. Не допускать орфографических ошибок.

  3. Избегать поиска по одному слову, использовать необходимый и достаточный набор слов.

  4. Не писать большими буквами.

  5. Исключать из поиска не нужные слова.

Понятие языка запросов.

! ИНФОРМАТИКА

(из поиска будут исключены слова Информатику, Информатике и т.д.)

+

Обязательное присутствие слов в найденных документах

УРОК по+пятница

(должны быть выбраны страницы, где встречаются слово не только УРОК) но обязательное условие наличие слова «пятница»

&

Обязательное вхождение слов в одно предложение

Информатика & ОГЭ

«»

Поиск устойчивых словосочетаний

«ОГЭ по информатике» (учитывается строгая последовательность слов, слово «система педагогическая» будет исключена)

А теперь ответим на несколько вопросов (Приложение 1, слайд11):

– Назовите основные способы поиска информации?

– Какие два вида поисковых машин вы знаете?

– Назовите наиболее популярные поисковые машины Интернета.

– Назовите правила поиска информации?

— Для чего используются языки запросов?

3. Решение задач по теме по материалам для подготовки к ЕГЭ.

4. Практическая деятельность за ПК:

  1. В каком году изобрели компьютерную мышь?

  2. Что означает термин «энтропия» с точки зрения теории информации?

После выполнения задания учащиеся сообщают результаты поиска информации.

В конце урока учитель подводит его итог, оценивает работу учащихся.

Учитель: Урок окончен. Спасибо за урок!

infourok.ru

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *