Как правильно искать информацию | Фоксфорд.Медиа
Если вам нужно написать доклад, подготовить проект или перевести текст, то первым делом вы будете искать нужную информацию в интернете. Это быстрее, чем идти в библиотеку и часами листать справочники и словари. Тем не менее даже за компьютером вы можете потратить время впустую, если ищите информацию бессистемно. Мы собрали самые эффективные приёмы поиска и делимся с вами.
Пользуйтесь обозначениями, которые конкретизируют поиск и зададут ему нужные параметры.
- Используйте кавычки, если ищете что-то конкретное. Например: «роман Анна Каренина».
- Если хотите исключить какое-то слово из поиска, то воспользуйтесь знаком «-» (минус). Например: «Анна Каренина -роман». Так вы найдёте много информации об Анне Аркадьевне, но не встретите ни слова про роман.
- Если вы поставите в строке поиска значок ~, то поисковик выдаст вам все ссылки на страницы с синонимами к искомому слову.
- Чтобы найти информацию на конкретном портале, добавьте в поисковую строку слово site. Например: «Как составить мотивационное письмо в вуз» site: foxford.ru.
- Также можно использовать кодировку других стран, если вам нужно найти информацию на национальных сайтах (fr — Франция, ht — Хорватия, kr — Корея и т.д).
Любой серьёзный ресурс позаботится о том, чтобы указать источники опубликованной информации (особенно если речь идёт о научных работах и исследованиях), а если ссылок нигде нет — стоит насторожиться. Если информация в двух разных местах кардинально различается, то лучше всего обратиться к первоисточнику или к авторитетному мнению эксперта.
Помимо Google и Яндекс существуют специальные научные поисковые системы, которыми пользуются исследователи: Google Scholar, Jurn, RefSeek. В них вы можете задать поиск по книгам, диссертациям, энциклопедиям, журналам и газетам. Это поможет сделать ваше исследование действительно глубоким, а подборку ссылок — исчерпывающей.
Полезный сервис, который поможет выполнить детализированный поиск по книжным источникам. Очень полезен для тех, кто пишет рефераты, научные статьи и готовится к выступлениям.
Рунет с годами становится всё удобнее, но информацию, представленную в нём, сложно назвать исчерпывающей. Поэтому почему желательно проверять себя и свои знания на хорошо известных зарубежных сайтах (архивы, электронные библиотеки, медицинские порталы типа PubMed). А вот Википедию лучше занести в список ненадёжных источников: в ней часто публикуют непроверенную и противоречивую информацию.
В кратком виде инструкция по поиску информации в интернете выглядит примерно так:
- Определитесь с предметом поиска, сформулируйте цель.
- Составьте чёткий поисковой запрос.
- Пользуйтесь разными поисковыми системами: что не нашёл Яндекс, обнаружит Google. И наоборот.
- Не забывайте о специальных символах, которые помогут уточнить детали поиска.
- Указывайте источники, из которых берёте информацию.
- Не расстраивайтесь, если поиск сразу же не дал результатов.
- Не забывайте о правилах безопасной работы в сети: не скачивайте файлы, если не уверены в надёжности сайта, на котором они расположены; никому не сообщайте свои данные и не платите за доступ к информации, если не уверены в надёжности сайта.
Как найти данные в интернете. Техника поиска информации
Для получения данных из интернета существует определенная техника. Если всё делать по ней, а не как придется, то поиск будет занимать совсем немного времени и приводить к нужному результату легко и безболезненно.
Конечно, всегда есть вероятность, что походящей информации в сети попросту нет, но если искать «по науке», то, как правило, что-то найти да получается.
Первое, с чем нужно разобраться, это где мы будем искать. Второй момент – правильное составление запроса. Но обо всем по порядку.
Где в интернете вся информация
Если в нашем обычном «реальном» мире вся текстовая информация находится, условно говоря, в книгах, то в интернете она размещена на сайтах. Этих самых сайтов в сети миллиарды на самые разные темы.
Для того чтобы в «реальном» мире бесплатно получить книгу, нужно отправиться в библиотеку. В интернете тоже есть подобные структуры, называются они поисковые системы.
Мы можем зайти в такую систему и напечатать что-то, что хотим найти. Если запрос составлен правильно, и у поисковика имеются данные по этому поводу, он нам их выдаст. То есть он найдет подходящие сайты, а если быть более точным, то отдельные страницы сайтов, которые, по его мнению, соответствуют запросу.
Какими поисковыми системами пользоваться
Лучше всего искать информацию через крупнейшие системы – Яндекс (yandex.ru) и Google (google.ru). Это лучшие поисковики из всех существующих. Яндекс – российский, Google – международный.
Я не буду сейчас рассказывать, как ими пользоваться – большинство и так это умеет. Поговорим лучше о том, в какой ситуации какая система предпочтительней.
В том случае, если вы не умеете пользоваться поисковиками, ознакомьтесь с уроком «Как и что можно найти в интернете».
Я бы рекомендовал следующее: когда вы ищете информацию на русском языке, то сначала попробуйте поискать ее через Яндекс. В русскоязычном интернете эта система более популярна и, как показывает опыт, лучше подходит для «нашего» человека.
Если Яндекс ничего подходящего не показал, то спрашивайте то же самое у Гугл. Сделать это можно прямо из Яндекса. Для этого нужно опуститься вниз страницы с неудачными результатами поиска до вот такой надписи:
Затем просто нажать на ссылку «Google», и в новом окне откроется поиск этого же запроса в Гугле.
В том случае, если вам нужно найти данные на английском или другом иностранном языке, рекомендую сразу идти в Гугл. Все-таки это международная поисковая система и по другим странам она ищет лучше.
Как сформулировать запрос
От того, как именно мы «спросим» у системы, будет зависеть получение или неполучение нужной информации. Результат-то поисковик нам выдаст в любом случае, но далеко не всегда тот, что мы хотели бы получить.
Многие думают, что умение правильно формулировать запрос приходит с опытом, который накапливается годами. Оно действительно так, но происходит это только из-за того, что человек просто начинает понимать (зачастую интуитивно), как работает поисковая система.
Нужно помнить, что любой поисковик – это машина. Можно назвать его и по-другому: программа, искусственный интеллект. То есть это не человек, а бездушная система. Она не понимает недосказанности, туманности формулировок, намеков и иронии. Хотя в последнее время технологии значительно улучшились.
Посмотрим на составление запроса глазами поисковой системы. Допустим, я открываю поисковик и в строке для печати запроса набираю слово «принтер». После этого нажимаю на кнопку поиска.
Система получает команду «перерыть» весь интернет и найти для меня информацию по принтеру. Но что именно мне нужно? Я хочу купить принтер или просто почитать про него? А, может, принтер у меня сломался, и я хочу найти мастерскую по ремонту? Или купить к нему расходные материалы (картриджи, чернила)?
Поисковик в замешательстве, поэтому старается предусмотреть все варианты. Вот какие результаты он мне показывает:
Как видите, здесь и статьи о принтере, и интернет-магазины, где их можно купить, и ремонтные мастерские и даже магазины по продаже картриджей.Допустим, мне нужно узнать информацию о конкретной модели принтера. Но ведь их тысячи – откуда поисковику знать, какая именно меня интересует?! Мысли ведь он читать не умеет…
Чтобы ему помочь, нужно точно напечатать, что именно необходимо найти. Не просто «принтер» — это очень широкое понятие, — а конкретную модель.
И результат не заставит себя должно ждать:
Значит, чтобы поисковик нас понял, нужно сформулировать запрос конкретнее. Но не перестараться – желательно не использовать лишних слов, иначе система может попросту «запутаться».
Пример. У меня перестало работать видео. Причем в самом компьютере оно работает, а в интернете – нет. Можно было бы напечатать следующий запрос: «Что делать если не работает видео». Но, во-первых, этот запрос неточный — ведь у меня с ним проблемы только в интернете. А, во-вторых, в нем много лишних слов.
Лучше напечатать следующее: «не работает видео в интернете».
Кстати, если при печати вы допустите грамматическую ошибку, скорее всего, поисковик ее автоматически исправит и покажет правильные результаты – без ошибки. Расставлять в запросе знаки препинания и использовать заглавные буквы тоже не требуется.
Уточнение запроса
Даже если пользователь все время помнит о том, что запросы должны быть точными и конкретными, «непонятки» с поисковиком все-таки случаются. В этом случае нужно просто уточнить запрос – допечатать слово или несколько слов. Тогда система поймет, что именно мы хотим, и покажет более подходящие результаты.
Пример. Я хочу почитать про фильм «Одержимость». Захожу в поисковик и печатаю соответствующий запрос:
Вроде все точно и конкретно, но результаты я получаю не те. Система действительно выдает мне данные о фильме и даже сайты, где его можно посмотреть. Но это совершенно не тот фильм, который нужен. Видимо, с таким названием их несколько.
Значит, нужно уточнить запрос. Для этого просто допечатываю, какую-то дополнительную информацию (год, страну, режиссера).
Что делать, если все равно выдает «не то»
Бывает так, что запрос хорошо составлен и уточнение к нему есть, но все равно результаты не устраивают. Либо информация не та, либо ее качество хромает.
Мы уже говорили, что в этом случае имеет смысл идти в другой поисковик. Но что делать, если и там такая же картина?!
Тогда следует переформулировать запрос — написать то же самое, но другими словами. А иногда лучше даже расширить его – сделать не таким точным.
Пример. Допустим, я пенсионер и хочу бесплатно через интернет освоить компьютер. Печатаю максимально точный запрос «бесплатные компьютерные курсы в интернете для пенсионеров».
Получаю результаты. Какие-то из них – это платные курсы для пенсионеров. Другие же – бесплатные, но выездные. А третьи – вообще непонятно что.
Значит, нужно просто переформулировать запрос. Например, вместо «компьютерные курсы» напечатать «обучение компьютеру».
А можно вообще попробовать его укоротить:
Выводы
- Русскоязычные запросы ищем сначала в Яндексе. Если не получилось, идем искать в Google (можно прямо из выдачи результатов yandex.ru).
- Запросы на английском и других иностранных языках ищем в Гугле.
- В том случае, когда мы хотим почитать о каком-то явлении, предмете или человеке «вообще», лучше напечатать общий запрос. Пример: принтер, дефолт, феллини.
- А если нужно узнать что-то определенное, стараемся более точно сформулировать запрос. Пример: устройство принтера, дефолт в россии 1998, феллини фильмография.
- Если результат не оправдал ожиданий, уточняем запрос. В том случае, когда и точный запрос не дает нужного результата, переформулируем его.
Автор: Илья Кривошеев
Как правильно осуществлять поиск в интернете?
Ежедневно пользователи сталкиваются с неудовлетворительными результатами веб-поиска, после чего опускают руки и уже не рассчитывают найти нужную информацию. Это происходит из-за недостатка знаний о том, как правильно использовать поисковые системы.
Поиск информации в интернете – как быстро находить именно то что нужно?
Не все понимают, что поисковая система – это инструмент, который нужно научиться правильно использовать, чтобы быстро находить в интернете любые необходимые данные. Для этого существует большое количество разнообразных хитростей, которые позволяют сделать процесс поиска максимально эффективным. Прийти к необходимому результату помогут банальные знаки препинания, а также некоторые команды на английском языке. Кроме того не стоит забывать о том, что помимо Google существуют и другие поисковые системы.
При поиске информации рекомендуется использовать как минимум две поисковые системы – Google и Яндекс, но чем больше, тем лучше. Дело в том, что у разных поисковиков страницы сайтов индексируются по-разному. В связи с этим даже самый простой запрос в разных поисковых системах может привести вас к разным результатам.
То, что не заметили алгоритмы одной поисковой системы, могут заметить алгоритмы другой, а то, что Яндекс покажет на 10 или 20 странице поисковой выдачи, в Google вполне может оказаться на первых позициях. Кроме того, разные поисковые системы по-разному реагируют на частоту употребления слов в предложении, на наличие или отсутствие знаков пунктуации, на порядок слов и так далее.
Многие сдаются после быстрого просмотра первых двух-трех позиций в поисковой выдаче, а зря. Так сложилось, что люди уверены в том, что только самая достоверная и качественная информация попадает в топ поисковой выдачи. В связи с этим компании платят большие деньги, чтобы их сайт занял первые позиции в поисковой выдаче.
Именно поэтому не нужно останавливаться на том, что вы нашли по первым двум-трем ссылкам. Не дайте себя обмануть, просмотрите еще несколько сайтов. Там может оказаться более актуальная и менее поверхностная информация.
Правильная формулировка запроса – одно из наиболее важных условий для эффективного поиска. К примеру, если поиск по слову «Москва» выдает 951 000 000 результатов, то поиск по запросу «Квартира в Москве» выдает уже 121 000 000 результатов, а по запросу «квартира в Москве недорого снять без посредников» поиск и вовсе выдаст 9 460 000 веб-страниц. Чем больше слов в запросе, тем меньше поисковая выдача.
На картинке, приведенной выше, можно увидеть, что последний поисковый запрос выдал всего 10 результатов, так как запрос сформулирован достаточно криво. Если написать «снять квартиру в Москве без посредников иностранцу посуточно недорого», то поисковая выдача будет состоять уже из 83 000 результатов, хотя смысл не поменялся, изменился лишь порядок слов в запросе.
К тому же, чем точнее и грамотнее составлен поисковый запрос, тем выше шанс того, что нужный вам сайт окажется на первых позициях поисковой выдачи. Уже прошли те времена, когда поисковые системы не различали заглавные и строчные буквы, орфографические ошибки вроде -тся и -ться, поэтому их можно игнорировать. Однако правильный порядок слов соблюдать действительно необходимо.
Не многие знают о том, что обычные знаки препинания могут облегчить процесс поиска и сделать поисковую выдачу максимально релевантной. Такие хитрости при поиске называют модификаторами, и вот некоторые из них:
- Кавычки. Если вы хотите найти конкретную фразу или слово, просто заключите свой поисковый запрос в кавычки. Благодаря этому поисковая система поймет, что слова нужно искать именно в том порядке и виде, в котором они написаны.
- Знак «-» позволяет искать и исключать из поиска определенные слова. Например, если вы введете в поисковую строку «Хокинг -Стивен», то поисковик выдаст вам информацию по слову «Хокинг» и при этом исключит из выдачи все сайты, связанные со Стивеном Хокингом. Знак «+» перед словом наоборот указывает поисковой системе на то, что оно является приоритетным.
- Если вы точно знаете, на каком сайте необходимо искать информацию – впишите его в поисковый запрос. Таким образом, можно значительно ускорить процесс поиска. Для этого в поисковом запросе используйте оператор «site:» (без кавычек) и после двоеточия укажите адрес необходимого интернет-ресурса.
- Если вам необходимо найти данные за определенный промежуток времени, используйте точки. Например, если вы хотите получить какую-либо информацию о ЕГЭ за определенный период, поисковый запрос нужно составлять следующим образом: «ЕГЭ 2018..2020».
- Можно искать все слова в тексте, но без кавычек. Например, если вы не можете вспомнить стихотворение или песню, но помните несколько слов, используйте команду «allintext:» (без кавычек) и укажите эти слова после двоеточия. Ниже приведен пример с поиском стихотворения.
К сожалению, далеко не вся информация, представленная в интернете, является достоверной. Интернет уже давно используется в качестве рекламной площадки, поэтому буквально на каждом шагу вам пытаются что-то продать или привлечь ваше внимание. Именно поэтому важно выбирать надежные источники информации и научиться объективно анализировать найденную информацию.
Перед тем, как приступить к изучению найденной информации, убедитесь, что на сайте содержатся данные из первоисточника. Также следите за тем, чтобы новость была свежая и актуальная. Если в статье приводятся какие-либо факты или цифры, достоверные источники всегда указывают на то, откуда взята эта информация. Если автор ссылается на какой-либо товар, услугу, на чей-то блог, аккаунт и т.д., важно вовремя задаться вопросом: «а не реклама ли это?».
Если у вас есть свой блог или информационный сайт, данная функция может вам пригодиться. Если вам интересно, ссылался ли кто-нибудь на ваш сайт или блог в своих статьях, вы можете узнать об этом с помощью цитирования. Для этого введите в поисковую строку команду «link:» (без кавычек) и после двоеточия укажите необходимый источник. К сожалению, данный модификатор не актуален для Яндекса.
Поиск в интернете может не дать желаемого результата, если вы не умеете его правильно использовать. Существует большое количество хитростей, освоить которые очень просто. Благодаря им можно находить в точности то, что нужно и тратить на поиск минимальное количество времени. Кроме того крайне важно разобраться в том, является ли найденная информация действительно достоверной.
Пожалуйста, опубликуйте свои мнения по текущей теме статьи. Мы очень благодарим вас за ваши комментарии, дизлайки, лайки, отклики, подписки!
Как эффективно искать информацию в интернете? 10 правил
Даже если сфера вашей деятельности напрямую не связана с поиском и обработкой информации, в быту вам все равно не обойтись без них. Самые простые на первый взгляд вещи – скажем, подбор необходимой бытовой техники или поиск редкого клипа любимого исполнителя – могут сопровождаться серьезными трудностями. Вроде бы все правильно написал в поисковой строке, ан нет, не находится! Между тем, есть простые приемы, которые позволяют искать нужные сведения в интернете быстрее и эффективнее. И даже если вы не начнете пользоваться всеми теми, о которых мы сегодня расскажем, все равно вам будет гораздо проще и легче заниматься интернет-серфингом – а ведь именно так и называется поиск информации во всемирной сети.Правильно составляйте поисковые запросы
Это – самый главный и самый эффективный прием при поиске информации в интернете. Поиск по одному слову выдаст несколько миллионов результатов, поиск по двум – уже на порядок меньше, а на запрос из, скажем, четырех или шести слов – всего несколько тысяч, а то и меньше. К тому же чем точнее и грамотнее составлен запрос, тем выше вероятность, что искомый результат обнаружится на первой странице. Кроме того, не забывайте о том, что поисковые системы не всегда могут исправить орфографические ошибки в запросах, а некоторые и за ошибки не считают (например, не видят разницы между –тся и –ться, которая может оказаться принципиальной для поиска). И не игнорируйте заглавные буквы, если не хотите разбираться с лишними результатами. Скажем, запрос по слову «лебедь» выдаст результаты и с информацией о птице, и с данными о покойном генерале Александре Лебеде, а «Лебедь» – в основном о генерале, хотя будут попадаться и упоминания о птице, если слово стояло в начале предложения.
Используйте как минимум две поисковые системы
У разных поисковиков несколько разные способы индексации страниц. Поэтому, как правило, даже самые простые поисковые запросы в разных системах приносят разные результаты. Во-первых, то, что не заметила одна поисковая система, может заметить другая – и наоборот. Во-вторых, некоторые результаты в одной системе окажутся на десятой или двадцатой странице, а в другой попадут в первую пятерку. Кроме того, разные поисковые системы по-разному реагируют на частоту употребления слов в запросе, на наличие или отсутствие заглавных букв, на расположение слов запроса в пределах одного документа и даже одного предложения.
Уточняйте географию запросов
Для жителей Москвы этот прием менее актуален, чем для всех остальных россиян. Дело в том, что поисковые системы, даже если и учитывают месторасположение компьютера, с которого вводится поисковый запрос, тем не менее, в первую очередь индексируют страницы с наибольшим числом обращений. А такие страницы, как правило, связаны с Москвой, где сосредоточено значительное количество интернет-пользователей, которые к тому же отличаются высокой активностью. Поэтому не надейтесь на то, что поисковая система помнит, где вы живете. Лучше просто добавить в поисковый запрос упоминание о своем городе или области.
Впрочем, и москвичам не стоит пренебрегать этим приемом. Столица велика, нужные услуги могут оказывать в любом ее месте. Невелико удовольствие раз за разом кликать на результаты поиска и выяснять, что фирма расположена в трех часах езды от дома или офиса. Зато даже простое упоминание района или ближайшей станции метро позволит вывести в первые строчки результатов именно те компании, которые находятся ближе всего.
Уточняйте предметную область запросов
В принципе, это то же самое правило, которое касается и географии. Банальное слово «шина» выдаст подавляющее большинство результатов, не имеющих никакого отношения к медицине. А если у пользователя даже автомобиля нет, зато ему завтра сдавать зачет по первой медицинской помощи? Тут-то и стоит вспомнить, что простое дополнение слова «медицина» к слову «шина» уже поможет исключить из результатов большинство автомобильных ссылок и вывести на первые страницы именно шины, которые накладывают в случае переломов.
То же касается и любых других предметных областей. Как правило, у поисковых систем есть встроенное меню, позволяющее уточнять, что ищет пользователь: картинки, видео, словарные статьи, перевод слова, новостные материалы по своему запросу и так далее. Но и пользователю не стоит лениться: слово «медицинская» к слову «шина» за него не подставит ни одна поисковая система.
Пользуйтесь расширенным поиском
Этот совет прямо следует из двух предыдущих, поскольку позволяет не придумывать самому уточняющие слова в запросы, а пользоваться уже разработанной для поиска именно в этой системе структурой. Пренебрегать ею не стоит: программисты поисковых сервисов куда как лучше большинства даже продвинутых пользователей знают, какими алгоритмами пользуются их продукты и как именно они ищут. Поэтому, вводя в поисковик те же «шины», попробуйте детальнее структурировать свой запрос с помощью расширенного поиска.
Просматривайте хотя бы первые десять страниц результатов
Почему стоит следовать этому правилу? Потому что на первых страницах будут не только самые релевантные, то есть точнее всего соответствующие запросу, результаты. Там будут результаты, найденные на самых популярных страницах. А это, как правило, страницы и порталы, которые содержат не самую точную, зато лучше всего соответствующую популярным поисковым запросам информацию. Простой пример: результаты поиска по одному-единственному слову в большинстве случаев будет начинаться со ссылки на соответствующую статью в Википедии. И хотя в настоящее время информация из свободной энциклопедии вызывает куда больше доверия, чем лет пять-семь назад, не стоит ограничиваться ею. А, допустим, ссылка на научную работу, детально описывающую именно то, что ищет пользователь, окажется на двенадцатой или двадцать пятой странице – просто потому, что к этому научному порталу обращаются в десятки или сотни раз реже, чем к Википедии.
Пользуйтесь функцией «Поиск в найденном»
Этот прием тоже позволяет сужать область поиска за счет уточнения, какие именно, например, шины ищет пользователь. Поиск в найденном поможет быстро устранить подавляющее большинство результатов из смежных или вовсе посторонних областей или из других географических регионов. Нужно только помнить, что и к поиску в найденном применимы все те же вышеперечисленные правила. Кроме того, поиск в найденном позволяет структурировать результаты поиска с учетом уже полученных ссылок и найденной информации, что повышает вероятность нахождения одной-единственной требуемой ссылки.
Переформулируйте запросы с учетом уже полученных результатов
Даже беглый просмотр полученных результатов поиска, как правило, показывает, что интересующий вас предмет или понятие разные люди ищут по-разному. Не пренебрегайте их опытом! Самый простой способ – обратить внимание на предлагаемые поисковой системой варианты запросов, когда вы только вводите их в поисковую строку. Даже если воспользоваться последовательно хотя бы пяти такими «автоматическими» вариантами, это уже позволит сделать поиск более эффективным. А если добавить к автоматическим вариантам свои собственные, уточняющие и корректирующие первоначальный запрос, то и подавно.
Используйте синонимы, ищите по официальным названиям и ключевым фразам
Прием, напоминающий поиск в найденном, но позволяющий не сузить, а уточнить поиск. Скажем, пользователь ищет информацию о предмете, который более известен под просторечным названием. Тогда, получив информацию о том, как на самом деле официально, а не в разговорной речи, называется объект поиска, можно задать новый, более точный поисковый запрос. Кстати, правило действует и в другую сторону: нередко оказывается, что гораздо больше информации можно найти о предмете, введя в поисковую строку его «народное» название или прозвище, информация о которых нашлась в результате первого запроса.
Используйте операторы поиска
Этот совет не случайно стоит последним: он годится скорее продвинутым пользователям и тем, кто в школе хорошо успевал по точным наукам. Поэтому мы даже не будем углубляться в подробное описание всех операторов поиска. Скажем только, что операторы поиска – это специальные знаки типа «+», «-», «~», «|» и так далее, подставляемые в текст запроса. Их использование позволяет включать и исключать из поиска конкретные слова из словосочетания, добиваться, чтобы поисковая машина искала словосочетание в пределах одного предложения или одного документа и так далее. А если читателю интересно побольше об этом узнать – он может ввести в поисковую строку словосочетание «операторы поиска», а потом воспользоваться всеми вышеприведенными советами. Результат гарантирован!
Как искать в Интернете? Способы быстро найти информацию в сети Интернет. Примеры, как правильно искать
В Интернете множество сайтов, однако не всегда информация на сайтах точна или актуальна. В статье я расскажу, как правильно искать информацию в Интернете, и поделюсь способами быстрого нахождения полезной информации. Но перед этим нужно разобраться, каким ресурсам в Интернете можно доверять.
Каким источникам в Интернете можно доверять?
Все ресурсы в сети можно разделить на достоверные и требующие проверки. Как правило, достоверная информация, которая готовится специалистами и проверяется до публикации, находится на следующих сайтах:
- Официальные сайты крупных компаний и государственных органов, либо ресурсы, официально поддерживаемые крупными компаниями и госорганами. Например, Минздав РФ создал и поддерживает сайт о здоровье www.takzdorovo.ru. На сайте указано, что информация перед публикацией проходит проверку специалистов. Как искать информацию в Интернете на специализированных сайтах, мы разберем ниже в статье.
- Корпоративные блоги компаний. Например, по теме ИТ можно искать информацию в официальных блогах ИТ-компаний, которые они ведут на сайте Хабрахабр. Там публикуется много полезной информации. Есть корпоративные блоги, которые находятся на самом сайте компании. Например, корпоративный блог Яндекса. Ниже в статье мы также разберем, как правильно искать информацию на определенных сайтах.
- Официальные сайты СМИ. На таких сайтах внизу будет размещена информация о регистрации сайта в качестве СМИ, указан номер свидетельства и дата регистрации. Перед публикацией информация в СМИ проверяется редакторами. Более того, по закону за достоверность размещаемой информации СМИ несут ответственность. Найти сайты СМИ можно, например, в каталоге Яндекса.
- Официальные каналы на YouTube. Например, компания Яндекс имеет канал Обучение рекламным технологиям, на котором публикует информацию по теме интернет-рекламы. Как правило, ссылки на официальные каналы можно найти на официальных сайтах компаний.
Из всех остальных источников информацию требуется проверять, поскольку вы не знаете, какой человек писал статью, каким опытом он обладает и может ли квалифицированно писать на ту или иную тему, проверял ли кто-то достоверность информации до публикации в Интернете или нет. Если вы напишете статью на основе недостоверных данных, вы можете ввести своих читателей в заблуждение.
Если сайт не относится к типам сайтов, описанных выше, рекомендуется проверить, кто ведет данный сайт и какую квалификацию имеет его автор:
- Посмотрите информацию об авторе сайта. Как правило, она имеется в разделе «Об авторе».
- Прочитайте информацию в разделе «О сайте». Посмотрите, как давно работает сайт, кому он принадлежит.
- Много качественной информации можно найти в блогах экспертов – людей, известных в профессиональной среде. Также много полезной информации можно найти в специализированных сообществах и социальных сетях. Однако информацию из сообществ всегда нужно проверять!
- Обращайте внимание на дату публикации найденной информации. Старые статьи могут терять актуальность.
Как быстро искать информацию в Интернете?
Способ 1. Поиск информации с ограничением по сайту
Данный способ работает в поисковых системах Яндекс и Google.
Например, вам нужно найти информацию о болях в позвоночнике. Мы знаем, что в сети есть сайт www.takzdorovo.ru, который ведут специалисты. Мы можем быстро найти информацию о болях в позвоночнике именно с этого сайта, добавив к запросу в поисковой системе конструкцию site:takzdorovo.ru.
Вот что мы нашли:
Вы видите, что оператор указал Яндексу, что информацию из запроса необходимо искать на конкретном сайте и в результатах поиска присутствуют ссылки на различные статьи о болях в позвоночнике с указанного нами сайта.
Способ 2. Ограничение по типу документов
Допустим, вам нужно найти типовой договор на оказание услуг, пример должностной инструкции или дипломную работу на определенную тему. Добавьте к своему запросу в поисковой системе оператор mime:pdf, и поиск будет вестись только по указанным вами документам (в примере – файлы PDF).
Пример поискового запроса, цель которого – найти типовой договор на оказание образовательных услуг:
Вы видите, что в результатах поиска выводятся документы PDF, которые, скорее всего, содержат примеры нужных нам договоров.
Оператор mime: работает и для других типов документов, например:
Оператор | Что можно искать |
mime:pdf | Ищет документы PDF. Позволяет найти типовые инструкции, договора, коммерческие предложения, иные документы. |
mime:doc | Ищет по документам MS Word, размещенным в сети Интернет. Помимо документов, позволяет находить рефераты, курсовые, дипломные работы, поскольку они часто оформлены в формате .doc. |
mime:ppt | Ищет по документам Power Point, размещенным в сети Интернет. Оператор полезен для поиска презентаций на нужную вам тему. |
mime:xls | Поиск по документам Excel, размещенным в сети Интернет. Позволяет находить полезные шаблоны в Excel. |
Способ 3. Конкретизация запроса
Старайтесь формулировать конкретные запросы в поисковую систему, состоящие минимум из 3-4 слов. Это позволит поисковой системе лучше понять, какая информация вам нужна, и выдать более точные результаты в поиске.
Пример правильного запроса для поиска статистической информации о доходах населения:
Способ 4. Использование специализированных поисковых систем
Например, для поиска по научным публикациям существует специализированная поисковая система Академия Google. Существуют и другие специализированные поисковые системы, в разных сферах. Их стоит находить и использовать для быстрого поиска нужной информации.
Например:
- На сайте Кинопоиска есть специализированный поиск по фильмам, который можно использовать для создания обзоров кино и поиска интересных для просмотра фильмов.
- На сайте Яндекс.Маркет можно искать информацию о технике. На карточке товара имеются отзывы, а также ссылки на обзоры техники. Это позволяет не только просмотреть технические параметры устройства, но и собрать информацию о сильных и слабых сторонах модели, с которыми сталкиваются потребители в процессе эксплуатации гаджета.
- В социальных сетях имеется встроенный поиск, который позволяет находить аккаунты знаменитостей и прочитать информацию о звездах.
- На сайте Википедии можно искать различную энциклопедическую информацию.
Способ 5. Поиск на английском языке
Не секрет, что объем информации в Интернете на английском языке значительно больше, чем на других языках. Если вы владеете английским, попробуйте задавать запросы в западные поисковые системы, в частности, Google или Yahoo.com, на английском языке. Вероятно, вы сможете найти больше информации по интересующей вас теме.
Способ 6. Использовать специализированные каталоги
Когда речь заходит о том, как правильно искать информацию в Интернете, мы обычно сразу вспоминаем про поисковые системы. Однако до их появления нужные сайты часто искали в каталогах. До настоящего времени ряд каталогов сохранили актуальность и могут помочь в поиске нужной информации.
Например, в каталоге Яндекса собраны полезные ресурсы по различным темам. В Интернете работает множество специализированных каталогов – например, каталоги компаний. Их тоже можно использовать для поиска нужной информации.
Разберем, как правильно искать информацию, на примерах
Допустим, вы – копирайтер, и пишете статьи для сайтов. Вам поручили подготовку материала на определенную тему, и вам нужно найти информацию для статьи. В таблице ниже даны примеры задач и способы поиска информации в Интернете для решения указанной проблемы.
Задача, поставленная клиентом | Как искать информацию в Интернете для статьи |
Написать обзор смартфона для интернет-магазина. |
|
Собрать статистическую информацию для реферата. |
|
Собрать информацию для статьи на научно-популярную тему. |
|
Написать обзорную статью для туристов, желающих поехать в Таиланд. |
|
Написать статью о выборе виртуального хостинга. |
|
Резюме
Мы разобрали, как правильно искать в Интернете быстро и просто. Вы узнали, каким источникам в сети можно доверять, а какую информацию стоит перепроверять. Изучили примеры поиска в зависимости от поставленной задачи.
Если у вас остались вопросы, пожалуйста, задавайте их в комментариях.
Рекомендуем
Если вам сложно писать тексты и подготовка статей отнимает уйму времени, посмотрите техники ниже. Они помогут писать тексты быстрее и лучше, а …
Написание и продажа статей – один из популярных способов заработка в сети. Все, что требуется для работы, можно освоить самостоятельно. Следуя …
10 способов поиска в Google, о которых не знает 96% людей / AdMe
В эру цифровых технологий и скоростного интернета можно узнать любую информацию. За несколько минут мы находим рецепты вкусного пирога или знакомимся с теорией корпускулярно-волнового дуализма.
Но зачастую нужную информацию приходится высеивать по крупицам и тратить на это не один час. AdMe.ru собрал для вас самые действенные способы, которые помогут отыскать драгоценные материалы за пару кликов.
1. Или то, или другое
Иногда мы точно не уверены, что правильно запомнили или услышали нужную информацию. Не беда! Просто введите несколько подходящих вариантов через значок “|” или английское «or», а затем выберите подходящий результат.
2. Поиск по синониму
Как известно, великий и могучий русский язык богат синонимами. И иногда это совсем не на руку. Если вам нужно быстро найти сайты по заданной теме, а не просто конкретную фразу — поставьте символ «~».
Например, результаты запроса «здоровая ~еда» помогут узнать принципы здорового питания, познакомят с полезными рецептами и продуктами, а также предложат посетить рестораны правильного питания.
3. Поиск внутри сайта
Бывает, прочитаешь интересную статью на сайте, а потом через время хочешь поделиться полезной информацией с друзьями или просто перечитать. Тогда на помощь приходит поиск внутри сайта. Для этого сначала вводим адрес сайта, а затем ключевые слова или фразу целиком.
4. Сила звездочки
Когда коварная память подводит нас и безнадежно теряет из фразы слова или цифры, на помощь приходит значок «*». Просто поставьте его на месте забытого фрагмента и получите нужные результаты.
5. Много пропущенных слов
А вот если из памяти выпало не одно слово, а половина фразы, попробуйте написать первое и последнее слово, а между ними — AROUND (примерное количество пропущенных слов). Например, вот так: «Я вас любил AROUND(7) не совсем».
6. Временные рамки
Иногда нам позарез нужно познакомиться с событиями, которые происходили в определенный промежуток времени. Для этого к основной фразе добавляем временные рамки, прописанные через многоточие. Например, мы хотим узнать, какие научные открытия были сделаны в период с 1900 по 2000 год.
7. Поиск по названию или ссылке
Для того, чтобы поисковик нашел ключевые слова в названии статьи — введите слово «intitle:» перед запросом без пробела, а для поиска слова в ссылке — «inurl:».
8. Похожие сайты
Если вы пришли в восторг от сайта и теперь хотите найти аналогичные — введите «related:» перед адресом сайта.
9. Фраза целиком
Самый простой и эффективный способ найти что-то конкретное и именно в таком порядке, как вы ввели, — заключить фразу в кавычки.
Например, если вы введете самый забавный текст — поисковик покажет результаты по запросу «самый», «забавный» и «текст» в любой последовательности.
Если же ввести «самый забавный текст» — будут показаны только те результаты, в которых есть все три слова именно в таком порядке. Этот способ отлично подходит, когда нужно найти текст песни, но мы знаем только фразу.
10. Ненужные термины
Чтобы исключить ненужный термин из поиска — достаточно поставить перед ним знак минус. Например, если мы хотим найти сайты о книгах, но не заинтересованы в их покупке — попробуйте исключить ненужный термин.
как эффективно искать информацию в интернете — Work.ua
Используйте в запросах специальные символы и слова, чтобы получить более точные результаты.
Казалось бы, найти информацию в Google проще простого. Вводишь нужное слово — поисковик выдает найденные результаты. Но, к сожалению, они не всегда оказываются полезными.
Чтобы сэкономить время и нервы, получить более точные данные, Work.ua рекомендует использовать в запросах операторы поиска — специальные символы и слова. Какие именно — читайте дальше.
1. «Собачка» для поиска в социальных сетях
Чтобы найти страницу определенного человека или бренда, например в Twitter или Facebook, перед запросом поставьте «собачку» @ и через пробел напишите нужную социальную сеть и искомое название.
Например:
2. Кавычки для поиска по точному совпадению
Вы хотите найти статью, фильм или книгу, вы помните их название. Тогда заключите целую фразу или слово в кавычки, и по точному совпадению слов Google найдет нужное.
Например:
3. Поиск забытых слов
Когда же вы все-таки забыли часть слова или фразы, напишите в поисковом запросе то, что помните, а на месте неизвестного поставьте звездочку *.
Например:
4. # для поиска по хештегу
Найти записи на определенную тему в Google можно с помощью хештега. Естественно, среди тех записей, у которых этот хештег есть и вы знаете точное его название.
5. Убираем слово из поискового запроса с помощью минуса
Чтобы исключить лишнюю информацию в результатах, можно запретить поисковику искать определенные слова. Как это сделать? После ввода запроса напишите слова, которые вас не интересуют, и перед каждым поставьте минус без пробела. Это может быть и одно слово.
Например:
6. OR для объединенного поиска
Если за один запрос вам нужно найти информацию по нескольким критериям, добавьте оператор OR* между словами поискового запроса. К примеру, по запросу собеседование OR интервью будут найдены документы, которые содержат слово или собеседование, или интервью.
*OR с английского или.
Например:
7. Поиск на определенном сайте
Лайфхак для поиска на тех порталах, где, собственно, нет функции поиска. Добавьте оператор site: перед названием сайта и вы сможете находить информацию именно на этом ресурсе, а не на других источниках в интернете. Адрес нужно указывать полностью и без пробелов.
Например:
8. Поиск по типу файлов
Для поиска данных в определенном формате — книги, изображения, видео — введите это слово в поисковый запрос, затем оператор filetype: и без пробела формат файла png, fb2, mp4.
Например:
Еще 2 подсказки
- Google Поиск обычно не учитывает знаки препинания, которые относятся к операторам поиска.
- Используйте инструменты поиска, чтобы находить картинки, новости, видео, карты.
Здесь же вы можете настроить размер изображения, которое ищете, длительность видео, отфильтровать свежие новости, что сделает поиск максимально эффективно.
Читайте также: 7 полезных приложений для саморазвития и личной эффективности
Чтобы оставить комментарий, нужно войти.
10 советов по поиску информации в Интернете
Наши 10 советов по поиску информации в Интернете от экспертов eMazzanti.
Иногда поиск быстрой информации в сети похож на поиск иголки в стоге сена. С таким количеством миллиардов веб-страниц в киберпространстве поиск конкретной информации может оказаться непростой задачей. «Часто, когда я использую поисковые системы, я получаю так много нерелевантных результатов, что просто сдаюсь», — признается разочарованная Лоррейн Адамс, мать двоих детей и консультант по инвалидности.
Возможно, Адамс не знает, что есть способы получить больше от вашей любимой поисковой системы, будь то Live Search, Google или Yahoo !. Несколько советов, приемов, хитростей и приемов поиска помогут вам быстро и легко найти то, что вы ищете в киберпространстве. Следуйте этим 10 предложениям в своей любимой поисковой системе.
10 советов по поиску нужной информации
1. Используйте поле расширенного поиска
Почти все поисковые системы имеют область «расширенного поиска», которая предоставляет пользователям сети более конкретные параметры.Здесь вы можете выполнять поиск по дате обновления, искать веб-сайты с определенным доменом, например «.net», или находить веб-сайты на предпочтительном языке.
2. Выполните поиск по фразе
Чтобы лучше помочь поисковой системе найти то, что вы ищете, предложите последовательность слов в определенном порядке, заключив фразу в кавычки. Например, если вы ищете информацию о телешоу «Субботний вечер в прямом эфире», введите «Субботним вечером в прямом эфире» в окно поиска. Без кавычек на каждом конце поисковая машина, скорее всего, будет искать веб-сайты, содержащие любое из слов по отдельности: суббота, ночь и прямая трансляция.
3. Будьте конкретны
Если общие поисковые слова, такие как объявления автомобилей, дают слишком много результатов, попробуйте более конкретные слова, такие как объявления подержанных автомобилей, объявления Mercedes или объявления автомобилей Лондона.
4. Используйте альтернативные поисковые слова
Если ваши ключевые слова не дают желаемых результатов, попробуйте синонимы. Используйте тезаурус, например Интерактивный тезаурус Роджера или Merriam-Webster OnLine, чтобы найти альтернативные слова для поиска. В конце концов, собака — это также собака, дворняга, дворняга, гончая, домашнее животное и лучший друг человека!
5.Вставьте знак плюс или минус
Этот прием обычно работает в большинстве поисковых систем. Поставьте знак плюса (+) перед словом, которое должно быть найдено в окне поиска. Например, путеводители по городам + Нью-Йорк помогут сузить поиск путеводителей по городам только для Нью-Йорка. Аналогичным образом поставьте знак минус (-) перед словом, которое не должно отображаться в результатах поиска. Ввод python -Monty позволит вам получить результаты для змей, а не для британской комедийной труппы.
6.Просто выполните поиск по доменному имени
Если вы знаете веб-сайт, на котором хотите выполнить поиск, но не уверены, где находится информация на этом сайте, вы можете указать своей поисковой системе выполнять поиск только в этом домене. Введите то, что вы ищете, в поле поиска, затем слово «сайт» и двоеточие, а затем имя домена. Например, чтобы найти информацию о поступлении в Университет Торонто, введите это: сайт приема: www.utoronto.ca.
7. Изучите «лучшие из» сайтов
Если вам нужно качество, а не количество, несколько поисковых систем предоставляют доступ к тщательно подобранным сайтам «Лучшее из Интернета».Один из примеров — About.com.
8. Удалите неприемлемый контент
Если вы предпочитаете, чтобы в результаты поиска не включались сайты для взрослых, активируйте SafeSearch на странице настроек Live Search или на странице расширенного поиска Google. Хотя эта функция не является стопроцентной, она удаляет из результатов поиска сайты, содержащие откровенно сексуальный контент.
9. Экономьте время с помощью панели инструментов поиска
Если вы много ищете в Интернете, подумайте о загрузке бесплатной панели инструментов Windows Live или панели инструментов Google, которые всегда находятся в верхней части окна браузера Internet Explorer.Таким образом, вам не нужно покидать веб-сайт, на котором вы находитесь, чтобы ввести новый запрос.
10. Специализируйте свою поисковую систему
И наконец, имейте в виду, что существует множество специализированных поисковых систем. Live Search, например, имеет Live Search Images для поиска изображений, MSN Shopping для веб-сайтов, связанных с покупками, и MSN News для опубликованных новостных статей со всего мира. Еще много специализированных поисковых систем можно найти на Search Engine Watch.
Мы поможем вам применить технические советы
eMazzanti Technologies имеет команду экспертов, готовых помочь вам внедрить эти технические советы на новый год в вашу организацию.Итак, прекратите сокращать 2020, и мы поможем вам с остальным. От ужесточения вашей стратегии безопасности и конфиденциальности до обновления дизайна вашего веб-сайта и цифрового маркетинга — мы вам поможем.
Статья о поиске информации, написанная Марком Зальцманом и адаптированная из оригинальной статьи из Microsoft Home Magazine.
Как найти то, что вы хотите в Интернете
Это руководство было создано Simplifydigital — экспертами в области широкополосного доступа в Интернет, телевидения и домашних телефонов.
С развитием Интернета и постоянно расширяющимся массивом знаний, которые можно найти в Интернете, поисковая технология должна была идти в ногу с растущими требованиями, предъявляемыми к ней. То, что начиналось как простой механизм поиска информации, подобный тем, которые использовались в течение многих лет в сочетании с компьютерными базами данных, должно было быстро превратиться в сложный инструмент, охватывающий все уголки Всемирной паутины.
В настоящее время поисковые системы — это большой бизнес, и компании осознают, что для достижения успеха их сайты должны занимать как можно более высокие позиции в реестре поисковых систем.Компании, занимающиеся поисковыми системами, также контролируют эти списки, ведя постоянную борьбу с зараженными вредоносными вирусами или пустыми сайтами, стремящимися соблазнить, заманить в ловушку или использовать ничего не подозревающих пользователей Интернета.
Как работают поисковые системы?
Поисковые системы работают, сопоставляя введенные слова со страницами в Интернете. Если вы введете в поисковую систему лошадиные скачки Sandown , система будет использовать свой искусственный интеллект, чтобы открыть вам страницы, соответствующие скачкам в Сандауне. Он также может анализировать введенные вами слова и предоставлять вам похожие страницы, связанные с интересами, которые, по его мнению, у вас есть.
Итак, поисковые системы могут быть самонадеянными мелочами, но они невероятно полезны. Без них огромное количество веб-страниц, которыми пренебрегали их владельцы, были бы брошены на произвол судьбы и просто потерялись в холодных, темных досягаемости киберпространства.
Поисковые системы, такие как Google, Yahoo, Ask Jeeves и Bing, стали нарицательными, а первые даже стали часто употребляемым глаголом. Припев «просто погуглите» сейчас используется в повседневной жизни во всем мире.
Выбор правильных ключевых слов
Первый шаг к эффективному использованию поисковой системы — это определение ваших ключевых слов.Ключевые слова всегда основаны на определенных существительных или глаголах, например велосипед или лыжи . Не загромождайте поиск расплывчатыми словами, такими как и, если, или, до и т. Д., Поскольку они запутают поисковую систему и, следовательно, потребуется больше времени для получения результатов. Часто поисковая система вообще не учитывает такие слова и любые повторяющиеся слова.
Помните, что ключевые слова не должны быть слишком расплывчатыми. Общие ключевые слова стали использоваться слишком часто и почти бесполезны; вместо этого уточните свои ключевые слова, чтобы они привели вас прямо к тому, что вы хотите.Например, поиск микроавтобусов или минивэнов приведет вас к спискам страниц, перемежающихся информацией о скейтбординговых компаниях и голландских футболистах, а поиск легких коммерческих автомобилей не вызовет такой путаницы.
Отфильтруйте результаты
Вы можете уточнить свой поиск, если точно знаете, какой тип результатов ищете. Большинство поисковых систем имеют инструмент уточнения, который позволяет вам искать изображения, видео или другой контент, относящийся к вашему поиску.
Оптимизируйте поиск
У Google есть и другие хитрости в рукаве, которые помогут вам получить необходимую информацию.
Google стал настолько умным, что иногда вам даже не нужно покидать сайт Google, чтобы найти то, что вам нужно. Использование таких ключевых слов, как население или безработица , вместе с названием рассматриваемой нации приведет к появлению общедоступной диаграммы данных, которая предоставит вам подробную, с точностью до минуты, информацию, имеющую отношение к вашему поиску.Такие предметы могут быть невероятно полезны для случайных исследований или для профессиональных проектов. Поисковые запросы по времени, погоде, ценам на акции или спортивным результатам часто обслуживаются непосредственно самими поисковыми системами.
На более простом уровне введите сумму в Google и наблюдайте, как калькулятор Google ответит на нее за вас. Введите 100 фунтов стерлингов в норвежских кронах в строку поиска, и Google рассчитает конвертацию в норвежские кроны. Возможности применения опыта Google безграничны.
Использование операторов для получения более точных результатов
Использование определенных символов в поиске устраняет любую двусмысленность, обеспечивая более точный поиск.Кавычки — это самый простой способ сделать это, поэтому мы начнем с них.
Кавычки с точным соответствием
Если вы наберете такую фразу, как: Я начал с омраченного детства и прошел через те робкие дни до тяжелого времени, когда моя тетя лежала мертвой в поисковой системе, машина будет искать каждое слово индивидуально и выводить результаты например, «личные заявления о лекарствах» на сайте studential.com, которые могут содержать все вышеперечисленные слова, но не содержат релевантной информации, которую вы искали.
Добавление кавычек в начало и конец фразы сообщает поисковой системе, что она ищет целую фразу, а не расширяет сеть в поисках отдельных слов. Это упростит ваши результаты и даст вам только те ответы, которые вам нужны. Вы узнаете, что эта фраза является цитатой из 458 -й страницы «Холодного дома» Чарльза Диккенса, но вы также можете найти другую интересную информацию; например, случаи, когда люди цитируют фразу в Твиттере или пишут о ней в блогах.Подобная оптимизация поиска окажется очень полезной для разъяснения информации, которая на первый взгляд может показаться неясной.
Логические операторы
Логические операторы (наиболее полезными являются OR и NOT / -) имеют более сложные функции, но могут быть чрезвычайно полезны, если вы точно знаете, что ищете. Эти устройства позволяют поисковым системам делать выводы на основе того, что вам нужно, а не просто находить слова, которые вы набрали.
Например, если вы ищете информацию о морских свинках, а не о кроликах, вы, вероятно, будете знать, что ваш поиск будет затруднен сайтами, предлагающими информацию о последних.В параметрах расширенного поиска в вашей поисковой системе введите морских свинок – кроликов и щелкните поиск (не забудьте поставить знак минус непосредственно перед словом, которое вы хотите исключить). Это улучшит ваш поиск и удалит все упоминания кроликов с найденных вами страниц.
Если вы не совсем уверены, к какой нише относится искомая информация, вы можете использовать оператор ИЛИ. Введите джаз ИЛИ блюз , и поисковые системы вернут страницы для любого термина.Помните, что оператор ИЛИ всегда расширяет область поиска.
Надеюсь, эти советы были вам полезны, и вы готовы использовать их в своем следующем веб-поиске. Приятного просмотра!
Это руководство было создано Simplifydigital — экспертами по широкополосному доступу, телевидению и домашним телефонам. В нем содержатся руководства для потребителей и информация о ценах, чтобы помочь потребителям найти лучшие предложения на свои цифровые услуги. Для получения дополнительной информации посетите сайт simpleifydigital.co.uk или позвоните по телефону 0800 542 4704.
.Как найти надежную информацию в Интернете
Можете ли вы найти надежную информацию в Интернете?
Найти достоверную информацию в Интернете может быть непросто.Там так много всего, что трудно понять, чему можно верить и чему доверять. Кроме того, очень легко создать и опубликовать веб-сайт, который кажется подлинным и профессиональным, всего лишь менее чем за 100 долларов США и несколько щелчков мышью.
К сожалению, неспособность отличить фальшивку от реальной может вызвать несколько проблем, таких как принятие неправильных решений (опасных) и смущение перед вашим классом, вашим начальником или вашими друзьями. Итак, вот как вы можете этого избежать, научившись различать надежные источники, доступные в Интернете.
Поиск в Google Scholar
Если вы опасаетесь использовать ненадежный источник в своей академической статье, вам следует убедиться, что вы используете только академические источники. И лучший способ найти их — использовать Google Scholar.
Google Scholar позволяет искать бесплатные и платные полнотекстовые статьи и книги от академических издательств, университетов и депозитариев. Эта услуга бесплатна и предоставит вам как печатные, так и цифровые источники. В нем будут перечислены цитаты и даны ссылки на рецензируемые научные журналы, рефераты, технические отчеты и многое другое.
Просто имейте в виду, что Google использует алгоритм для ранжирования своих результатов, который в основном основан на количестве цитирований. Так что продолжайте проверять ссылки, если вы ищете совершенно новые исследования.
Проверить учетные данные автора
Кто пишет статью, которую вы читаете? Проверка этой информации — отличный способ узнать, надежна ли информация, которую вы получаете.
В Интернете есть несколько людей, говорящих о вещах, которые они сами с трудом понимают.И хотя эти сообщения, чтобы помочь вам придумывать новые идеи, — это нормально, вам не следует ставить на них свою жизнь.
Так что проверьте автора текста, который вы читаете, и погуглите. Посмотрите, что они писали раньше, являются ли они людьми, которые сами добились своего, или какие у них есть полномочия.
Посмотрите, есть ли у них веб-сайт, учетная запись в Twitter или профиль LinkedIn. Вся эта информация станет очень актуальной, если вы попытаетесь выяснить их авторитет как писателя.
Посмотрите статистику
Информация, которая вам нужна, может быть основана на статистике, но ее нет в статье, которую вы читаете? Затем вам следует включить будильник.
Конечно, по некоторым темам нет необходимости полагаться на данные, но статьи, содержащие слишком много общих идей и не содержащие реальных примеров, не должны приниматься во внимание для серьезных целей.
Вы также можете сами найти нужные вам данные и посмотреть, соответствуют ли они тому, что вам говорит автор. Если нет, просто игнорируйте это и относитесь к этому как к развлечению.
Оцените сам веб-сайт
Многие веб-сайты предлагают ценный контент без упоминания автора.Итак, как вы можете быть уверены в том, что они говорят? В этом случае вам необходимо оценить сам веб-сайт и компанию, стоящую за ним.
Отметьте поля для комментариев и посмотрите, много ли людей не согласны с тем, что они говорят. Изучите их отзывы и проверьте их оценки. Найдите их страницу «О нас» и узнайте, какова их основная цель и кто их команда экспертов. Эта информация поможет вам узнать, насколько они знают, о чем идет речь.
Проверьте, что они продают
Ни один онлайн-бизнес не выживает бесплатно.Чтобы веб-сайт стал актуальным и надежным, он стоит денег. То есть вы должны давать им какую-то финансовую отдачу.
Здесь говорится о том, что вы всегда должны пытаться выяснить, как источник, о котором идет речь, зарабатывает деньги, чтобы вы могли судить о качестве предоставленной информации. Например, веб-сайт, который зарабатывает деньги на продаже iPhone, вряд ли будет плохо отзываться об Apple и может даже не рассказать вам обо всех преимуществах устройства Android.
Так что ищите источники, которые с большей вероятностью предоставят вам объективную информацию о том, что вы хотите, например веб-сайты, которые поддерживают себя продажей книг или продуктов, не связанных с тем, что они пишут.
Перейти к первоисточникам
Если вы хотите быть уверенным, что получаете реальные факты, вам нужно обратиться к первоисточникам. Поскольку у нас не так много времени, чтобы что-то проверять, мы склонны полагаться на тщательно подобранный контент и верить в то, что они говорят нам делать.
Но если вы имеете дело с чем-то деликатным, с чем-то, что доставляет вам неприятности, вам следует отдавать приоритет первоисточникам.Так что, если вы хотите узнать больше об одном продукте, проверьте их веб-сайт и, например, прочитайте отзывы людей, которые его действительно используют. Таким образом, вы не получите лишь небольшую часть информации или конкретную точку зрения от человека, который давал вам лишь обзор нескольких продуктов.
Итог
Приведенные выше предложения — это все, что вам нужно, чтобы начать поиск надежной и достоверной информации в Интернете. Они могут означать, что вам нужно будет потратить некоторое время на проверку того, что вы читаете, но это цена, которую нужно заплатить вначале.
Но, как только вы разберетесь с вашими любимыми источниками, вам не нужно будет делать это снова и снова. Так что не торопитесь, проверяя, что вы найдете в Интернете, и избегайте любых проблем, вызванных плохо изученными статьями в будущем.
Когда-то саморазвитие помогло Рику в его жизни и привело к большим результатам. В настоящее время Рик является профессиональным блоггером и копирайтером журнала Top Writers Review, и он хочет поделиться своим опытом с другими в своих статьях. Вы можете узнать больше о том, как дисциплина и самодостаточность могут сделать вас успешным, подписавшись на Рика в Twitter.
Связанные13 веб-сайтов для поиска людей в Интернете
В эпоху бурного роста социальных сетей найти потерянных друзей и коллег легче, чем когда-либо прежде. Вчерашний частный мир превратился в онлайн-мир. Каждый, у кого есть поисковая система, имеет открытый доступ к социальным сетям, правительственным базам данных и общедоступным записям.
Если вы ищете давно потерянного друга или, возможно, хотите проверить кого-нибудь, рассмотрите следующие бесплатные ресурсы, чтобы найти людей в Интернете.
Как бесплатно искать людей в Интернете
Интернет — это, по сути, гигантская база данных, переполненная точками данных о людях. Сегодня трудно найти кого-либо, кто не прокомментировал запись в блоге, не разместил сообщение на онлайн-форуме или не зарегистрировался на Facebook или Flickr.
Разные сайты используют эту информацию по-разному. Хотя следующие 13 сайтов можно использовать для поиска людей в сети, они могут получать данные из разных источников.В результате результаты могут отличаться.
Прежде чем начать, узнайте несколько подробностей о человеке. Начните с их дня рождения или штата, в котором они живут. Если у вас есть эти подробности, объем информации, которую вы можете найти в Интернете о человеке, просто поразителен. На самом деле, иногда это может оказаться непосильным.
При поиске людей в Интернете обязательно используйте несколько поисковых систем для достижения наилучших результатов.
Есть много веб-сайтов, которые ищут в стандартных социальных сетях, таких как Facebook или Twitter. Но Pipl — это один из ресурсов, который проводит глубокий поиск имени на «нестандартных сайтах». Результаты поиска Pipl впечатляют.
Pipl прилагает большие усилия, чтобы раскрыть адреса, номера телефонов и даже членов семьи, скопированные с разных веб-сайтов.
Раньше приложение было бесплатным, но теперь вам нужно оформить подписку.Действительно, приложение теперь нацелено на компании, которые хотят проводить проверку личности и расследования, а не на отдельных пользователей.
Вероятно, самый мощный инструмент для поиска тех, кто давно уже пользовался Интернетом, — это группы Google. Группы Google включили в свою базу данных более 800 миллионов сообщений Usenet, впечатляющий архив интернет-разговоров, начиная с 1981 года.
Например, если человек, которого вы ищете, посещал университет в это время, вы можете найти его след.Каналы Usenet были популярным способом выхода в Интернет до его бурного роста в конце 1990-х годов. Университеты, исследовательские центры, технологические компании и другие организации полагались на Usenet для сотрудничества и многого другого.
Вы можете не только найти того, кого ищете, но и получить представление об их мыслях, идеях и мотивах того времени.
Помните: если вы беспокоитесь о том, что люди найдут о вас старую информацию, есть способы узнать, кто отслеживает вас в Интернете.
Служба «100% бесплатный поиск людей» True People Search дает хорошие результаты. Но это зависит от того, где вы живете.
Для читателей из США это отличный инструмент, и, просто выполнив поиск по имени и стране проживания, вы найдете удивительно подробные результаты. Вы также должны получить хорошие результаты для жителей Канады. True People Search обычно возвращает список предыдущих адресов вместе с номерами телефонов.
Также обратите внимание на раздел «Возможные партнеры». Полезно для правоохранительных органов и частных лиц, здесь отображаются имена бывших соседей по комнате в колледже, коллег и т. Д. Без сомнения, это надежная информация, взятая из общедоступной информации Facebook.
Как и True People Search, Find People Search генерирует базовую «тизерную» информацию для проверки биографических данных. Тем не менее, эта информация может быть чрезвычайно полезной, когда вы пытаетесь узнать о ком-то больше.Что этот веб-сайт привносит в игру, так это то, что он предлагает более обширную информацию, чем другие.
Однако, опять же, как и True People Search, этот сайт не предлагает результатов за пределами Северной Америки. Но то, что он делает, делает хорошо. Например, после выбора вероятного кандидата поиск людей выдает карту с вероятным местоположением вашего карьера.
Здесь также может быть указана информация о семье, в зависимости от того, какие данные были собраны для человека.Здесь вы можете найти важную семейную связь, такую как брат, сестра или даже тетя, дядя или двоюродный брат.
В то время как большинство поисковых систем просматривают общедоступную информацию, PeekYou.com делает все возможное, чтобы копаться на популярных социальных сайтах, таких как Pinterest, LinkedIn, Instagram и других.
Результаты всегда впечатляют, хотя могут быть несколько искажены.Например, поиск моих собственных записей смешал данные обо мне с записями других людей с похожими именами. Кроме того, PeekYou дал мне новый инициал в середине, что, безусловно, удивило!
Как и в случае со всеми этими сайтами, имейте в виду, что собранные данные могут быть неточными. Это может быть связано с ошибками в исходных данных или ошибками при сопоставлении имен.
Иногда для отслеживания кого-то требуется немного больше творчества, чем просто ввод имени в поисковую систему.Другой подход — порыться на популярном веб-сайте, посвященном воссоединению средней школы Classmates.com.
Очевидно, вам нужно будет иметь некоторое представление о средней школе (ах), которую посещал этот человек. В случае успеха вы найдете список людей, которые зарегистрировались на сайте в той же средней школе.
Начните с выбора школы по штату и городу, а затем введите имя учащегося, которого нужно найти. На сайте зарегистрировано много людей, поэтому у вас должны быть хорошие шансы найти того, кого вы ищете.
Обратите внимание, что это веб-сайт только для США.
Для поиска людей можно использовать различные генеалогические сайты, хотя процесс немного отличается.
Что касается генеалогических записей, информация может быть ограничена для людей, которые еще живы. Это будет зависеть от законов о конфиденциальности данных и политики генеалогического сайта. Таким образом, хотя может быть полезно установить семейные связи с тем, кого вы ищете, информация будет скудной.
На странице результатов будет отображаться адресная информация и возможные родственники, а платная справочная информация также может быть получена с помощью PeopleFinders.
FamilyTreeNow — хороший вариант для генеалогического исследования. Интересуетесь семейной историей? Ознакомьтесь с нашим загружаемым руководством о том, как исследовать свое генеалогическое древо в Интернете.
Хотите разыскать кого-то, а у вас есть только его фотография? Используйте инструмент обратного поиска изображений, например TinEye.com. Этот сайт перевернет весь Интернет наизнанку для той же фотографии, и он покажет вам, была ли она загружена где-нибудь еще.
На сайте используется инновационная технология распознавания изображений, которая может сопоставлять изображения на основе того, которое вы загружаете на сайт. Это впечатляющая технология, и она сработала в первый раз, когда я попробовал ее, сразу определив, что я загрузил это же изображение в MakeUseOf. И он даже распознал изображение, когда только часть изображения совпала с оригиналом.Очень впечатляющий материал.
Другой вариант обратного поиска изображений — это поиск картинок Google.
Google также является эффективным инструментом для поиска людей в Интернете. Прежде чем пробовать, помните следующие советы.
- Заключите полное имя человека в кавычки (например, «Дэвид Ли Рот»). Google будет возвращать только результаты поиска с полным именем человека.
- Включите дополнительную информацию, которую вы уже знаете о человеке (например, экс-вокалист Van Halen «Сэмми Хагар»).Ваши результаты поиска будут еще точнее.
- Если человек связан с определенной организацией, попробуйте выполнить поиск только на этом сайте (например, «site: extreme-band.com« Gary Cherone »»). Если этот человек указан на сайте как сотрудник или контактное лицо, вы узнаете его данные.
Эти советы работают хорошо — попробуйте!
Фактически, поиск людей с помощью Google работает настолько хорошо, что поисковые сайты, существовавшие много лет назад, закрылись.Кому они нужны, когда Google уже делает это лучше всего?
Если вы проводите полную проверку биографических данных кого-то, то, вероятно, вас интересует не только его действия в Интернете. Вероятно, вы ищете любую из следующих сведений:
- Резиденции за последние несколько лет
- Проверка судимости
- Запись вождения
- Дата рождения и место рождения (для подтверждения гражданства)
- Проверка детского хищника
Человек с судимостью или решением суда имеет удивительное количество информации о себе в Интернете.Все, что вам нужно, это имя и дата рождения человека, которого вы исследуете; расположение поможет сузить круг вопросов.
Один из лучших сайтов для проведения бесплатных запросов публичных записей. Используя ZabaSearch, вы можете определить точные прошлые и текущие адреса и номера телефонов человека.
Однако для просмотра полного профиля вам потребуется заплатить 50 долларов через Intelius. Это включает в себя прошлые адреса, родственников, криминальное прошлое, банкротства и многое другое.
Это обеспечивает огромную базу данных для всех государственных и федеральных агентств. Большинство услуг, в которых вам необходимо заплатить за справочную информацию, поступают из этих бесплатных баз данных государственных и федеральных агентств. Вы можете бесплатно найти данные, выполнив поиск на этом веб-сайте, чтобы найти эти агентства и провести поиск самостоятельно.
Например, если раскопаться в агентствах штата Мэн, можно увидеть, где можно искать сведения о судимости штата Мэн.
Один из самых простых способов найти людей — это просто поискать в Facebook. Удивительно, кто появляется, когда вы ищете имя на Facebook.
Другие социальные сети также могут оказаться полезными для поиска людей. Например, многие люди избегают Facebook и активны в Twitter или даже в Instagram.
Между тем LinkedIn — отличный ресурс для поиска людей.Это альтернатива Facebook, ориентированная на карьеру: есть большая вероятность, что вы найдете людей, которых больше нигде не найдете.
Если вы знаете, где работал или учился человек, которого вы ищете, LinkedIn — отличный вариант. Хотя без подписки LinkedIn вы не найдете слишком много деталей, их должно быть достаточно, чтобы продолжить.
Вы сможете узнать, чем они недавно занимались в профессиональном плане, а также с кем они связаны.
Эти 13 инструментов могут быть отличным способом найти людей в Интернете, но вам нужно использовать их этично. Не запугивайте, не преследуйте и не преследуйте людей, которых вы ищете. Это может привести к проблемам с законом.
5 простых способов узнать, кто вас ищет в ИнтернетеОбеспокоены тем, что люди ищут вас? Вот онлайн-инструменты, которые вы можете использовать, чтобы отслеживать новые упоминания о вас и находить тех, кто вас ищет.
Читать далее
Об авторе Кристиан Коули (Опубликовано 1522 статей)Заместитель редактора по безопасности, Linux, DIY, программированию и техническому объяснению, а также производитель действительно полезных подкастов с большим опытом в поддержке настольных компьютеров и программного обеспечения.Автор журнала Linux Format, Кристиан — мастер Raspberry Pi, любитель Lego и фанат ретро-игр.
Более От Кристиана КоулиПодпишитесь на нашу рассылку новостей
Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!
Нажмите здесь, чтобы подписаться
Как найти информацию о человеке в Интернете: 7 простых шагов
Если вы хотите выследить человека, Интернет наводнен потенциальными ресурсами.Вы можете найти кого угодно в Интернете с помощью поисковых систем, социальных сетей и публичных записей среди других инструментов.
Будь то потерянный друг, мошенник-домовладелец или старый учитель, вы сможете найти их, немного покопавшись. Вот шаги, чтобы найти информацию о ком-либо в Интернете.
1. Проверьте Google Search
.Google всегда должен быть вашим первым портом захода. Простой поиск может выявить всевозможную информацию о человеке, включая его работу, семью и город, в котором он живет.
Если у человека, о котором идет речь, есть обычное имя, попробуйте использовать некоторые логические операторы поиска Google, чтобы сузить фокус. Также стоит проверить Новости Google. Он раскроет все недавние заметные достижения или печально известные скандалы.
2. Настройте оповещение Google
.Если вы не можете найти какую-либо информацию с помощью Google, попробуйте настроить некоторые оповещения Google. Если что-то о человеке, которого вы ищете, появится в Интернете в будущем, вы получите уведомление на свой электронный почтовый ящик.
Чтобы настроить оповещение Google, перейдите на страницу google.com/alerts и введите имя человека в поле поиска. Щелкните Показать параметры , чтобы настроить такие параметры, как язык, регион и частота уведомлений.
3. Проверьте другие поисковые системы
Google — не единственное шоу в городе. Есть много поисковых систем. Все они имеют разные алгоритмы поиска, а это означает, что вы сможете находить альтернативные крупицы информации, используя их.
Подробнее: альтернативные поисковые системы, которые находят то, что не может найти Google
4. Проверьте основные социальные сети
По оценкам, количество пользователей социальных сетей во всем мире по состоянию на январь 2021 года составляет около 4,2 миллиарда человек. В результате высока вероятность того, что человек, которого вы хотите отследить, где-то поблизости.
Вы должны просканировать все обычные места, такие как Facebook, Twitter и Instagram.Но убедитесь, что вы не упускаете из виду LinkedIn. Некоторые профессионалы могут поддерживать свой профиль в LinkedIn как единственное место в социальных сетях.
5. Проверить публичные записи
«Публичные записи» — это широкий термин. Какие записи доступны в Интернете, очень непонятно. Если вам повезет, вы сможете найти свидетельство о рождении человека, свидетельство о браке, указ о разводе и многое другое.
Вы также можете проверить такие документы, как сертификаты землепользования и реестры компаний, чтобы узнать, есть ли у человека какие-либо записи, связанные с его именем.
Сайты, на которые стоит обратить внимание, включают:
Zabasearch
Zabasearch — хорошая отправная точка, но он вернет огромное количество информации. Он извлекает информацию из общедоступных записей, таких как протоколы судебных заседаний, информация о регистрации избирателей, «Желтые страницы» и т. Д. Чтобы управлять потоком информации, вы можете сузить его, например, до штата.
Большая часть информации доступна бесплатно, и вам следует исчерпать все варианты поиска, прежде чем выбирать платный маршрут.
VitalRec
VitalRec поможет вам найти свидетельства о рождении, записи о смерти, свидетельства о браке и указы о разводе для каждого штата, округа и городского архива в США.
Сайт также имеет несколько международных рекордов. Охватываемые страны включают Австралию, Австрию, Канаду, Чешскую Республику, Великобританию, Финляндию, Францию, Германию, Венгрию, Ирландию, Италию, Новую Зеландию, Нидерланды, Польшу, Португалию, Словакию и Швецию.
Национальный публичный веб-сайт для сексуальных преступников
Национальный публичный веб-сайт для лиц, совершающих преступления на сексуальной почве, или для краткости NSOPW , представляет собой список зарегистрированных в США лиц, совершивших преступления на сексуальной почве.
Он содержит базы данных для всех 50 штатов, а также округа Колумбия, территорий США и Индии.
Военная документация
Служебные записи ветеранов доступны в Национальном архиве США.Он включает в себя фотографии, документы и доступные для поиска базы данных.
Обратите внимание, что данные не являются исчерпывающими. Кураторы Национального архива признают, что большая часть информации недоступна в Интернете. Это особенно верно для пластинок до Первой мировой войны.
Записи об авторских правах
Если человек, которого вы пытаетесь найти, является писателем, музыкантом или иным образом связан с творчеством, вы можете найти ссылку на него в Бюро регистрации авторских прав США.Все записи отдела доступны для поиска в Интернете.
Вы можете искать как личные, так и корпоративные имена. В других странах есть собственные эквивалентные базы данных с возможностью поиска.
Патентные записи
Точно так же, если человек, которого вы хотите найти, является ученым или изобретателем, вы можете найти его в публичных записях Управления США по патентам и товарным знакам.
Вы можете искать по имени, марке дизайна, ключевым словам и т. Д.Опять же, в других странах есть сопоставимые базы данных.
Федеральное бюро тюрем
Есть шанс, что человека посадят в тюрьму. В конце концов, почти каждый 100 взрослый американец находится за решеткой.
Если они осуждены за преступление, они могут не появиться в социальных сетях или на некоторых других сайтах, которые мы обсуждали. Итак, вы можете проверить общенациональный список заключенных на официальном сайте Федерального бюро тюрем.
6. Проверьте нишевые поисковые системы
Все еще не повезло? Не волнуйтесь; у вас еще нет вариантов. Затем ознакомьтесь с некоторыми глубокими поисковыми системами. Они специализируются на конкретных отраслях, регионах и социальных сетях.
Некоторые нишевые поисковые системы, которые помогут вам найти кого-то в Интернете:
PeekYou
PeekYou сканирует учетные записи людей в социальных сетях вместе со ссылками на имя пользователя на других сайтах и блогах.Для начала вам понадобится имя и (необязательно) номер телефона.
Пипл
Pipl отлично раскрывает номера телефонов, адреса и ссылки на публичные записи. Вы можете уточнить поиск по городу, штату и почтовому индексу, чтобы получить более узкий выбор результатов.
Найдите могилу
Если человек, которого вы ищете, умер, вы можете перейти на веб-сайт Find a Grave. Это самая обширная в мире база данных информации о могилах и надгробиях.Это коллекция фотографий и контента, отправленных пользователями.
На момент написания вы можете найти 170 миллионов памятников. Это смесь обычных умерших людей и ушедших известных людей.
Interment.net
В том же духе Interment.net имеет миллионы официальных записей о кладбищах тысяч кладбищ по всему миру.
Данные доступны для США, Бельгии, Бразилии, Кубы, Кипра, Чехии, Финляндии, Франции, Германии, Ирландии, Италии, Японии, Мексики, Новой Зеландии и Польши.
Связанный: Вам нужно проверить эти нишевые социальные сети
7. Проверьте нишевые социальные сети
Наконец, стоит порыться в нескольких нишевых социальных сетях. Вы будете удивлены разнообразием существующих небольших сайтов. Существуют сети, специально созданные для инвесторов, любителей пива, местных жителей и т. Д.
Найти людей в Интернете легко
Разнообразный набор инструментов, который мы рассмотрели, должен помочь вам приступить к поиску информации о ком-либо в Интернете.
Пока вы логически прорабатываете все источники (и достаточно широко распространяете свою сеть), вы почти наверняка сможете найти человека, которого ищете.
13 сайтов для поиска людей в ИнтернетеИщете потерянных друзей? Сегодня найти людей в Интернете с помощью этих поисковых систем проще, чем когда-либо прежде.
Читать далее
Об авторе Дэн Прайс (Опубликовано 1601 статьи)Дэн присоединился к MakeUseOf в 2014 году и является директором по партнерству с июля 2020 года.Обращайтесь к нему с вопросами о спонсируемом контенте, партнерских соглашениях, рекламных акциях и любых других формах партнерства. Вы также можете увидеть, как он каждый год бродит по выставочной площадке CES в Лас-Вегасе, поздоровайтесь, если собираетесь. До своей писательской карьеры он был финансовым консультантом.
Более От Дэна ПрайсаПодпишитесь на нашу рассылку новостей
Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!
Нажмите здесь, чтобы подписаться
Поиск информации в Интернете
Поиск информации в Интернете докторP.M.E. Де БраСекция информационных систем
Департамент компьютерных наук
Технологический университет Эйндховена
Почтовый ящик 513, 5600 МБ Эйндховен
Нидерланды
Эл. Почта [email protected]
Аннотация
Всемирная паутина содержит огромное количество информации на все мыслимые темы. Большая часть этой информации очень стабильна, но некоторые из них генерируются динамически и поэтому недолговечны. Отсутствие полноценного и полезного каталог или указатель затрудняет поиск пользователями информация, которую они хотят.
В этой статье дается обзор методов, используемых для поиска информация в сети и основанные на них средства поиска. Лучшее понимание возможностей и ограничений различные инструменты поиска могут помочь пользователям выбрать подходящий инструмент для каждой задачи.
1. Введение
С момента своего создания примерно в 1990 году Всемирная паутина росла. с экспоненциальной скоростью (названный Тимом Бернерсом Ли медленным взрывом ), стать крупнейшим информационным пространством в Интернете и, вероятно, также в Мире.Слабая сетевая структура, облегчающая отдельные организации, чтобы стать частью Интернета и предоставить информация на собственном сервере также является источником крупнейших информационный кошмар мира: для многих пользователей он стал очень сложно, если не невозможно, находить информацию в сети, даже если известно, что она существует.
Информационный поиск — это область исследований с давней историей. (См. [MB85] и [GS89] для обзора.) Процесс поиска информации можно разделить на три этапа:
- поиск документов: Интернет состоит из миллионов документов, распределены по десяткам тысяч серверов; может быть трудно получить доступ ко всем потенциально интересным документам.
- формулирование запросов: пользователь должен точно указать, какой информация, которую она ищет.
- определение релевантности: система должна определить, документ содержит информацию, которую ищет пользователь.
Чтобы своевременно отвечать на запросы пользователей, большинство поисковые инструменты используют специально подготовленную базу данных вместо поиска документы на лету.В зависимости от техники, используемой для генерации В этой базе данных можно или нельзя ответить на определенные типы вопросов. Инструменты поиска, общедоступные в Интернете, используют разные типы баз данных и разные методы доступа к документы в сети. В результате они могут ответить на разные вопросы, и даже на один и тот же вопрос они могут дать разные ответы. В этом документе дается обзор свободно доступных инструментов поиска, методы, используемые для доступа в Интернет и индексации информации.Цель данной статьи — дать читателю лучшее понимание в проблеме поиска информации в сети, а также в достоинствах и ограничения доступных инструментов поиска.
В этой статье мы будем использовать следующий пример поиска: в Технологическом университете Эйндховена мы разработали курс на гипертексте и гипермедиа. Полный текст этого курса доступен в Интернете с начала 1994 года. Он состоит из 163 небольших документы, между которыми много ссылок.Адрес http://wwwis.win.tue.nl/2L670/. Мы описываем наш опыт поиска первой страницы этого конечно, используя различные инструменты поиска в Интернете. Мы также описываем наш опыт поиска домашней страницы автора. (из курса и этой статьи), Поль Де Бра, и другого исследователя, Ad Aerts.
Структура статьи следующая: в разделе 2 мы кратко набросайте общую структуру гипертекста Всемирной паутины. Раздел 3 описывает, как «роботы» используются для поиска некоторых, большинства или всех документы в сети.В разделе 4 описывается, как в индексных базах данных хранятся (описания) документы. и как поисковые системы позволяют пользователям находить информацию. В этом разделе также содержится наш опыт поиска гипермедиа. конечно, и домашние страницы двух людей с использованием самых популярных инструментов поиска. Раздел 5 описывает Урожай, пример романа и распространенного подход к решению основных проблем с поиском информации в сети. В Разделе 6 мы даем несколько заключительных советов о том, какой инструмент использовать для какой поисковый запрос.
2. Гипертекстовая структура Интернета
Гипертекст определен Шнейдерманом и Кирсли [SK89] как база данных, которая имеет активные перекрестные ссылки и позволяет читателю для «перехода» к другим частям базы данных по желанию. Это определение хорошо подходит для World Wide Web: документы имеют активный ссылки друг на друга, что означает, что пользователь может переходить из одного документа к другому, перейдя по этим ссылкам. Пользователи также могут переходить непосредственно к документам с помощью имени и местонахождение документа.Интернет использует универсальных указателей ресурсов (URL) для адресации документы. URL-адреса наиболее полезны, когда пользователь знает местоположение желаемого документ. При поиске информации обычно хочется узнать местонахождение документов, содержащих эту информацию, поэтому URL-адреса являются ответами на запросы.
Инструменты поискадолжны переходить по ссылкам, чтобы найти документы, через Интернет. На рисунке 1 показана структура графа, подобная структуре Интернета. Показано несколько серверов, имеющих много соединений между документами на тот же сервер и несколько подключений друг к другу.
Рисунок 1: структура графа сети .
Помимо приблизительного представления о графовой структуре Интернета, рисунок 1 также показывает, что хотя изображенный граф полностью связан невозможно добраться до всех узлов графа из одного отправная точка и переходя по ссылкам вперед. Даже если можно вернуться к узлам, которые были посещены ранее, функция, предлагаемая большинством веб-браузеров, некоторые узлы по-прежнему остаются недоступными. Та же проблема существует и в «реальном» Интернете: невозможно получить доступ ко всей сети только по ссылкам.Нужны разные «хитрости», чтобы найти стартовый набор. точки, из которых можно получить доступ ко всей сети.
Много информации в Интернете доступно с ftp-серверов. (ftp означает протокол передачи файлов), а примерно в 1991 и 1992 годах Также стали популярными серверы Gopher. FTP-серверы строго иерархические потому что они обращаются к файлам напрямую из файловой системы (Unix). Серверы Gopher также являются иерархическими, использующими систему меню, но они могут также содержат пункты меню, указывающие на информацию о других серверах.Найти все документы или файлы на таких иерархических серверах очень сложно. проще (когда вы знаете, где находятся серверы), чем искать документы на сервере World Wide Web.
Проект паука RBSE [E94, E94a] из Хьюстонского университета исследовал структуру Всемирной паутины, подсчитав количество ссылки из и на каждый документ. Чем больше ссылок на документ, тем легче его найти. документ по ссылкам. Даже при посещении лишь небольшой части Интернета есть вероятность, что указатель к такому документу не найдено.Когда есть много документов, на которые есть только несколько ссылок, перед указанием на такие документы необходимо посетить большую часть Интернета. найден. Паук RBSE обнаружил, что 59% документов в Интернете есть только одна ссылка, указывающая на них, а для 96% их не более пять ссылок. Это означает, что большинство документов в Интернете трудно найти с помощью навигации.
3. Роботы или пауки во всемирной паутине
Просмотр или «серфинг» в Интернете состоит из начала с известного (URL-адрес) документа и следующие ссылки на другие документы по желанию.Программа браузера (графическая) показывает, где находятся привязки к ссылкам в документ, например, подчеркнув их и / или отобразив в другого цвета, чем у остальной части документа. Документы в Интернете написаны с использованием HTML, языка разметки гипертекста. Ссылки встраиваются в документы с помощью тегов привязки HTML, которые содержат URL-адрес назначения ссылки. Пользователи, которые запоминают URL-адреса (или помещают их в горячий список), могут сообщить браузеру чтобы перейти непосредственно к документу с заданным URL-адресом.
Для поиска информации в Интернете или просто для сбора документов для создания базы данных индексов, необходимо запустить программу, которая извлекает документы из Интернета почти так же, как пользователь, просматривающий веб-страницы извлекает документы с помощью браузера.Эти специальные программы называются роботами , или пауками. Мартин Костер (ранее в Nexor, теперь в WebCrawler) поддерживает список известных роботов и список рассылки для создателей и пользователей роботов.
Хотя концептуально кажется, что роботы или пауки блуждают вокруг в Интернете они блуждают только виртуально, потому что действительно остаются на том же компьютере. Такие имена, как «WebWanderer» и «World Wide Web Worm». может предлагать программы, которые вторгаются в компьютеры по всему Интернету для извлечения информацию и отправить ее обратно на свою базу, но все, что они действительно делают извлекает документы из разных мест в Интернете на компьютер они проживают.Следовательно, они не представляют никакой опасности, как печально известные Интернет-червь [D89] еще в 1988 году.
3.1 Алгоритм робота
Все роботы используют следующий алгоритм для поиска документов из Интернета:
- Алгоритм использует список известных URL. В этом списке не менее один URL для начала.
- URL-адрес взят из списка (с использованием различных эвристик). для каждого робота), и соответствующий документ извлекается из Интернета.
- Документ анализируется для получения информации для базы данных индекса и извлекать встроенные ссылки на другие документы.
- URL-адреса ссылок, найденных в документе, добавляются в список известных URL. (Порядок и позиция, в которой URL-адреса добавляются в список отличается между роботами.)
- Если список пуст или превышен какой-то лимит (количество документов получено, размер базы данных индекса, время, прошедшее с момента запуска, и т. д.) алгоритм останавливается. В противном случае алгоритм переходит к шагу 2.
3.2 Начало работы с роботом
Как показано на рисунке 1, одной отправной точки недостаточно для поиска вся всемирная паутина.Таким образом, состав начального списка известных URL-адресов является важный шаг на пути к поиску как можно большего количества Интернета. Также при использовании робота для поиска информации по определенной теме, первоначальный список документов, относящихся к этой теме, — большой шаг вперед.
Организация World Wide Web поддерживает официальный список веб-серверов (на http://www.w3.org/hypertext/DataSources/WWW/Servers.html). Этот список содержит указатели на подсписки для каждой страны. Ни один из этих списков не является полным.В официальный список Нидерландов (на http://www.nic.surfnet.nl/nlmenu.eng/w3all.html) и неофициальный графический обзор, называется «голландской домашней страницей» (на http://www.eeb.ele.tue.nl/map/netternet.html/) обычно содержат другой сервер адреса. Кроме того, в большинстве организаций указывается только один сервер, в то время как у них есть несколько других, с которыми можно связаться через перечисленные сервер. В качестве отправной точки для поиска большей части Интернета такие списки чрезвычайно ценный. Хотя они не предоставляют адреса для каждого сервера, они приносят робота почти к каждому серверу в сети.
Новая интересная информация часто появляется на серверах, которые еще не зарегистрированы в официальных или неофициальных списках. Чтобы найти это информация некоторые сайты роботов отслеживают ряд списков рассылки и Группы Usenet Netnews. Анонсы новых услуг или отчеты от заинтересованные пользователи часто появляются в сетевых новостях задолго до появления каких-либо ссылки на документы на известных веб-серверах.
3.3 Стратегии навигации
Процессы получения URL-адресов из списка и добавления в него новых URL-адресов. определить стратегию навигации робота.Если вновь найденные URL-адреса всегда добавляются к той же стороне списка, что и где URL-адреса выбираются для получения следующего документа, который робот перемещается по принципу «сначала в глубину». Если новые URL-адреса добавляются в один конец список и URL-адреса выбираются с другого конца, который выполняет робот широта навигации.
Большинство роботов демонстрируют поведение где-то посередине между этими двумя крайностями: чтобы воспользоваться преимуществами обеих стратегий, не страдая от их недостатков.
- Стратегия сначала в глубину , как исследовалось в [DV94], дает наилучшее общее распределение URL-адреса в Интернете, что важно, когда только относительно небольшой часть Интернета может быть получена.Навигация в глубину также создает опасность вести за собой робота. в бесконечно рекурсивные деревья документов на серверах, которые генерируют документы на лету. Многие документы содержат ссылки на себя или на разные документы, созданные с использованием одного и того же URL-адреса. Робот, который использует при навигации в глубину необходимо соблюдать особые меры предосторожности, чтобы избежать входа в такие бесконечные петли.
- Стратегия в ширину при использовании с начальный список, такой как официальный реестр серверов, дает отличные результаты сначала, потому что он достигает многих разных серверов.Однако в целом эта стратегия менее эффективна при проникновении в Интернет глубоко, выходя далеко за пределы отправных точек. Кроме того, поскольку ссылки берутся из списка в том же порядке, в котором они вставлены, переходят по всем ссылкам, встроенным в один документ последовательно. Во многих случаях эти ссылки указывают на документы в том же сервер. Таким образом, навигация в ширину может привести к периодам размещения большая нагрузка на один сервер, что является самым важным причина, по которой менеджеры серверов (веб-мастера) не любят роботов, перемещающихся по их сайту.
Несколько поисковых баз данных на основе роботов используют несколько роботов (иногда позвонил агентам ) параллельно, для достижения лучшей общей производительности поиска. Хотя такие действия для получения большей доли общей пропускной способности сети обычно считается грубым и неприемлемым поведением, большинство роботов стараются не получать сразу несколько документов с одного сервера или даже последовательно. (Netscape Navigator демонстрирует еще более грубое поведение путем параллельной загрузки встроенных изображений с одного и того же сервера.) Параллельное использование нескольких агентов не только ускоряет общую процесс, он также позволяет избежать блокировки, когда робот сталкивается с очень медленным ссылка или сервер.
Специалисты по обслуживанию веб-серверовмогут помочь разработчикам роботов избежать таких ловушек, как бесконечные циклы или бесполезные документы, такие как содержимое кеша или зеркало другого сервера. Большинство роботов соответствуют схеме исключения роботов (см. http://info.webcrawler.com/mak/projects/robots/norobots.html) по которому все документы и / или каталоги, перечисленные в файле исключения роботов (роботы.txt) на веб-сервере игнорируются (т. е. не извлекаются) посещающий робот.
3.4 Ограничения производительности роботов
В идеале робот загрузил бы всю сеть за относительно короткий период времени. времени, чтобы гарантировать, что найденные документы актуальны, и что ни одно недавнее дополнение не пропущено. Учитывая, что Интернет-сеть всегда будет ограниченной и очень загруженной в течение недели, перезагружая всю всемирную паутину за выходные кажется разумной целью. К сожалению, ни один робот не может этого добиться, какие бы усилия ни прилагались. по мнению его создателей, с точки зрения компьютерного и сетевого оборудования.
Команда Lycos (ранее в CMU, Университет Карнеги-Меллона, но теперь работает как независимая компания) извлекал Веб-документы уже более года, постепенно создавая и перестраивая индексная база данных. За это время их роботы нашли когда-либо увеличивающееся количество документов, приближающееся к 20 миллионам, в общей сложности более ста гигабайт (текстовой) информации. Чтобы получить столько информации за один уик-энд (около 50 часов) роботы должны уметь загружать не менее 100 документов в секунду с постоянной скоростью более 5.5 Мбит / с (миллион бит в секунду). Эта скорость передачи в настоящее время невозможно, как из-за накладных расходов, связанных с протоколом TCP / IP используется в Интернете, скорость света ограничивает пакет туда и обратно раз на межконтинентальных соединениях, а многочисленные веб-серверы подключен через медленные линии передачи данных. Предполагая, что средняя передача скорость, полученная через Интернет, составляет около 1 Кбит / с на соединение, в общей сложности 5.500 одновременных подключений необходимы для достижения скорости передачи 5.5 Мбит / с. скорость, но в настоящее время большинство сетевых коммутаторов не могут обрабатывать 5.500 одновременных TCP / IP-соединения.
Из-за этих ограничений специалисты по обслуживанию роботов подходы: Lycos пытается загрузить и перезагружать весь Интернет как можно чаще, то есть раз в несколько от месяцев до года. WebCrawler, с другой стороны, пытается чтобы загрузить как можно больше с как можно большего количества разных серверов, в выходные дни, тем самым обеспечивая более ограниченное покрытие, но с более актуальная информация.
4. Индексные базы данных и поисковые системы
Интернет содержит более ста гигабайт текстовой информации.Если предположить, что у кого-то есть столько доступного дискового пространства, он все равно будет непрактично искать последовательно через такое количество гигабайт для документов по определенной теме. Следовательно, индексные базы данных встроенные, которые напрямую связывают темы или слова с соответствующими документами.
База данных индекса работает как перевернутый файл. Обычный текстовый файл содержит строки текста. Учитывая строку номер один, легкий и прямой доступ к словам в этой строке. В перевернутом файле имея слово, можно получить прямой доступ к номерам строк, содержащих Это слово.Интернет — это текстовая база данных, обеспечивающая легкий доступ к содержимое документа с учетом его имени. База данных индекса пытается предоставить доступ к (именам или URL-адресам) документов, дается описание их содержания, например несколько слов, которые должны произойти в документах.
Создание индексных баз данных, как в целом, так и для Интернета, сложно по ряду причин:
- Описание содержания документов должно быть таким, чтобы пользователю легко дать эти описания, и легко система сопоставления документов и описаний.Большинство систем используют логические комбинации слов, которые должны или не должны встречаются в документах. Часто предмет не может быть описан одним словом или комбинацией слов. Когда нужна фраза (состоящая из нескольких слов), система должен быть в состоянии решить, встречаются ли отдельные слова фразы в правильном порядке и рядом друг с другом. Иногда тему лучше всего описать с помощью примера статьи или Аннотация. Некоторые программы поиска информации могут сопоставлять документы по схожести.Infoseek — общедоступный сервис, который предлагает эту возможность для Интернета.
- При использовании слов для описания предметов или тем система должна учитывать синонимы, слова, которые почти всегда связаны, и с выделением и удалением суффиксов. Это сложно сделать правильно В основном. Такие слова, как «факт» и «факт», описывают одну и ту же тему, но это не означает, что суффикс «ual» всегда можно удалить. При удалении «ual» из «equal» не остается ни одного английского слова. Стемминг еще сложнее: система должна знать, что «впитывает» и «поглощать» имеют тот же стержень («поглощать»), хотя стержень не обязательно часть слова.С синонимами труднее всего обращаться, потому что контекст может потребоваться, чтобы определить, являются ли они синонимами в данный документ или нет. Слова «кот» и «киска» не являются синонимами в например, во всех контекстах.
- Из-за гигантского размера Интернета количество слов или терминов которые используются для описания документа, должны быть ограничены. Слова, которые встречаются в очень многих документах бесполезны, и слова, которые встречаются слишком нечасто (вроде только один раз). Система Lycos использует всего около 20 слов. на документ, чтобы идентифицировать каждый из 20 миллионов веб-документов.Это уже привело к созданию базы данных размером около 10 гигабайт.
Четыре самых популярных инструмента поиска в Интернете используют совершенно разные индексные базы данных, которые в сочетании с различными методами их заполнения использование роботов приводит к различным сильным и слабым сторонам:
- АЛИВЕБ [K94] использует подход, аналогичный поисковому инструменту Archie для FTP-серверов. Каждый веб-мастер должен создать файл, содержащий описание того, что информацию можно найти на веб-сервере. Робот извлекает эти файлы один раз так часто (ежедневно) и восстанавливает свою базу данных.Эта схема основана на созданных человеком сводных файлах, и поэтому только ограниченное принятие. Однако, поскольку он создает небольшую базу данных, его легко зеркалировать. на разные сайты, тем самым распределяя нагрузку на поисковые операции. Для ALIWEB существует около десяти зеркальных сайтов.
- Yahoo начинал как университет проект (в Стэнфорде) по созданию тематического каталога Интернета. База данных доступна через иерархическую систему меню темы и подтемы. В базе данных также можно искать с помощью ключевых слов (темы).Большая часть базы данных создается вручную. Вебмастерам, желающим иметь некоторые из их URL-адресов, перечисленных Yahoo, могут отправить запрос с описанием документов и предметную категорию, к которой они относятся.
- WebCrawler [P94] начинался как небольшой университетский проект аспиранта (Брайан Пинкертон) в Вашингтонском университете. WebCrawler извлекает как можно больше документов из как можно большего количества разных серверов по возможности, в выходные. Документы полностью индексируются с помощью комплекта для индексирования NextStep.WebCrawler хорошо работает для поиска тем, типичных для много документов на одном сервере. Поскольку база данных WebCrawler может содержать всего несколько документов с одного сервера, скорее всего, он будет содержать информация, которая очень типична для этого сервера, но вряд ли будет содержать информация, которая встречается только в одном или нескольких документах на этом сервере. WebCrawler может не работать, например, для поиска личных домашних страниц, но очень полезен для поиска серверов отдела по имени факультета и института.WebCrawler использует стратегию навигации в ширину для поиска документов. Таким образом, документы, которые содержат много ссылок далеко от популярных или начинающих страницы веб-сервера вряд ли будут обнаружены WebCrawler. Гипермедийный курс 2L670 упоминается на нескольких страницах нашего веб-сервер отдела. Поэтому мы ожидаем, что WebCrawler сможет найти этот документ, пока мы ожидаем, что WebCrawler не сможет найти домашняя страница некоторых наших сотрудников.
- Lycos начинался как проект в CMU.Lycos пытается проиндексировать все документы во всемирной паутине, а также документы, доступные через серверы Gopher и ftp. Чтобы сохранить общий размер базы данных индекса в разумных пределах база данных индекса Lycos содержит всего несколько (около 20) слов на документ. Следовательно, тот факт, что Lycos проиндексировал почти все документы в Интернете, не означают, что с помощью Lycos легко найти конкретный документ. Lycos найдет только те документы, для которых данные слова типичны. Слова, которые встречаются в документе только один раз и могут характеризовать именно этот документ, возможно, не был выбран Lycos для включения в своей базе данных.При наличии нескольких хороших ключевых слов Lycos сможет найти множество документов. по этим темам. Мы ожидаем, что Lycos сможет найти как гипермедийный курс 2L670, так и домашние страницы наших сотрудников. Поскольку Lycos долгое время индексировал документы, многие из URL-адреса, возвращаемые Lycos, могут указывать на документы, которые больше не существуют или которые переехали. Кроме того, поскольку многие веб-сайты включают в себя шлюзы для общих баз данных, таких как справочные страницы Unix, Lycos проиндексировал тысячи копий эти популярные документы.
Есть много других инструментов поиска, подобных четырем упомянутым выше.
- JumpStation поддерживает индексная база данных только заголовков и заголовков документов. [B94] поддерживает базу данных индексов (3 миллиона) заголовков, URL-адресов и текста, используемых для ссылок. Как и ALIWEB, эти инструменты не индексируют содержимое веб-документов.
- Галактика TradeWave (Ранее EINet Galaxy), и навигатор глобальной сети каталоги на основе меню, как и Yahoo. (Глобальный сетевой навигатор однако не предлагает поиск по ключевым словам, в то время как TradeWave Galaxy и Yahoo.) Городская сеть и виртуальный турист предоставьте индекс, основанный на географическом положении, а не на предмете. Они здорово найти сервер, если вы знаете, где он, но не знаете, как он называется.
- База данных URL-адресов RBSE [E94] обеспечивает поиск в 36 000 документов, проиндексированных с помощью WAIS. Это делает его сопоставимым с WebCrawler, но WebCrawler лучше поддерживается. Infoseek предлагает поиск в более чем миллион документов. Он также предлагает услуги коммерческого поиска. Он нацелен на полноту, как Lycos, но должен содержать больше информации на документ, чтобы выполнить поиск его сходства.Альта Виста — самая последняя основная поисковая база данных и предлагается в качестве бесплатной услуги компанией Digital. Он утверждает, что содержит полнотекстовый индекс более 16 миллионов документов.
4.1 Логические операторы
Иногда документ можно идеально описать, сказав несколько слов что должно в них произойти. Иногда для описания тема, и соответствующий документ может содержать некоторые, но, возможно, не все из них. Иногда также известны слова, которых не должно встречаться в соответствующих документах.Инструменты поиска предлагают логические комбинации слов, чтобы пользователь мог опишите документы, которые она ищет.
Инструменты поиска в Интернете довольно примитивны: они запрашивают ряд
ключевые слова, и позволить пользователю выбрать, должны ли произойти некоторые или все,
т.е. они предлагают на выбор логические и , или .
Lycos, TradeWave Galaxy, WebCrawler и червь World Wide Web
все предлагают такой выбор.
С помощью Infoseek можно добавить знак +
или -
к
слова, указывающие, что они должны или не должны встречаться в документах по порядку
считать их актуальными.
Lycos предлагает больше возможностей, чем просто и , или . Можно выбрать параметр, чтобы Lycos соответствовал хотя бы определенному количество (от 2 до 7) терминов. С помощью других инструментов поиска можно искать документы, содержащие любые или все кодов гипермедийного курса 2L670, INF725 и INF706, но с Lycos может искать документы, содержащие как минимум два из этих трех коды.
Обратите внимание, что ни одна из вышеперечисленных систем не предлагает полный диапазон логических значений. формулы.Только Alta Vista позволяет комбинировать и , или и , а не , и используйте круглые скобки для создания любой логической комбинации, которую вы хотите, например, «(A или B), а не (C или D)».
4,2 Близость
При наличии нескольких условий поиска (слов) ни один из доступных инструментов поиска предложить пользователю полный контроль над важностью слова, встречающиеся в определенном порядке, или рядом друг с другом, или в одном и том же структурный элемент документа (кроме поиска по заголовкам или URL-адреса).Однако это не значит, что близость слов не влияет по найденным документам или по их ранжированию. Не так много подробностей об этом оглашается.
Чтобы учесть близость слов, учитывайте индексную базу данных необходимо знать расположение слов в каждом документе. Это делает базу данных намного больше, чем без близости. Вместо реального использования близости система Lycos просто отдает предпочтение для различения слов, которые встречаются в начале документа.Это не только обеспечивает ограниченную близость, но и увеличивает важность, придаваемая заголовку документа, без необходимости анализируя структуру документа, чтобы узнать, что это за заголовок.
Некоторые инструменты поиска обеспечивают поиск смежности с помощью данные слова как один большой поисковый запрос. При поиске названия гипермедийного курса это полезно, но это не полная замена близости в целом.
Infoseek предлагает лучшие возможности для контроля близости и слов
порядок.Поисковый запрос "пользовательский интерфейс"
(в кавычках) означает
что два слова должны располагаться рядом друг с другом в указанном порядке.
Термин пользовательский интерфейс
означает, что должны появиться два слова
в указанном порядке и рядом друг с другом. [пользовательский интерфейс]
означает, что два слова должны располагаться рядом друг с другом, но в любом порядке.
Alta Vista использует ключевое слово рядом с
, чтобы указать, что два
термины в документе не должны разделяться более чем десятью словами.(Alta Vista — единственный инструмент, который на самом деле объясняет, что именно означает
его оператора близости.)
4.3 Взвешивание терминов
Не все слова в документе одинаково важны. Даже когда пользователь предоставляет несколько (четыре или более) значимых слов, поисковая система может найти много документов, содержащих эти слова. Чтобы ранжировать документы (от наиболее до наименее релевантных), движок нужно угадать, какие слова важнее других, как в документы и в поисковом запросе пользователя.
На рисунке 2 ниже показано, как следует взвешивать слова (или термины). Слова, которые встречаются очень часто, бесполезны для поиска релевантных документы, и слова, которые встречаются очень редко, могут быть нетипичными для документ тоже.
Рисунок 2: разрешающая способность слов.
Важно учитывать как частоту встречаемости слова в единый документ и во всей базе данных документов. Для гипермедийного курса используются коды 2L670, INF725 и INF706. не более или менее распространены, чем многие другие, но во всей сети эти слова идеально подходят для различения курса и других документов.При выборе нескольких слов, чтобы охарактеризовать этот документ в сети эти термины идеальны, тогда как для характеристики этого документа в целом (не зная, какие слова типичны в Интернете) эти слова могут упасть ниже нижней границы, потому что они встречаются в документе слишком редко. Lycos, например, отклонил коды 2L670 и INF725, которые встречаются только один раз на первой странице курса, но сохранил INF706, который встречается дважды.
В идеале пользователю должна быть предоставлена возможность изменять параметры системы. вес по умолчанию для каждого из условий поиска.При поиске «Unix command cat», слово «cat» очень важно, потому что пользователь не требует информации о других командах Unix. Однако система может решить, что «кошка» не является важным словом, потому что есть много документы о кошках. Ни один из поисковых инструментов в Интернете не предлагает выбор изменения веса поисковых запросов. Но в некоторых системах включая WebCrawler, пользователь может использовать недокументированную функцию, которая придает больший вес словам, которые повторяются в запросе.Таким образом, запрос «Unix command cat» можно изменить на «Команда Unix cat cat cat» означает, что поиск «кошки» является наиболее важным.
4.4 Поиск частей или выражений
Большинство поисковых систем в Интернете не очень хорошо разбираются в разделении и определение слов, или об анализе структуры документов. Они предлагают возможность найти точное совпадение слов или просто подстроки, возлагает большую часть этого бремени на пользователя. ALIWEB — это поисковая система, которая позволяет использовать регулярные выражения помимо слов.Это означает, что ALIWEB должен содержать полный текст резюме. содержит. Урожай [SBDHM94] также может выполнять поиск по регулярным выражениям и даже приблизительный поиск, потому что его формат базы данных индекса Glimpse поддерживает их. Он-лайн Fish-Search [DBP94, DBP94a, DBP94b] предлагает одинаковый поиск по регулярному и приблизительному выражению, а также ряд других.
Для поиска структурных частей документов индексная база данных потребуется проанализировать синтаксис HTML.Несколько поисковых систем, таких как World Wide Web Worm и TradeWave Galaxy, предлагает возможность поиска только по заголовкам документов, или только текст ссылки. Заголовок легко определить (по тегу
4.5 Пример результатов поиска
В качестве эксперимента мы попытались разместить курс гипермедиа в четырех разными способами: используя название «Hypermedia Structures and Systems», и используя три существующих кода: 2L670, INF725 и INF706.Мы также искали имена «Пол Де Бра» и «Ad Aerts».
- ALIWEB не может найти ни один из запрошенных документов, потому что Веб-сервер, содержащий их, явно не зарегистрирован в ALIWEB.
- Yahoo может найти курс только по коду INF706. Так как первая страница курса дважды содержит код INF706 и INF725 и 2L670 только один раз, это говорит о том, что Yahoo выбирает несколько слова для своей базы данных индекса, в зависимости от частоты их появления. Имена «Поль Де Бра» и «Ad Aerts» не встречаются.Курс гипермедиа был отправлен в Yahoo для включения нескольких месяцев назад, а домашних страниц не было.
- WebCrawler может найти курс по названию и ранжировать его как первый. Курс не может быть найден по любому из кодов. Это говорит о том, что индексатору могут не понравиться слова, содержащие комбинацию букв и цифр. При использовании логических или вместо и курс все еще найден по названию, но больше не занимает первое место. WebCrawler находит имя «Поль Де Бра», но не находит домашнюю страницу, и не находит «Ad Aerts».
- Lycos не может найти полный заголовок (с логическими и ).
Он игнорирует стоп-слово «и», но по-прежнему ищет четыре совпадающих термина
(пока осталось только три члена). При поиске
«Hypermedia Structures Systems» находит курс и ставит его на первое место.
С логическими или Lycos по-прежнему занимает первое место.
Lycos не может найти код 2L670, но указывает, что искал L670.
Это означает, что он хочет, чтобы слова начинались с буквы.
Он также не может найти код INF725, но находит курс с использованием кода INF706.
потому что этот код встречается дважды на первой странице курса.Этот поиск показывает, что Lycos не индексирует весь текст
документы, но сохраняет только небольшое количество слов, которые он считает значимыми
и дискриминационный.
Lycos находит домашнюю страницу «Paul De Bra» при сопоставлении 2 терминов (а не 3). Тем не менее, он не занимает первое место, но все же вполне приемлемое второе место. Резюме, приведенное на этой домашней странице, описывает версию, которая посвящена два месяца. Это демонстрирует, что Lycos действительно не обновляет свои база данных очень часто. Lycos также находит домашнюю страницу Ad Aerts, демонстрируя его полноту. - Infoseek находит не курс, а страницу исследовательской группы, содержащую ссылку на него, используя как код 2L670, так и заголовок. Неудивительно, что поиск по запросу 2L670 дает тот же результат, в то время как INF725 и INF706 не найдены. Домашняя страница Paul De Bra найдена, а страница Ad Aerts — нет, хотя страница исследовательской группы есть, на которой есть указатель. Эти результаты показывают, что Infoseek действительно содержит гораздо больше информации. о каждом документе, чем Lycos, но он не содержит почти столько же документов.
- Alta Vista может найти курс, используя любой из кодов, но не может найдите его, используя полное название. Это убедительно свидетельствует о том, что не все слова из документов используются в базе данных индекса (вопреки тому, что Альта Виста утверждает). Alta Vista может найти обе домашние страницы, используя имена людей. Несмотря на большое количество документов, у Alta Vista есть проиндексировано, зеркало гипермедийного курса, установленного в университете Антверпена, найти не удалось.
- Червь World Wide Web не может найти ни курс, ни домашние страницы, хотя основное внимание уделяется заголовкам документов.(Название курса и людей встречаются в названии соответствующие документы.)
- TradeWave Galaxy имеет возможность поиска по всем документам или только заголовки. В любом случае ни курс, ни домашние страницы можно найти.
- База данных URL RBSE не может найти курс или домашние страницы, но страдает от типичной проблемы WAIS с возвратом множества ответов он считает, что они похожи на поисковые запросы, но на самом деле это не так содержат данные условия.
5.Инструменты поиска без собственной базы данных
Есть два подхода к улучшению результатов, полученных из индексировать базы данных и инструменты их поиска:
- Инструменты, подобные MetaCrawler [SE95] (Вашингтонский университет) и IBM Infomarket Search распределить поисковый запрос по нескольким известным индексным базам данных, и объедините их ответы (указав источник каждого ответа).
- Если предположить, что авторами документов по определенной теме являются часто знают друг друга и предоставляют ссылки на документы друг друга, результат поиска в базе данных часто можно улучшить, выполнив он-лайн поиск, начиная с ответа крупной поисковой системы, такой как WebCrawler или Lycos.Рыбный поиск [DBP94, DBP94a, DBP94b] такой инструмент онлайн-поиска.
Объединение усилий нескольких поисковых систем не обязательно обеспечить лучшие результаты. Поскольку каждая база данных индексов предлагает разные возможности, например близость поиск, взвешивание ключевых слов, определение логических комбинаций слов, или выбор точного соответствия слов, инструменты, которые распределяют запросы по такие базы данных не могут использовать преимущества каждой из этих систем. Однако наличие единой точки доступа для всех основных поисковых систем (и избегая их рекламы по пути) может быть полезным для много пользователей.
Онлайн-поиск в сети из 20 миллионов документов может показаться бесполезным вначале. Во время онлайн-поиска каждый проверяемый документ нуждается в быть загруженным на сайт, на котором работает поисковая система. Даже для относительно хорошо доступных серверов скорость передачи около один небольшой документ в секунду — это почти все, на что можно надеяться. Однако при запуске поиска из списка URL-адресов документов дается одним из известных поисковых инструментов, есть вероятность, что можно найти еще несколько соответствующих документов, изучив только несколько других документов, скажем, от 20 до 100.Начав с результата поиска WebCrawler, можно найти больше документы, потому что WebCrawler знает только о небольшой части Интернета. Кроме того, стратегия поиска рыбы в глубину дополняет стратегия WebCrawler в первую очередь в ширину. Начиная с результата Lycos, можно найти больше документов, потому что Lycos, возможно, не использовал правильные слова для индексации некоторых других релевантных документы. Из ответа Infoseek на поиск гипермедиа конечно, перечислив домашнюю страницу исследовательской группы со ссылкой на курс, он-лайн поиск с помощью fish-search легко найдет курс.Из ответа Lycos, который содержит первую страницу курса, можно легко найти любую желаемую страницу из этого курса. (Страницы курса трудно найти с помощью Lycos из-за сложного выбора Lycos слова из документов. Страницы из курса невозможно найти с помощью Infoseek, потому что его база данных не содержит их.)
Поиск рыбы интегрирован в тюбингенскую версию браузер Mosaic. Таким образом, он работает как робот в машине пользователя. Fish-search также существует как отдельный инструмент поиска (CGI-скрипт, который может быть установлен на веб-сервере).При таком использовании робот фактически работает на сервер, на котором он установлен, а не компьютер пользователя. Это наиболее полезно для пользователей с медленным модемным соединением, которые предпочитают выполнять онлайн-поиск на сервере с быстрым сетевым подключением.
WebCrawler также имеет экспериментальный онлайн-поиск, который объединяет поиск с дополнениями к базе данных индексов. Однако этот поиск недоступен для публики.
6. Распределенный подход
Проект Lycos демонстрирует, что даже при значительных инвестициях в компьютерном и сетевом оборудовании невозможно загрузить вся World Wide Web на одном сайте за достаточно короткий период времени.Учитывая скорость, с которой Интернет изменяется и растет, и временный характер большого количества информации в сети, удобство использования базы данных индекса значительно снижается с каждым день не обновляется. Ввиду насыщенности интернета во время будние дни подход WebCrawler к загрузке как можно большего количества во время выходные кажутся наименее неприемлемым компромиссом.
Распространение процесса загрузки на несколько сайтов, расположенных в различные части мира могут предоставить решение для генерации индекса проблема:
- Когда каждый участвующий сайт индексирует веб-серверы в своей сети (не обязательно географически близко, но с быстрым сетевым подключением на сайты-участники) количество документов, которые можно скачать в выходные дни больше, чем когда один сайт пытается загрузить документы со всего мира.
- Если нет большого (и нежелательного) перекрытия наборов серверы, проиндексированные каждым участником, отдельные действия загрузки каждого сайты не используют общие сетевые соединения друг с другом и, таким образом, могут достичь гораздо большей общей пропускной способности.
Ученые из ряда институтов инициировали Урожай проекта [SBDHM94]. На рисунке 2 ниже показан упрощенный вид архитектуры Harvest.
Рисунок 2: Упрощенная архитектура Harvest .
Урожай состоит из следующих видов частей:
- Провайдер — это сервер, например веб-сервер.
- Сборщик собирает информацию от одного или нескольких поставщиков и создает базу данных индекса. Обычно собиратель проживает на том же машина как провайдер, но большой институт может использовать одного собирателя для всех своих ведомственных Веб-серверы вместе. Собиратель урожая использует сущность для распознавания структурных элементов. (извлеките файлы из tar-архивов, найдите название и автора в HTML латексные документы и т. д.) и Glimpse для индексных баз данных, предлагая сопоставление регулярных и приблизительных выражений.
- Брокер предлагает интерфейс поиска. Использует индексные базы данных от собирателей, а также пересылает запросы другим брокерам.
- Эффективный кэш объектов доставляет запрошенные объекты (например, HTML-документы), используя кратчайший путь к пользователю.
Трудно предсказать, сколько собирателей и брокеров будет в Интернете. необходимость для обеспечения достойного поискового объекта с полным охватом и хорошая производительность.Многое зависит от изменения пропускной способности сети. Но соотношение между размером индексных баз данных, созданных сборщиками, к что из полных текстов также важно. База данных индекса Glimpse для использования Harvest требуется от 3 до 7% пространства, используемого проиндексированные документы. Таким образом, обмен информацией между собирателями и брокеры намного эффективнее, чем построение централизованного индекса базы данных, загрузив полные документы (и по одному).
7. Выводы
Существует множество бесплатных инструментов поиска в Интернете.Ни один инструмент не может удовлетворить все запросы каждого пользователя. Основные имена, которые следует запомнить, и их самые сильные стороны:
- WebCrawler — это поисковый движок с широким, но далеко не полным охватом Сети. Он часто обновляется (еженедельно) и он индексирует полное содержание документов. Информация, содержащаяся в нескольких документах на веб-сайте, является обычно обнаруживается WebCrawler, в то время как очень конкретная информация скрыта глубоко в иерархии документов веб-сервера обычно не встречается.
- Lycos — это поисковая система с почти полное покрытие сети. Он постоянно обновляется, но поскольку на его прохождение уходит много времени Во всей Сети он содержит много устаревшей информации. Его база данных индекса содержит только небольшое количество слов в документе, затрудняет поиск подходящих ключевых слов для поиска документа. Возможность запросить поиск, чтобы найти (как минимум) определенное число заданных ключевых слов очень помогает сузить поиск.
- Infoseek предлагает разумную покрытие (около 10%) и индексирует полный текст документов.Документы можно найти, используя любой набор слов, которые в них встречаются. Infoseek также может искать документы , а не , содержащие определенные слова. Кроме того, когда слова должны стоять рядом друг с другом, можно сказать Infoseek, чтобы рассмотреть или проигнорировать порядок, в котором должны появляться слова. После нахождения некоторых документов Infoseek предлагает возможность поиска для документов, которые «похожи» на данный документ.
- Alta Vista очень полная база данных индекса и предлагает богатые логические операторы для поиска документы, содержащие некоторые или не содержащие ни одного из заданного набора условий.Этот инструмент особенно полезен для людей, которые привыкли иметь дело с булевых формул, но также дает хорошие результаты, если просто задан набор ключевые слова.
- Инструменты мета-поиска, такие как MetaCrawler очень полезен, потому что перенаправляет поисковые запросы на WebCrawler, Lycos и Infoseek параллельно. Когда вам нужны определенные функции одного из этих инструментов поиска, например, сопоставление хотя бы определенного количества слов, мета-инструмент не может использоваться.
- Инструменты онлайн-поиска, такие как Fish-Search полезны для выполнения ограниченного глубокого поиска, начиная с ответа дается поисковой системой, такой как Lycos, Infoseek или Alta Vista.Такой поиск может привести к информации, которая либо еще очень свежая, либо или это много ссылок от корня дерева документов сервера.
- Инструменты, которые не индексируют содержимое документов (а только URL-адреса или title) не очень эффективны для поиска информации.
Список литературы
- [MB85]
- Bärtschi, M., Обзор тематики информационного поиска , IEEE Computer, 18: 5, стр 67-84, май 1985 г.
- [B94]
- Мак Брайан, О.А., GenVL и WWWW: инструменты для укрощения Интернета , Первая конференция WWW, Женева, 1994.
- [DBP94]
- Де Бра, П., Пост, Р., Поиск информации во всемирной паутине: Обеспечение возможности поиска на основе клиентов , Первая конференция WWW, Женева, Журнал компьютерных сетей и систем ISDN, 27, стр 183-192, Elsevier Science BV, 1994.
- [DBP94a]
- Де Бра, П., Пост, Р., Поиск произвольной информации во всемирной паутине: Рыбный поиск мозаики , Вторая WWW конференция, Чикаго, 1994, (http://www.ncsa.uiuc.edu/SDG/IT94/Proceedings/Searching/debra/article.html).
- [DBP94b]
- Де Бра, П., Хубен, Г.Дж., Корнацки, Ю., Пост, Р., Поиск информации в распределенных гипертекстах , Proc. Конференция RIAO-94, стр. 481-492, Нью-Йорк, 1994.
- [D89]
- Деннинг, Э., Интернет-червь , American Scientist, март-апрель 89, стр. 126-128, 1989.
- [E94]
- Эйхманн, Д., Паук RBSE — баланс между эффективным поиском и веб-нагрузкой , Первая конференция WWW, Женева, стр. 113-120, 1994.
- [E94a]
- Эйхманн, Д., Этические веб-агенты , Вторая WWW конференция, Чикаго, 1994, http://www.ncsa.uiuc.edu/SDG/IT94/Proceedings/Agents/eichmann.ethical/ethics.html
- [K94]
- Костер, М., ALIWEB — Индексирование в стиле Archie в WEB , Первая конференция WWW, Женева, 1994.
- [P94]
- Пинкертон Б., В поисках того, что хотят люди: опыт работы с WebCrawler , Вторая WWW конференция, Чикаго, 1994, http://www.ncsa.uiuc.edu/SDG/IT94/Proceedings/Searching/pinkerton/WebCrawler.html
- [GS89]
- Salton, G., Автоматическая обработка текста: преобразование, анализ, и получение информации с помощью компьютера , Addison-Wesley, 1989.
- [SBDHM94]
- Шварц, М.Ф., Боуман, К.М., Данциг, П.Б., Харди, Д.Р., Манбер, У., Система обнаружения и доступа к информации об урожае , Вторая WWW конференция, Чикаго, 1994, http://www.ncsa.uiuc.edu/SDG/IT94/Proceedings/Searching/schwartz.harvest/schwartz.harvest.html
- [SE95]
- Сельберг, Э., Эциони, О., Многопользовательский поиск и сравнение с использованием MetaCrawler , Четвертая конференция WWW, Бостон, стр. 195-208, 1995.
- [SK89]
- Шнейдерман, Б., Кирсли Г., Гипертекстовый практический опыт !: Введение в новый способ организации и доступа к информации , Аддисон Уэсли, 1989.
- [DV94]
- De Vocht, J., Эксперименты по характеристике структуры гипертекста с, магистерская диссертация , Eindhoven Univ. технологий, 1994.
http://wwwis.win.tue.nl/~debra/joep/
Три способа быстрого поиска информации в Интернете
Начните эффективно использовать поисковые системы
Практически все, что вам нужно знать, есть где-нибудь в Интернете.Но как быстро найти эту информацию?
Поисковые системы находят нужную вам информацию, «просматривая» Интернет и индексируя то, что они находят. Когда вы что-то ищете, они показывают вам наиболее подходящие ответы.
В идеальной ситуации ваша поисковая система будет каждый раз выдавать высококачественные результаты поиска (в отличие от большого количества). В действительности каждая поисковая система возвращает разные результаты, и информация не всегда может быть той, которую вы ищете.
Если выбранная вами поисковая система быстро выдает качественные результаты, все готово. Однако, если он поднимает ненужную или некачественную информацию, вы, вероятно, теряете много драгоценного времени.
Google может быть самой большой поисковой системой, но есть и другие, возможно, лучшие поисковые системы.
Хороший способ быстро найти информацию в Интернете — это познакомиться с вашей поисковой системой. В качестве первого шага изучите фильтры, настройки и другие параметры, которые, вероятно, существуют по какой-то причине.
Например, DuckDuckGo позволяет искать информацию за прошлый день, неделю, месяц и год. Убедитесь, что вы выбрали период времени, наиболее подходящий для вашего поиска. Так вы быстрее добьетесь лучших результатов.
Кроме того, DuckDuckGo не будет разбивать ваши результаты на страницы, поэтому вам больше не придется нажимать «Далее» и «Назад». Все, что вам нужно сделать, это прокрутить страницу вниз, чтобы быстро найти нужную информацию.
Другие поисковые системы, такие как Ecosia, имеют возможность выбрать регион для поиска.При желании Ecosia будет предлагать вам автоматические предложения под окном поиска по мере ввода. Некоторые поисковые системы, такие как Mojeek, также предлагают дополнительные персонализированные результаты поиска, основанные на вашей прошлой поисковой активности. Воспользуйтесь этими функциями, если хотите быстро найти информацию.
Если вы ищете определения знакомых терминов, большинство поисковых систем покажут вам мгновенные ответы вверху страницы — краткие сводки того, что вы ищете, например Википедия.Они могут быть очень полезны, когда дело доходит до быстрого поиска информации.
Поисковые системы, показывающие множество объявлений вверху страницы, наверняка замедлят вас. Часто вам приходится пролистывать объявления, чтобы добиться качественных результатов.
Хотя большинство людей будут использовать только одну поисковую систему (в недавнем опросе 69% пользователей Vivaldi сказали нам, что они используют только одну поисковую систему), в некоторых случаях использование более одной поисковой системы может помочь вам быстро найти информацию.
Вы можете переключаться между поисковыми системами в зависимости от вашего поиска. Например, «частные» поисковые системы дадут вам объективные результаты поиска, в то время как другие быстрее найдут личную информацию (например, почтовые адреса).
Если вам нужно переключаться с одной поисковой системы на другую одним щелчком мыши, используйте «псевдонимы поисковых систем» Вивальди. В разделе «Настройки» — «Поиск» мы присвоили каждой предустановленной поисковой системе по одной букве, например s для StartPage, b для Bing и т. д.Чтобы переключаться между поисковыми системами, просто введите псевдоним поисковой системы в поле адреса, затем пробел и поисковый запрос.
Улучшение поисковых запросов в веб-браузере
От точности вашего поискового запроса также зависит, насколько быстро вы получите наиболее релевантные результаты. Обычно лучше ограничить запрос несколькими словами, а не использовать полные предложения.
Чтобы составлять наилучшие запросы, вам необходимо знать синтаксис поиска, наиболее подходящий для вашей поисковой системы.Например:
- Если вы ищете конкретную фразу, введите ее в кавычки. Это ускорит поиск и скроет нерелевантные результаты.
- Если не знаете, какой термин искать, используйте слово-ссылку «или». Поисковая система покажет вам оба результата.
- Поиск с использованием альтернативных слов, т. Е. Синонимов. Это заставит вашу поисковую систему возвращать разные результаты, что поможет вам быстрее найти то, что вы ищете.
- Если вы ищете определенные ключевые слова в названии статьи, введите «intitle:» перед поисковым запросом.Если вы ищете определенные ключевые слова в URL-адресе, введите «inurl:».
Быстрая навигация по сети
Допустим, вы хорошо разбираетесь в поисковых запросах и находитесь на вершине своих поисковых систем. А теперь пора посмотреть, как вы перемещаетесь по сети. Да, время, необходимое для поиска информации в Интернете, пропорционально тому, насколько быстро вы можете перейти на веб-страницу.
В то время как одни люди привязаны к мыши, другие преуспевают в использовании клавиатуры. И часто это комбинация того и другого.
Вообще говоря, это более медленный запуск для пользователей клавиатуры по сравнению с теми, кто использует мышь. Однако, когда пользователи клавиатуры набирают скорость (и выучивают несколько быстрых клавиш), их скорость становится неограниченной.
Сочетания клавиш ускоряют работу, потому что вы не всегда тянетесь к мыши. Кроме того, когда вы ищете информацию в Интернете, вы часто переключаетесь между множеством открытых вкладок.