12+  Свидетельство СМИ ЭЛ № ФС 77 - 70917
Лицензия на образовательную деятельность №0001058
Пользовательское соглашение     Контактная и правовая информация
 
Педагогическое сообщество
УРОК.РФУРОК
 
Материал опубликовала
Фидарова Маргарита Георгиевна180
Россия, Северная Осетия-Алания респ., Владикавказ

Поиск информации в Интернете

ПОИСК ИНФОРМАЦИИ В ИНТЕРНЕТЕ

Становимся профессионалами поиска информации в Интернете Как научиться быстро и качественно отыскивать нужную информацию?  Какие существуют способы поиска информации?

Существуют три основных способа поиска информации в Интернет: 1. Указание адреса страницы. 2. Передвижение по гиперссылкам. 3. Обращение к поисковой системе (поисковому серверу). Как работают системы веб-поиска Статистика Яндекс — 53.9% Гугл — 35.0% Поиск Mail.ru — 8.3% Рамблер — 0.9% Яндекс (картинки) — 0.6% Гугл (картинки) — 0.2%

Механизм работы поисковой системы  Поисковая система работает в следующем порядке: Сбор данных поисковым роботом пауком (Web crawling) Индексация найденных данных (Indexing) Поиск по индексированным данным (Searching)

Сбор данных поисковым роботом пауком 1 этап – скачивание веб-страницы и анализ ссылок. выполняет Spider (быстрый поисковый паук) – программа для последовательного перебора и скачивания веб-страниц для анализа. 2 этап - выбор необходимых данных из списка. выполняет Crawler (медленный паук анализатор), находит все ссылки и составляет дальнейший маршрут для spider-а.  У spider-а есть определенный список сайтов для посещения, заранее подготовленный другими подсистемами поиска. Из этого списка spider получает все необходимые данные.

Индексация найденных данных Подсистема индексации размещает найденную пауками информацию так, чтобы было удобно в дальнейшем к ней обращаться. Программа Индексатор разбирает страницу на различные ее части и анализирует их, выделяются заголовки страниц, ссылки, текст, структурные элементы и т.д.

Поиск по индексированным данным Эта подсистема выдачи результатов, которая использует сформированную индексатором базу данных. Она определяет, какие страницы удовлетворяют запросу пользователя и показывает результаты поиска. Критерии отбора поисковой машиной Title (заголовок): Есть ли ключевое слово в заголовке? Domain/URL (Домен/адрес): Есть ли ключевое слово в имени домена или в адресе страницы? Style (стиль): Анализ стиля текста на страницы. Используется ли Жирный текст или Курсив, используются ли заголовки H1, H2 и т.д. Density (плотность): Как часто употреблено ключевое слово на странице? Какова величина плотности ключевого слова? MetaInformation (мета данные) – поиск совпадений в метаданных. Outbound Links (ссылки наружу): Есть ли ссылки на странице и на кого они ведут, а также встречается ли ключевое слово в тексте ссылки? Inbound Links (внешние ссылки): Кто ссылается на искомую страницу? Каков текст ссылки? Insite Links (ссылки внутри страницы): На какие страницы данного сайта содержит ссылки эта страница? В результате выбираются нужные веб-страницы.

Что можно найти через поисковики Технически найти можно любую информацию, которая проиндексирована поисковиком, находиться в общем доступе в сети Интернет и не запрещена политикой поисковой системы.  При поиске в Интернете имейте ввиду следующее: Большая часть информации в интернете не контролируется и любой человек с компьютером и доступом в интернет может публиковать информацию. Поэтому нужно понимать, что данные могут быть недостоверными. Не всегда легко узнать кто автор найденной информации. Вы не всегда знаете откуда приходит информация. Информация может быть предвзятой, специально вводящей в заблуждение или просто неверной. Дата публикации данных может быть не указано и будет трудно понять, является ли информация актуальной.

Статистика поисковых запросов Примерно 2-3% от всех введенных запросов обычно сформулированы как вопрос.  Больше всего вопросительных запросов начинаются с: какой сколько кто В последнее время все больше запросов (около 10%) стали содержать прямое указание – купить, продать или получить что-то. Самые распространённые уточнения сегодня в рунете – это скачать и бесплатно.

Методы поиска информации в интернете 5 полезных способов поиска в Google Ситуация 1 – Поиск по изображению:

Ситуация 2 – Поиск внутри файлов с определенным расширением. В поисковую строку вводится команда: filetype:xls искомый текст. Xls расширение файлов Excel. Т.е. поисковая машина будет искать текст внутри файлов с указанным расширением. Например: filetype:xls отчет.

pdf – поиск указанного текста внутри pdf файлов dwf – файлы программы AutoCAD ps – файлы Adobe Post Script, специальные сценарии для вывода высококачественной векторной графики на принтеры и плоттеры kml и kmz – файлы программы Гугл Планета Земля(Google earth) xls – файлы программы Microsoft Office Excel ppt – файлы программы Microsoft Office Power Point doc – файлы программы Microsoft Office Word rtf – файлы Rich Text Format, поддерживаемые большинством текстовых редакторов swf – файлы проигрывателя флеш-плеера Shockwave Flash txt – поиск внутри обычных текстовых файлов Для поиска доступны следующие типы файлов:

Ситуация 3 –точное введение поисковой фразы. Первый подход – вводить в поисковую строку точную и достаточно длинную поисковую фразу. Чем больше и точнее будет поисковый запрос, тем более точное совпадение найдет поисковая машина (если конечно такая информация присутствует в сети интернет). Второй подход – обрамлять кавычками поисковую фразу. Например, вводим – “Большие города”, получаем:

Ситуация 4 – Поиск информации только по одному определенному сайту или домену. Например: site:livejournal.ru  Разное – это текст, который вы ищете, все что после site: это доменное имя сайта, на котором нужно искать.

Ситуация 5 – Поиск информации по электронной почте. Иногда необходимо найти информацию по человеку или организации, но на руках есть только адрес электронного почтового ящика (email). Если ввести в поисковую строку адрес почтового ящика, то можно найти все сайты и ресурсы, где человек оставлял свой email. Можно также найти домены, которые зарегистрированы на этот ящик.

Полезные советы при поиске информации Составлять поисковый запрос нужно так, чтобы максимально сузить количество вариантов в выдаче Используйте фильтрацию по времени – это позволит найти более-менее актуальную информацию. Все крупные поисковые системы предоставляют расширенный поиск, в котором можно установить диапазон дат. Корректный вопрос, задаваемый поисковику, должен состоять как минимум из двух ключевых слов тогда поисковику будет гораздо проще отыскать нужную информацию Для поиска информации используйте разные поисковые машины. Несмотря на то, что все поисковики построены на общих принципах, алгоритмы у них могут различаться. Например, то, что не смог найти Yandex, выдаст Google Если вы ищете какие-либо товары или услуги в вашем городе, уточняйте регион поиска(например Москва). Это уменьшит количество результатов, но найденные результаты будут соответствовать вашим поисковым запросам Используйте больше существительных для поиска. Используйте синонимы, если по запросу не было найдено то, что нужно Главный фактор успешного и быстрого поиска – это формулировка запроса для поисковой системы. Если вы умеете сообразить, какие нужны ключевые слова для устраивающего вас результата – вы король поиска!

«Горячий» расширенный поиск от Google Исключение из Google поиска Чтобы исключить из поисковой выдачи какое либо слово, фразу, символ и т.п., достаточно перед ним поставить знак “-” (минус), и оно не появится в результатах поиска. Для примера, я ввёл в строку поиска следующую фразу: “бесплатный хостинг – ru” и в поисковой выдаче нет ни одного .ru сайта, кроме оплаченных рекламных объявлений. Поиск по синонимам Используйте символ “~” для поиска схожих слов к выбранному. Например в результате выражения: “~лучшие фильмы -лучшие” вы увидите все ссылки на страницы, содержащие синонимы слова “лучшие”, но ни одно из них не будет содержать этого слова. Неопределённый поиск На тот случай, если вы не определились с конкретным ключевым словом для поиска, поможет оператор “*”. Например фраза “лучший редактор * изображений” подберёт лучшие редакторы для всех типов изображений, будь то цифровые, растровые, векторные и т.д. Поиск на выбор из вариантов Используя оператор “|”, можно осуществить Google поиск по нескольким сочетаниям фраз, заменяя несколько слов в различных местах. Например, введём фразу “купить чехол | ручку” выдаст нам страницы, содержащие либо “купить чехол”, либо “купить ручку” Исключение из Google поиска Чтобы исключить из поисковой выдачи какое либо слово, фразу, символ и т.п., достаточно перед ним поставить знак “-” (минус), и оно не появится в результатах поиска.  Пример: “бесплатный хостинг – ru” (в поисковой выдаче не будет ни одного .ru сайта, кроме оплаченных рекламных объявлений). Поиск по синонимам Используйте символ “~” для поиска схожих слов к выбранному. Например в результате выражения: “~лучшие фильмы -лучшие” вы увидите все ссылки на страницы, содержащие синонимы слова “лучшие”, но ни одно из них не будет содержать этого слова.

Неопределённый поиск На тот случай, если вы не определились с конкретным ключевым словом для поиска, поможет оператор “*”.  Например фраза “лучший редактор * изображений” подберёт лучшие редакторы для всех типов изображений, будь то цифровые, растровые, векторные и т.д. Поиск на выбор из вариантов Используя оператор “|”, можно осуществить Google поиск по нескольким сочетаниям фраз, заменяя несколько слов в различных местах.  Например, введём фразу “купить чехол | ручку” выдаст нам страницы, содержащие либо “купить чехол”, либо “купить ручку” Значение слова Чтобы узнать значение того или иного слова, достаточно ввести в поисковую строку “define:” и после двоеточия искомую фразу.

Точное совпадение Для нахождения точного совпадения поисковой выдачи с запросом достаточно заключить ключевики в кавычки. Поиск по определённому сайту Чтобы осуществить поиск ключевых слов только по одному сайту, достаточно прибавить к искомой фразе следующий синтаксис – “site:”. Обратные ссылки Чтобы узнать расположение ссылок на интересующий сайт, достаточно ввести следующий синтаксис: “links:” и далее адрес интересующего сайта.

Конвертер величин Поисковая система Google также умеет конвертировать величины по запросу пользователя. Например, нам нужно узнать, сколько составляет 1 кг в фунтах. Набираем следующий запрос: “1 кг в фунтах” Конвертер валют Для того, чтобы узнать курс валют по официальному курсу, набираем следующий поисковой запрос: “1 [валюта] в [валюта]” Время по городу Если хотите узнать время по какому либо городу, то используйте синтаксис: “time” или русский аналог “время” и название города. Google калькулятор Google умеет считать онлайн! Достаточно вбить пример в строку поиска и он выдаст результат. Поиск по типам файлов Если вам необходимо найти что-то по конкретному типу файла, то у Google есть оператор “filetype:” который осуществляет поиск по заданному расширению файла. Поиск кэшированной страницы Прогноз погоды по городу Достаточно вбить “weather” и город, как вы увидите, будет у вас дождь или нет Переводчик Можно переводить слова сразу, не отходя от поисковика. За перевод отвечает следующий синтаксис: “translate [слово] into [язык]” P.S. Комбинируя различные варианты параметров можно очень сильно сократить диапазон поиска и найти то что нужно. Надеюсь, приведенные выше примеры помогут вам в поиске информации.

Поисковые операторы, которые понимают и Яндекс, и Гугл Символ « + » «Плюс» говорит о том, что идущее за ним слово обязательно должно присутствовать на странице. Символ « — » «Минус» помогает исключить какие-либо слова из запроса.  Оператор « » Оператор в виде кавычек помогает найти страницы с точным совпадением введенного вами запроса. Символ « * » «Звездочка» заменяет собой любое количество слов. Может использоваться вместе с предыдущим оператором «кавычки». Спецсимвол « | » Вертикальный разделитель — это синоним слова «или». Он говорит поисковикам о том, что вас интересует или первый вариант, или второй. зимняя куртка Adidas | Columbia оставь * я в печали «ремонт стиральной машины Самсунг во Владикавказе» Мстители война бесконечности -онлайн iPhone Xs +64Гб

Спецсимвол « ~ » «Тильду» поисковики понимают по-разному. Для Яндекса эта команда говорит о том, что надо искать страницы, где слово, идущее после символа «~» не содержится в одном предложении с остальными словами, указанными до него. комиксы ~marvel Для Google «тильда» является командой поиска документов, содержащих указанное слово или его синонимы. Пример: здоровая ~еда –еда Гугл покажет страницы со вхождением запроса «здоровая пища», а не «здоровая еда».

Операторы, используемые в поиске Яндекса !» — Поиск документов, где слово содержится только в заданной форме. Можно искать даже слова с заглавными буквами.  «!!» — Поиск документов, где слово содержится в любой форме, в любом падеже. «&» амперсант — Поиск документов, где слова связанные оператором находятся в одном предложении. «&&» двойной амперсант — Тоже самое, только слова в пределах одного документа. «<<» — Поиск слов в пределах документа, но релевантность (она влияет на положение в результатах поиска) рассчитывает только по первому слов (которое до оператора)

Теперь недокументированные операторы: Intext – ищет только те документы, текст которых содержит слова запроса, т.е. не в метатегах или еще где-то, а именно в тексте. image – ищет все документы, в которых содержится изображение с заданным именем. Anchormus – ищет ссылки на музыкальные файлы, содержащие указанный запрос в анкоре Linkmus – ищет все страницы, с которые есть ссылка на указанный музыкальный файл Inlink – для поиска в тексте ссылок Linkint – поиск внутренних ссылок на определенный документ Anchorint – поиск документов, содержащих указанный запрос в текстах своих ссылок на свои внутренние документы idate — ищет документы с заданной датой последней индексации. style – поиск по значению атрибута stylesheet тега link applet – поиск по значению атрибута code тега applet: script — поиск по значению атрибута src тега script object – поиск по содержимому атрибутов тега object action – поиск по значению атрибута action тега form profile – поиск по значению атрибута profile тега head inpos — поиск текста в пределах заданных позиций элементов на странице(inpos:0..100)