Использование ключевых слов, фраз для поиска информации. Комбинации условия поиска. Урок информатики "Поиск информации с использованием компьютера. Программные поисковые сервисы" Комбинации условия поиска

Поиск информации с использованием
компьютера.
Программные поисковые серверы.
Использование ключевых слов, фраз для
поиска информации.
Комбинации условия поиска.

Поиск информации с использованием компьютера

После некоторого времени работы за
компьютером, вы обнаружите, что не
всегда можете вспомнить место, где
расположен тот или иной нужный вам
документ. В таком случае вам следует
воспользоваться средствами поиска
информации, включенными в
операционную систему. При этом
следует помнить, что для успешного
поиска файла необходимо правильно
указать критерии поиска.
В общем случае поиск информации в
Linux Ubuntu удобно проводить,
выбрав команду главного меню Искать
файлы из меню Стандартные. С их
помощью вы можете задать критерии
поиска и дать команду начала
процедуры поиска нужного файла.
Если пользователь не помнит названия
файла, но знает содержимое,
используется дополнительные
параметры поиска.

Поиск информации в сети Интернет

С каждым годом объемы Интернета
увеличиваются в разы, поэтому вероятность найти
необходимую информацию резко возрастает.
Интернет объединяет миллионы компьютеров,
множество разных сетей, число пользователей
увеличивается на 15-80% ежегодно. И, тем не
менее, все чаще при обращении к Интернет
основной проблемой оказывается не отсутствие
искомой информации, а возможность ее найти.
Как правило, обычный человек в силу разных
обстоятельств не может или не хочет тратить на
поиск нужного ему ответа больше 15-20 минут.
Поэтому особенно актуально правильно и
грамотно научиться, казалось бы, простой вещи –
где и как искать, чтобы получать ЖЕЛАЕМЫЕ
ответы.
Чтобы найти нужную информацию, необходимо
найти её адрес. Для этого существуют
специализированные поисковые сервера (роботы
индексов (поисковые системы), тематические
Интернет-каталоги, системы мета-поиска, службы
поиска людей и т.д.). В данном мастер-классе
раскрываются основные технологии поиска
информации в Интернет, предоставляются общие
черты поисковых инструментов, рассматриваются
структуры поисковых запросов для наиболее
популярных русскоязычных и англоязычных
поисковых систем.

Пограммные поисковые серверы

Основу, «каркас» Internet составляют около 300
миллионов серверов (Netcraft, март 2011),
постоянно подключенных к сети. К серверам Internet
могут подключаться сотни миллионов пользователей Inter
net (2 млрд. генсек Международного союза электросвязи ООН 27
января 2011).
Сеìрвер (англ. server от англ. to serve - служить)
(множественное число сеìрверы)
- в информационных технологиях - программный комп
онент вычислительной системы,
выполняющий сервисные (обслуживающие)
функции по запросу клиента,
предоставляя ему доступ к определённым ресурсам или у
слугам. Как правило,
каждый сервер обслуживает один (или несколько схожих)
протоколов и серверы можно классифицировать по типу у
слуг которые они предоставляют.
Файл-серверы
представляют собой серверы для обеспечения доступа к
файлам на диске сервера.
Прежде всего это серверы передачи файлов по заказу,
по протоколам FTP, TFTP, SFTP и HTTP. Протокол HTTP
ориентирован на передачу текстовых файлов,
но серверы могут отдавать в качестве запрошенных файл
ов и произвольные данные,
например динамически созданные веб-страницы,
картинки, музыку и т. п.
На ноябрь 2009
года двумя наиболее распространёнными веб-серверами,
вместе занимающими около 68 % рынка, являются:
Apache - свободный веб-сервер,
наиболее часто используемый в Unix-подобных
операционных системах;
IIS от компании Microsoft,
распространяемый с ОС семейства Windows NT.

Назначение WEB

Веб-сервер является программой,
запускаемой на подключённом к сети компьюте
ре и использующей протокол HTTP
для передачи данных.
В простейшем виде такая программа получает п
о сети HTTP-запрос на определённый ресурс,
находит соответствующий файл на локальном ж
ёстком диске и отправляет его по сети запросив
шему компьютеру. Более сложные веб-серверы
способны динамически распределять ресурсы в
ответ на HTTP-запрос.
Для идентификации ресурсов (зачастую
файлов или их частей)
во Всемирной паутине используются единообра
зные идентификаторы ресурсов URI (англ.
Uniform Resource Identifier).
Для определения местонахождения ресурсов в
сети используются единообразные локаторы ре
сурсов URL (англ. Uniform Resource Locator).
Такие URL-локаторы
сочетают в себе технологию идентификации URI
и систему доменных имён DNS (англ. Domain
Name System) - доменное имя (или
непосредственно IP-адрес в числовой записи)
входит в состав URL
для обозначения компьютера (точнее
- одного из его сетевых интерфейсов),
который исполняет код нужного веб-сервера.

Поиск по ключевым словам
Большинство поисковых
машин имеют возможность
поиска по ключевым словам.
Это один из самых
распространенных видов
поиска. Для поиска по
ключевым словам необходимо
ввести в специальном окне
слово или несколько слов,
которые следует искать, и
щелкнуть на кнопке Поиск.
Поисковая система найдет в
своей базе и покажет
документы, содержащие эти
слова.
Для того чтобы сделать поиск
более продуктивным, во всех
поисковых системах
существует специальный язык
формирования запросов со
своим синтаксисом.

Использование ключевых фраз

Правила и советы при подборе
ключевых фраз:
каждая ключевая фраза не более 5-ти
слов, включая союзы и предлоги;
в словах допустимы только буквы,
цифры и знак «-» ;
общая длина поля ключевых слов
ограничена 4096 знаками;
подбираем максимально «широкие»
в использовании фразы – лучше
короткие, что бы было больше
вариантов для использования с
другими словами;
единственное или множественное
число не имеет значения – выбираем
что-то одно;
падеж не имеет значения – выбираем
один из вариантов;
однокоренные глагол,
существительное или прилагательное
– это разные ключевые слова.

Поиск по ключевым фразам

Поиск ключевой фразы для микро-сайта
я начинаю с использования
программы Market Samurai. На мой
взгляд, такой подход к поиску и анализу
ключевой фразы является наиболее
продуктивным для микро-сайта. Не
следует забывать, что микро-сайт
оптимизируется под одну единственную
ключевую фразу. В дальнейшем, с
развитием микро-сайта, возможно
использование и других ключевых слов.
Market Samurai дает не совсем точную
картину по выбранному ключу, однако,
для поиска и анализа необходимой
информации эта программа более, чем
подходит.
В подкасте я рассказываю о конкретном
применении Market Samurai для
определения ключевой фразы.
Анализируются основные
характеристики ключевых слов,
производится оценка конкурентов и
возможность выхода в топ-выдачу
Google.

Комбинации условия поиска

Допускается создание запросов,
включающих произвольное количество
условий поиска, которые связываются
любым числом операторов AND и OR.
Запрос, содержащий комбинацию
предложений AND и OR, может стать
достаточно сложным. Поэтому полезно
представить себе, как такие запросы
интерпретируются при их выполнении и
как они выглядят в режиме
конструктора и в окне режима SQL.
Для наглядности в дальнейшем
обсуждении предположим, что идет
работа с таблицей employee,
содержащей
столбцы hire_date, job_lvl и status. В
примерах предполагается, что требуется
получить информацию, как долго
сотрудник работал в компании (т.е.
узнать его дату найма), какую работу он
выполнял (уровень его
ответственности), а также его статус
(например, выход на пенсию).

Комбинации условия поиска

Плагин "Поиск Комбинаций" (SearchComb)
предназначен для поиска комбинаций в
истории тиражей, удовлетворяющих тем
или иным условиям.
Вверху задается диапазон учитываемых в
поиске тиражей (все тиражи, последние
или выборочно с.. по...). Кнопки
сохранения настроек и загрузки их.
Первая вкладка "Поиск комбинаций"
предназначена для поиска в истории
тиражей таких комбинаций, которые
полностью (т.е. совпали все числа
комбинации с тем или иным тиражем)
совпадали на протяжении анализируемой
истории лотереи заданное число раз (или
более). Например, на скриншоте выведены
в таблицу комбинации длиной в 10 чисел,
которые совпали со всеми тиражами
лотереи Кено 20 из 80 (Украинская УНЛ)
более трех раз. В нижней таблице
выводятся найденные комбинации, в
верхней, при позиционировании на какойлибо строке нижней, тиражи, в которых
было найдено полное совпадение данной
комбинации.

Комбинации условия поиска

Следует иметь в виду, что при некоторых
условиях расчет, а особенно вывод в таблицу,
могут занимать длительное время. Так
например, миллион шестерок, выпадавших
более 2-х раз за 3500 тиражей лотереи "Кено
20 из 80" (Украинская Национальная
Лотерея), выводится на двухядерном
Пентиуме 2.53 МГц примерно за три минуты
(при том что расчет занимает полминуты). Но
при этом программа начинает потреблять
много памяти, и при нехватке оной возможно
аварийное прекращение работы функции (не
программы, а только данного расчета) по
исключению OutOfMemoryException. В целях
исключения такой ситуации в программе
имеется параметр, ограничивающий число
расчитываемых комбинаций. По-умолчанию
он установлен в 500 000 записей (в конечном
счете их может оказаться и меньше после
дополнительной обработки). Если же у вас
оперативной памяти достаточно и так
необходимо получить несколько миллионов
комбинаций (хотя и непонятна цель этого), в
конфигурационном файле плагина (например,
SearchComb_20x80.pcfg) можно задать
требуемое значение параметра
ResultLengthLimit.

Практическая работа 24-25

Программные поисковые сервисы. Использование ключевых слов, фраз для поиска информации. Комбинации условия поиска. Пример поиска информации на государственных образовательных порталах.

Цель работы. Изучение способов поиска информации в сети Интернет.

Изучить основные понятия поиска информации Выполнить поиск информационного объекта в сети Интернет Ответить на контрольные вопросы

Краткие сведения

Поиск информации - задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов, потенциально доступных одному человеку, были выработаны все более изощренные и совершенные поисковые средства и приемы, позволяющие найти необходимый документ. Обширные возможности для работы с большими массивами информации дают поисковые сервисы Interner.

При наличии первичных сведений по теме поиска, документы можно разыскивать поисковых системах. При этом следует различать приемы простого, расширенного, контекстного и специального поиска.

Под простым поиском понимается поиск Web-ресурсов по одному или нескольким ключевым словам. Недостаток простого поиска заключается в том, что обычно он выдает слишком много документов, среди которых трудно выбрать наиболее подходящие.

При использовании расширенного поиска ключевые слова связывают между собой операторами логических отношений. Расширенный поиск применяют в тех случаях, когда приемы простого поиска дают слишком много результатов. С помощью логических отношений поисковое задание формируют так, чтобы более точно детализировать задание и ограничить область отбора, например по дате публикации или типу данных.


Контекстный поиск – это поиск по точной фразе. Он удобен для реферативного поиска информации, но доступен далеко не во всех поисковых системах. Прежде всего, чтобы обеспечивать такую возможность, система должна работать не только индексированными файлами, но и с полноценными образами Web-страниц. Эта операция достаточно медленная, и ее выполняют не все поисковые системы.

Специальный поиск применяют при розыске Web-страниц, содержащих ссылки на заданные адреса URL, содержащих заданные данные в служебных полях, например в поле заголовка и т. п.

Расширенный поиск. Кроме средства простого поиска обычно поисковые службы предоставляют средства расширенного поиска. Эти средства позволяют более точно формулировать поисковое задание, но требуют определенного опыта и работают заметно медленнее. В большинстве поисковых систем команды расширенного поиска формируются с помощью логических команд. Удобство использования логических команд в частности связано с тем, что команды простого поиска у многих поисковых систем реализованы по-разному. Каждая система стремится сделать средства простого поиска наиболее удобными, а средства расширенного поиска – наиболее стандартными. Тем не менее, для обозначения логических операторов в различных поисковых системах используются разные обозначения. Поэтому желательно перед осуществлением расширенного поиска желательно изучить синтаксис поисковых запросов выбранной поисковой системы.

Рассмотрим подробнее операторы логических отношений (логические команды).

Логическая оператор OR (ИЛИ) служит для формирования поискового запроса, если искомый текст должен содержать хотя бы один из терминов, соединенных данным оператором. Этот оператор в различных поисковых системах может обозначаться одним из следующих способов: | ; OR; ИЛИ.

Например, результат запроса «Чёрное OR море» - будет представлен списком ссылок на документы, в которых есть слово «Чёрное», или слово «море», или оба этих слова вместе.

В некоторых поисковых системах, как отмечалось выше, по умолчанию ключевые слова в запросе связаны именно этим логическим отношением.

С помощью логического оператора AND (И) осуществляется поиск документов, содержащих все термины, соединенные данным оператором. Этот оператор может обозначаться одним из следующих способов: +; AND; &; И.

Например, по запросу – «Чёрное AND море» - будут найдены документы, в которых содержатся слова «черное» и «море».

Логической оператор NOT (HE) позволяет производить поиск документов, в тексте которых отсутствуют термины, следующие за данным оператором. Этот оператор может обозначаться одним из следующих способов: not; !; ~; НЕ.

Например, по запросу – «Чёрное NOT море», результат - документы, в которых есть слово «Чёрное» и нет слова «море».

С помощью логических операций можно создавать достаточно сложные запросы. Запрос из нескольких слов, перемежающихся операторами, будет истолкован в соответствии с их приоритетом. Операторы AND и NOT традиционно имеют более высокий приоритет, поэтому запрос из нескольких слов при обработке сначала группируется по операторам AND и NOT, и лишь потом по операторам OR. Например, по запросу «Чёрное AND море OR Крым» будут найдены документы, либо содержащие обязательно слова: «Чёрное» и «море», либо слово «Крым», либо все три слова.


Изменить порядок группировки можно использованием скобок. Оператор, стоящий в скобках, будет выполняться в первую очередь Использование скобок позволяет строить вложенные запросы и передавать их операторам в качестве аргументов. Так по запросу «Чёрное AND (море OR Крым)» будут найдены документы, в которых обязательно содержится слово «Чёрное» и одно из двух слов «море» или «Крым».

С помощью вложенных запросов можно значительно ограничивать область отбора, освобождая результирующий список от ненужных ссылок. Так, например, если нас интересует информация об отдыхе на юге на море, но исключительно на российском побережье, то можно попробовать использовать примерно такой запрос – «отдых AND ((Азовское OR Чёрное) AND море) NOT (Крым OR Турция OR Болгария)».

Использование круглых скобок для управления порядком исполнения задания на поиск разрешается большинством крупнейших поисковых систем.

Расширенный поиск yandex. ru

Оператор

Описание

Обнаруживает точные слова в кавычках или фразы

Найти любое из слов. Достаточно поставить между словами символ |, и вы получите страницы, где содержится хоть одно из слов запроса.

Исключает страницы, содержащие слово или фразу.

Вы можете строить сколь угодно сложные конструкции, подставляя в каждом из операторов вместо отдельного слова целые выражения. Чтобы Яндекс при этом правильно понимал вас, заключайте выражения в круглые скобки.

Ограничить поиск страницами, где слова запроса находятся в пределах предложения

Если вам нужны документы, где присутствуют заданные слова — неважно, на каком расстоянии и в каком порядке — соедините их оператором

Слова с большой и маленькой буквы считаются разными формами одного слова, поэтому все равно, какой регистр использовать в запросе. Исключением является оператор точной формы. Это полезно, если искомое имя собственное совпадает с распространенным словосочетанием, например, группа! Черный кофе.
Все слова, которые вы приводите в запросе, по умолчанию ищутся с учетом морфологии . Чтобы отключить ее, используйте оператор! перед словом (без пробела).

Вы можете указать максимально допустимое расстояние между двумя любыми словами запроса, поставив после первого слова символ /, сразу за которым идет число, означающее расстояние.

Замена части слова. Журналист*

Замена любого символа. Журналистик?

Расширенный поиск rambler. ru

Оператор

Описание

Используется для включения общих слов

Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они встретились в запросе. Таким образом, двойные кавычки можно использовать и просто для поиска слова в заданной форме (по умолчанию слова находятся во всех формах).

Оператор NOT позволяет сформировать запрос, которому отвечают документы, удовлетворяющие левой части запроса и не удовлетворяющие правой. Так, результатом поиска по запросу собака NOT кошка будут все документы, в которых есть слово "собака" и нет слова "кошка".
Это особенно полезно в случаях, если искомая словоформа является одновременно формой другого слова: Женя - имя собственное, а также деепричастие . Если мы ищем именно человека по имени Женя, в запросе можно написать Женя NOT женить.

Два запроса, соединенные оператором &&, образуют сложный запрос, которому удовлетворяют только те документы, которые одновременно удовлетворяют обоим этим запросам. Иными словами, по запросу собака && кошка найдутся только те документы, которые содержат и слово "собака", и слово "кошка".

Сложному запросу, состоящему из двух запросов, соединенных оператором ||, удовлетворяют все документы, удовлетворяющие хотя бы одному из этих двух запросов. По запросу собака || кошка найдутся документы, в которых есть хотя бы одно из двух слов - слово "собака" или слово "кошка" (или оба эти слова вместе).

Использование скобок позволяет строить вложенные запросы и передавать их операторам в качестве аргументов, а также перекрывать приоритеты операторов, принятые по умолчанию.

Организация специального поиска. С помощью средств специального поиска можно осуществлять поиск документов: содержащих искомые данные в различных полях (заголовке, ключевых словах, описании); расположенных на каком-либо сайте; содержащих те или иные ссылки и т. п. Рассмотрим подробнее некоторые возможности специального поиска.

Многие поисковые системы позволяют разыскивать Web-документы по тексту, содержащемуся в заголовках. Поиск по заголовкам существенно уменьшает количество найденных ссылок, но очень точно выводит на нужные материалы. Ведь каждая Web-страница может иметь заголовок, если её автор не поленился его создать. И заголовок Web-страницы обычно точно характеризует тему материала, который содержится на ней.

Например, если вам нужна информация о дистанционном обучении, то целесообразно искать страницы, в которых это сочетание присутствует в заголовке. Таким образом, в отличие от простого запроса мы отсекаем те документы, где эти слова не являются значимыми, т. е. не определяют тему статьи.

Оператором или командой такого поиска является title, Этот оператор может обозначаться одним из следующих способов: title:, t:, title =, $title и т. п. После оператора следую ключевые слова. В некоторых поисковых системах ключевые слова следует заключать в скобки, в других они пишутся без скобок. Например, в Яndех команда поиска в заголовке записывается так: $title (очное обучение).

Поиск по сайту. С помощью поисковых систем можно осуществлять поиск информации не во всем Web пространстве, а на каком то конкретном сайте (если конечно последний проиндексирован поисковой системой). Соответствующий оператор может обозначаться следующим одним из следующих способов: url=, url:, u:, #url=". Далее следует адрес Web-узла, некоторые системы требуют заключения адреса в кавычки.

Если в запросе просто записать данный оператор с адресом какого-либо Web-узла, то будет получен список документов, проиндексированных поисковой системой на данном сайте. Но этот оператор можно комбинировать с другими, тем самым, осуществляя поиск информации по всем правилам построения запросов на данном сайте. Например, если мы хотим найти информацию об очном обучении на сайте БелГУ, то запрос в поисковой системе Апорт будет выглядеть следующим способом: URL=http://www. bsu. edu. ru + “очное обучение”.

Кроме того, поисковые системы могут предлагать другие возможности специального поиска: поиск по тексту ссылок, поиск в описании документа, поиск в списке ключевых слов Web-страниц, поиск по подписям к рисункам и т. п. Следует знать, что синтаксис поисковых запросов, да и состав доступных операторов, отличается в различных поисковых указателях. Поэтому перед осуществлением поиска в той или иной поисковой системе, следует изучить страницу справки по поиску в данной системе.

Специальный поиск aport. ru

Оператор

Описание

Указанное после равенства слово или конструкция в круглых скобках должны искаться в заголовках документов (перед круглыми скобками знак равенства можно опускать). По запросу title=(папа или мама) будут найдены документы, содержащие в заголовке слово папа или слово мама, или оба слова одновременно.

Указанное после равенства слово или конструкция в круглых скобках должны искаться в тексте ссылок. По запросу anchor=(ненавижу Интернет) будут найдены документы, в тексте ссылок на которые, встречаются оба слова: ненавидеть и Интернет.

Указанное после равенства слово или конструкция в круглых скобках должны искаться только в обычном тексте. По умолчанию слова запроса ищутся как в тексте, так и во всех указанных выше полях. Чтобы искать только по тексту, выдаваемому в основное окно браузера, следует использовать данный оператор. По запросу text=(оглавление или содержание) будут найдены документы, в которых любое из указанных слов встречается в пределах основного текста документа.

Задание к работе

Задание 1. Выполнить поиск информационного объекта в тексте документа в текстовом процессоре Microsoft Word.

Порядок работы

Запустить на выполнение текстовый процессор Microsoft Word и открыть документ, в котором будет выполняться поиск фразы. Выполнить команду Правка-Найти и указать искомый текст

Задание 2. Выполнить поиск информационного объекта с расширением PDF в файловых структурах диска D:

Порядок работы

В операционной системе Windows выполнить команду Пуск – Поиск Указать искомый объект *.PDF Указать место поиска – локальный диск D:

Задание 3. Выполнить поиск информационного объекта в сети Интернет

Порядок работы

Произведите простой поиск информации по ключевым словам «информационные технологии » в поисковых указателях Яndex (http://www. yandex. ru), rambler (http://www. rambler. ru), АПОРТ (http://www. aport. ru). Результаты поиска по каждой поисковой системе запишите в отчёт. Осуществите контекстный поиск (поиск по точной фразе) информации в поисковой машине rambler по ключевым словам «информационные технологии». В файл отчета запишите запрос, удовлетворяющий данному условию и результат выполнения запроса в rambler. Выполните поиск информации в поисковой машине Aport по ключевым словам «информационные технологии», но с помощью операторов расстояния задайте поиск так, чтобы слова «информационные» «технологии» стояли рядом. Используя любую поисковую систему, найдите материал, который помог бы Вам ответит на следующие вопросы:

1. Сколько медалей было завоевано российскими спортсменами на летней олимпиаде 2012 года в Лондоне?

2. Годы царствования Петра I.

Выполните поиск документов, в которых ключевые слова «информационные технологии» находятся в заголовке. В файл отчета запишите запрос, удовлетворяющий данному условию и результат выполнения запроса в Яndex. Перейдите на сайт по адресу http://www. edu. ru/. В разделе учреждения выполните поиск информации о вашем техникуме. Запишите последовательность поиска в файл отчета.

Контрольные вопросы

Обязательная часть

Перечислите известные вам поисковые машины. Для чего в некоторых поисковых системах используется расширенный поиск? Каким логическим оператором связаны ключевые слова в простом запросе в рассмотренных поисковых машинах? Как в поисковой машине Яndex осуществить поиск точной формы слов? Какие области поиска можно определить в Яndex? Как в Яndex указать расстояние между ключевыми словами?

Дополнительная часть

Что обозначает двойное & (&&) в запросе Яndex? Как правильно в запросе Яndex поставить знаки «+» и «–» ? Как в поисковых машинах осуществить поиск по точной фразе? Для чего используются скобки в запросах? Что обозначает двойное | (||) в запросе Rambler? Как выполнить поиск фразы к заголовке в Aport?

Поиск информации с использованием
компьютера.
Программные поисковые серверы.
Использование ключевых слов, фраз для
поиска информации.
Комбинации условия поиска.

Поиск информации с использованием компьютера

После некоторого времени работы за
компьютером, вы обнаружите, что не
всегда можете вспомнить место, где
расположен тот или иной нужный вам
документ. В таком случае вам следует
воспользоваться средствами поиска
информации, включенными в
операционную систему. При этом
следует помнить, что для успешного
поиска файла необходимо правильно
указать критерии поиска.
В общем случае поиск информации в
Linux Ubuntu удобно проводить,
выбрав команду главного меню Искать
файлы из меню Стандартные. С их
помощью вы можете задать критерии
поиска и дать команду начала
процедуры поиска нужного файла.
Если пользователь не помнит названия
файла, но знает содержимое,
используется дополнительные
параметры поиска.

Поиск информации в сети Интернет

С каждым годом объемы Интернета
увеличиваются в разы, поэтому вероятность найти
необходимую информацию резко возрастает.
Интернет объединяет миллионы компьютеров,
множество разных сетей, число пользователей
увеличивается на 15-80% ежегодно. И, тем не
менее, все чаще при обращении к Интернет
основной проблемой оказывается не отсутствие
искомой информации, а возможность ее найти.
Как правило, обычный человек в силу разных
обстоятельств не может или не хочет тратить на
поиск нужного ему ответа больше 15-20 минут.
Поэтому особенно актуально правильно и
грамотно научиться, казалось бы, простой вещи –
где и как искать, чтобы получать ЖЕЛАЕМЫЕ
ответы.
Чтобы найти нужную информацию, необходимо
найти её адрес. Для этого существуют
специализированные поисковые сервера (роботы
индексов (поисковые системы), тематические
Интернет-каталоги, системы мета-поиска, службы
поиска людей и т.д.). В данном мастер-классе
раскрываются основные технологии поиска
информации в Интернет, предоставляются общие
черты поисковых инструментов, рассматриваются
структуры поисковых запросов для наиболее
популярных русскоязычных и англоязычных
поисковых систем.

Пограммные поисковые серверы

Основу, «каркас» Internet составляют около 300
миллионов серверов (Netcraft, март 2011),
постоянно подключенных к сети. К серверам Internet
могут подключаться сотни миллионов пользователей Inter
net (2 млрд. генсек Международного союза электросвязи ООН 27
января 2011).
Сеìрвер (англ. server от англ. to serve - служить)
(множественное число сеìрверы)
- в информационных технологиях - программный комп
онент вычислительной системы,
выполняющий сервисные (обслуживающие)
функции по запросу клиента,
предоставляя ему доступ к определённым ресурсам или у
слугам. Как правило,
каждый сервер обслуживает один (или несколько схожих)
протоколов и серверы можно классифицировать по типу у
слуг которые они предоставляют.
Файл-серверы
представляют собой серверы для обеспечения доступа к
файлам на диске сервера.
Прежде всего это серверы передачи файлов по заказу,
по протоколам FTP, TFTP, SFTP и HTTP. Протокол HTTP
ориентирован на передачу текстовых файлов,
но серверы могут отдавать в качестве запрошенных файл
ов и произвольные данные,
например динамически созданные веб-страницы,
картинки, музыку и т. п.
На ноябрь 2009
года двумя наиболее распространёнными веб-серверами,
вместе занимающими около 68 % рынка, являются:
Apache - свободный веб-сервер,
наиболее часто используемый в Unix-подобных
операционных системах;
IIS от компании Microsoft,
распространяемый с ОС семейства Windows NT.

Назначение WEB

Веб-сервер является программой,
запускаемой на подключённом к сети компьюте
ре и использующей протокол HTTP
для передачи данных.
В простейшем виде такая программа получает п
о сети HTTP-запрос на определённый ресурс,
находит соответствующий файл на локальном ж
ёстком диске и отправляет его по сети запросив
шему компьютеру. Более сложные веб-серверы
способны динамически распределять ресурсы в
ответ на HTTP-запрос.
Для идентификации ресурсов (зачастую
файлов или их частей)
во Всемирной паутине используются единообра
зные идентификаторы ресурсов URI (англ.
Uniform Resource Identifier).
Для определения местонахождения ресурсов в
сети используются единообразные локаторы ре
сурсов URL (англ. Uniform Resource Locator).
Такие URL-локаторы
сочетают в себе технологию идентификации URI
и систему доменных имён DNS (англ. Domain
Name System) - доменное имя (или
непосредственно IP-адрес в числовой записи)
входит в состав URL
для обозначения компьютера (точнее
- одного из его сетевых интерфейсов),
который исполняет код нужного веб-сервера.

Поиск по ключевым словам
Большинство поисковых
машин имеют возможность
поиска по ключевым словам.
Это один из самых
распространенных видов
поиска. Для поиска по
ключевым словам необходимо
ввести в специальном окне
слово или несколько слов,
которые следует искать, и
щелкнуть на кнопке Поиск.
Поисковая система найдет в
своей базе и покажет
документы, содержащие эти
слова.
Для того чтобы сделать поиск
более продуктивным, во всех
поисковых системах
существует специальный язык
формирования запросов со
своим синтаксисом.

Использование ключевых фраз

Правила и советы при подборе
ключевых фраз:
каждая ключевая фраза не более 5-ти
слов, включая союзы и предлоги;
в словах допустимы только буквы,
цифры и знак «-» ;
общая длина поля ключевых слов
ограничена 4096 знаками;
подбираем максимально «широкие»
в использовании фразы – лучше
короткие, что бы было больше
вариантов для использования с
другими словами;
единственное или множественное
число не имеет значения – выбираем
что-то одно;
падеж не имеет значения – выбираем
один из вариантов;
однокоренные глагол,
существительное или прилагательное
– это разные ключевые слова.

Поиск по ключевым фразам

Поиск ключевой фразы для микро-сайта
я начинаю с использования
программы Market Samurai. На мой
взгляд, такой подход к поиску и анализу
ключевой фразы является наиболее
продуктивным для микро-сайта. Не
следует забывать, что микро-сайт
оптимизируется под одну единственную
ключевую фразу. В дальнейшем, с
развитием микро-сайта, возможно
использование и других ключевых слов.
Market Samurai дает не совсем точную
картину по выбранному ключу, однако,
для поиска и анализа необходимой
информации эта программа более, чем
подходит.
В подкасте я рассказываю о конкретном
применении Market Samurai для
определения ключевой фразы.
Анализируются основные
характеристики ключевых слов,
производится оценка конкурентов и
возможность выхода в топ-выдачу
Google.

Комбинации условия поиска

Допускается создание запросов,
включающих произвольное количество
условий поиска, которые связываются
любым числом операторов AND и OR.
Запрос, содержащий комбинацию
предложений AND и OR, может стать
достаточно сложным. Поэтому полезно
представить себе, как такие запросы
интерпретируются при их выполнении и
как они выглядят в режиме
конструктора и в окне режима SQL.
Для наглядности в дальнейшем
обсуждении предположим, что идет
работа с таблицей employee,
содержащей
столбцы hire_date, job_lvl и status. В
примерах предполагается, что требуется
получить информацию, как долго
сотрудник работал в компании (т.е.
узнать его дату найма), какую работу он
выполнял (уровень его
ответственности), а также его статус
(например, выход на пенсию).

10. Комбинации условия поиска

Плагин "Поиск Комбинаций" (SearchComb)
предназначен для поиска комбинаций в
истории тиражей, удовлетворяющих тем
или иным условиям.
Вверху задается диапазон учитываемых в
поиске тиражей (все тиражи, последние
или выборочно с.. по...). Кнопки
сохранения настроек и загрузки их.
Первая вкладка "Поиск комбинаций"
предназначена для поиска в истории
тиражей таких комбинаций, которые
полностью (т.е. совпали все числа
комбинации с тем или иным тиражем)
совпадали на протяжении анализируемой
истории лотереи заданное число раз (или
более). Например, на скриншоте выведены
в таблицу комбинации длиной в 10 чисел,
которые совпали со всеми тиражами
лотереи Кено 20 из 80 (Украинская УНЛ)
более трех раз. В нижней таблице
выводятся найденные комбинации, в
верхней, при позиционировании на какойлибо строке нижней, тиражи, в которых
было найдено полное совпадение данной
комбинации.

11. Комбинации условия поиска

Следует иметь в виду, что при некоторых
условиях расчет, а особенно вывод в таблицу,
могут занимать длительное время. Так
например, миллион шестерок, выпадавших
более 2-х раз за 3500 тиражей лотереи "Кено
20 из 80" (Украинская Национальная
Лотерея), выводится на двухядерном
Пентиуме 2.53 МГц примерно за три минуты
(при том что расчет занимает полминуты). Но
при этом программа начинает потреблять
много памяти, и при нехватке оной возможно
аварийное прекращение работы функции (не
программы, а только данного расчета) по
исключению OutOfMemoryException. В целях
исключения такой ситуации в программе
имеется параметр, ограничивающий число
расчитываемых комбинаций. По-умолчанию
он установлен в 500 000 записей (в конечном
счете их может оказаться и меньше после
дополнительной обработки). Если же у вас
оперативной памяти достаточно и так
необходимо получить несколько миллионов
комбинаций (хотя и непонятна цель этого), в
конфигурационном файле плагина (например,
SearchComb_20x80.pcfg) можно задать
требуемое значение параметра
ResultLengthLimit.