Принципы поисковых систем. Поисковые системы в Интернете


Опубликованно 10.08.2018 16:42

Принципы поисковых систем. Поисковые системы в Интернете

В Интернете, на различных сайтах пользователю предлагается большое количество различной информации. Чтобы получить необходимую информацию, находить ответы на вопросы, созданные поисковыми системами. Услышав эту фразу, многие думают о Google, "Яндекс". Однако, поисковых систем в Интернете намного больше. Что такое поисковая система

Поисковая система считается программное обеспечение, состоящее из базы данных документов. Пользователям предоставляется специальный интерфейс, который позволяет вводить нужные запросы и получить ссылки на соответствующую информацию. На первой позиции в поиске всегда результаты приходят из документов, относящихся к тому, что ищу конкретного человека.

Результаты поиска, которая формируется в соответствии с введенным запросом, как правило, содержит различные типы результатов. Там может быть интернет-страниц, видео и аудио файлы, изображения, PDF-файлы конкретных продуктов (если поиск осуществляется в интернет-магазине).

Классификация поисковых системах

Существующие поисковые системы подразделяются на несколько типов. Первая называется традиционных поисковых систем. Эти поисковые системы принципы работы сосредоточены на поиске информации на огромное количество существующих сайтов. Поисковые системы все еще находятся на отдельных Интернет-ресурсах: в интернет-магазинах (поиск необходимого товара); на форумах и в блогах (Найти сообщения); на веб-сайте (для статей на нужные темы или новости) и т. д.

Системы делятся по географическому признаку. В этой классификации существует 3 группы поисковиков: Глобальные. Поиск осуществляется по всему миру. Лидером в этой группе является поисковая система Google. Раньше были такие поисковики, как и inktomi, Altavista, и т. д. Региональные. Поиск осуществляется страна или группа стран, Объединенных одним языком. Региональные поисковые системы получили широкое распространение. Их пример в России – Яндекс, Рамблер. Местные. Поиск по конкретному городу. Примером такой поисковой системы – "Tomsk.ru". Элементы поисковых систем

В любом поисковике можно разделить на 3 основ, определяющих принципы работы поисковых систем: робот (краулер, Спайдер, индексатор); базы данных; обработчик запросов.

Робот-это специальная программа, целью которой является формирование базы данных. В база данных хранит и сортирует информацию. Обработчик запросов, также называемый клиент, работает с пользовательскими запросами. Он имеет доступ к базе данных. Не всегда у клиента на одном компьютере. Обработчик запросов распределяется на несколько физически неэлектронные вычислительные машины.

Принципы поисковых систем

Все существующие системы работают по тому же принципу. Рассмотрим, например, работу традиционных поисковых систем, предназначенных для Интернета. Работа робота схож с действием обычного пользователя. Эта программа периодически проходит через все сайты, добавление новых страниц и интернет-ресурсов в базе данных. Этот процесс называется индексированием.

Когда пользователь в Интернете в строку поиска вводит определенный запрос, начинается работа с клиентом. Программа обращается к существующей базе данных и ключевые слова формируют результаты. Ссылок поисковая система предоставляет пользователю в определенной последовательности. Они сортируются как соответствующий запрос, т. е. считаются актуальными.

У каждой поисковой системы свой способ определения релевантности. Если пользователь отправляет определенный запрос в другой системе, он получит не совсем то же самое. Алгоритм определения релевантности держится в секрете.

Подробнее о релевантности

Говоря простыми словами, релевантность-это соответствие, которое вы ввели в поле поиска слово или сочетание слов конкретных ссылок в результатах поиска. Элементы в списке влияет несколько нюансов: Присутствие слова в поиске документов. Этот нюанс очевиден. Если документ содержит слова из введенного пользователем запроса, это означает, что документ соответствует критериям поиска. Частота вхождения слов. Наиболее часто используемые ключевые слова в документе, тем он будет выше в списке выдачи. Однако, это не так просто. Слишком частое употребление слова может быть признаком плохого качества контента для поисковых систем.

Алгоритм определения релевантности достаточно сложная. Несколько лет назад в результате можно получить ссылки, которые содержат соответствующие ключевые слова, но не соответствующие им по содержанию. На данный момент, принципов работы поисковых систем достаточно сложна. Теперь роботы могут анализировать весь текст. В работе поисковых систем заложены с учетом огромного количества различных факторов. Благодаря этому, результаты формируются самого высокого качества, соответствующие ссылки. Как формулировать запросы

В школе нас учили, как правильно задавать вопросы. Зависит от того, какие ответы мы получим. Однако, это правило не нужно соблюдать при использовании поисковых систем. Для современных поисковых систем не играет никакой роли в том, что количество или дела пишет человек. В любом случае, результаты будут содержать одинаковые результаты.

Четкая постановка поисковых системах не требуется. Пользователю нужно только выбрать правильные ключевые слова. Рассмотрим пример. Нам нужно найти текст песни "День без тебя", которую исполняет знаменитой женской поп-группы "ВИА Гра". При обращении в поисковике не нужно название группы, свидетельствуют о том, что эта песня. Можно написать "день без тебя текст". Чтобы сохранить регистры, знаки препинания не требуется. Эти нюансы не учитываются поисковыми системами.

Рейтинг поисковых систем в мире

Ведущим поисковиком в мире является Google. Он был основан в 1998 году. Система является очень популярной, о чем свидетельствуют аналитические данные. Около 70% запросов в сети, перерабатывает его в Google. Основной двигатель-огромный. Проиндексировано более 60 трлн. различных документов. Компания Google привлекает пользователей с простым интерфейсом. На главной странице логотип и строку поиска. Эта функция позволяет позвонить в Google одним из самых минималистичных поисковых систем.

На втором месте в рейтинге популярных поисковых систем Бинг. Она появилась в том же году, как Google. Создатель этой поисковой системы является известная Международная корпорация Майкрософт. Более низкие позиции в рейтинге занимают Байду, Яху!, АОЛ, возбуждают, задать.

Что популярно в России

Среди поисковых систем в России наиболее популярен "Яндекс". Этот сервис появился в 1997 году. Первый раз, когда они занимаются российская компания CompTek Международного. Немного позже, компания "Яндекс", которая продолжает заниматься поиском. Поисковая система за эти годы приобрел огромную популярность. Есть возможность поиска на нескольких языках – русский, Белорусский, украинский, татарский, казахский, английский, немецкий, французский, турецкий.

Из статистики известно, что "Яндекс" интересен более 50% пользователей. Более 40 % людей предпочитают Google. Около 3% пользователей выбрали Mail.ru – русскоязычный Интернет-портал.

Защищен поисковых системах

Обычных поисковых систем, которые знакомы нам, не совсем подходит для детей. Молодые пользователи интернета могут случайно найти любые материалы информацию для взрослых, которые могут нанести вред психике. По этой причине мы создали специальный защищенный поисковик. Их базы данных хранить только безопасный контент для детей.

Пример одного такого поисковика "Спутник.Дети". Этот сервис достаточно молодой. Он был создан компанией "Ростелеком" в 2014 году. На главной странице поисковика-это яркий и интересно оформленный. Она представляет собой обширный список отечественных и зарубежных мультфильмов для детей разных возрастов. Кроме того, на главной странице есть информативные ссылки, которые относятся к нескольким темам – "Спорт", "всезнайка", "Сделай сам", "игры", "Технология", "школа", "природа".

Другой пример из поисковых систем защищенной детей – Agakids.ru. Это абсолютно безопасный ресурс. Как работает поисковик? Робот настроен так, что он обходит только те сайты, которые предъявляются к детской тематике или полезны для родителей. Система поиска по базе данных вам ресурсов с мультиками, книги, Учебная литература, игры, раскраски. Родители, используя Agakids.ru можете сами найти сайты для образования, здоровья детей.

В заключение, стоит отметить, что поисковые системы являются сложными системами. Они сталкиваются с множеством проблем – проблемы спама, определяют актуальность документов, отсеивая некачественный контент-анализ документов, которые не содержат текстовую информацию. По этой причине, поисковых систем работа в Интернет разработчики реализуют новые подходы и алгоритмы коммерческую тайну. Автор: Либерта Наталья 10 августа 2018



Категория: Интернет