Поисковые машины

08.04.2014

wpid b1b43dac34f7cc9b35d99238242bebc4 Поисковые машины

Поисковые машины

Поисковые машины постоянно обрабатывают миллионы и миллионы запросов от пользователей сети. Ежеминутно пользователи запрашивают в поисковиках интересующую информацию, отправляя запрос. Поисковые машины совершают невероятные путешествия в пространстве сети. После такого путешествия они возвращаются обратно на свой сервер, чтобы передать ему эту информацию. Там она производится в надлежащий вид и посылается в базу данных, из которой потом её достанет поисковая система. Этот принцип остается неизменным для всех поисковых машин, хотя небольшие отличия всё-таки присутствуют у каждой системы.

Многие знают, что за последнее время в сфере поисковых машин произошли большие изменения в сторону прогресса. Правда, речь не идёт о поиске на локальном диске, так как сейчас этот вид поиска считается самым ужасным. В будущем учёные предполагают такие этапы развития поисковиков как обострение внимания к инструментам анализа социального поведения.

Это обусловлено желанием потребителей получать более релевантную информацию. Также ожидает поворот и в области поисковых машин, которые занимаются поиском специфической информации. В разработке также находится и усовершенствование свойств поисковых машин.

 

Работа поиска

Тексты, придуманные людьми имеют одинаковое строение. Компьютеры могут понять смысл текста и выделять в нём ключевые слова. Для этого нужно взять обычный текст, поместить его в окно анализатора текста, программа начнёт подсчитывать, количество раз повторяющего слова и выведет всё в таблицу, в окне появляются 10 часто встречаемых слов, их можно задать поисковой системе в качестве запроса.

Главной идеей словарного ИПС, является словарь слов, в каждом из которого будет храниться список документов, в которых это слово взято.

Есть два алгоритма работы ИПС – с использованием дескрипторов — документы переводятся на дексрипторный язык, который состоит из слов и символов, и ИПС обрабатывает уже в этой форме, такой подход более затратен, но и более продуктивен и с использованием ключевых слов – используются только те слова, которые встречаются в документе.

31 Поисковые машины

Семантика – это изучение значений. Это позволяет выделят полезную информацию из документов, если компьютер понимает семантику документа, значит он понимает смысл документа.

Семантические технологии Web явялются хорошим способом представления данных в Интернет, это своеобразная база данных, которая связана с хранением документов Интернет. Семантические технологии используют правила, логику.