Портал межсекторного взаимодействия - uZEL.ORG

UZEL.ORG > Инфо > Сайты и порталы Добавить в избранное   Показы баннеров

Яндекс


Справочная информация
Яндекс
Название:Яндекс
Адреса:Москва, ул. Льва Толстого, 16, БЦ Красная Роза
Карта:
Телефоны:+7 (495) 739-22-22, +7 (495) 739-70-00
Факс:+7 (495) 739-70-70, +7 (800) 333-96-39 звонок из регионов России бесплатный
Проезд:м. Парк культуры
Время работы:Круглосуточно
WWW:

Просмотры / в этом месяце: 7791 / 7
Заходы на сайт: 9 / 0

Дополнительная информация


» Полезные сервисы

Виды деятельности:
Сайты и порталы
Реклама

Поисковая система и интернет-портал Yandex.ru (читается как Яндекс.Ру) – это детище одноименной российской ИТ-компании. Как поисковая система, Yandex.ru была зарегистрирована в далеком 1997 году. В то время, впрочем, как и сейчас, основным и приоритетным направлением работы администраторов Яндекс была разработка и совершенствование поискового механизма. Однако за годы существования Yandex.ru превратился в многоплановый портал. Уже по состоянию на 2009 год в системе Яндекс успешно существует более 30 различных сервисов. В том числе, Почта, Картинки, Погода, Новости, Блоги, Фото, а также многие другие.
 
Поисковая система Yandex.ru предоставляет возможность искать в сети Интернет документы на таких языках: русский, украинский, белорусский, казахский, английский, немецкий, французский. При этом учитывается морфология слова, а также близость слов в предложении. 80% аудитории российского сегмента Интернета пользуются системой поиска Яндекс. Для своих пользователей Яндекс создает сервисы, среди которых лидирующими признаны Маркет, Карты, Народ.ру, Пробки и несколько других.
 
Обзор поисковой системы Яндекс. Предыстория и история
 
23 сентября 1997 года на выставке Softool была представлена официально поисковая машина Yandex.Ru. А история компании "Яндекс" началась гораздо раньше еще в 1990 году с разработки поискового программного обеспечения в компании "Аркадия". На тот момент компания занималась разработкой информационно-поисковых систем, которые работали под DOS и позволяли проводить поиск, выбирая слова из заданного словаря, с использованием стандартных логических операторов.
 
В 1993 году "Аркадия" стала подразделением компании CompTek. За последующие два года были усовершенствованны программные технологии поиска. В частности, словарь, обеспечивающий поиск с учетом морфологии русского языка, занимал всего 300Кб, то есть целиком грузился в оперативную память и работал очень быстро. С этого момента пользователь мог задавать в запросе любые формы слов.
В начале 1996 года был разработан алгоритм построения гипотез. Отныне морфологический разбор перестал быть привязан к словарю - если какого-либо слова в словаре нет, то находятся наиболее похожие на него словарные слова и по ним строится модель словоизменения. В это время Интернет в России только начинался...
 
Летом 1996 года руководство CompTek и разработчики поисковой системы пришли к выводу, что развитие самой технологии важнее и интереснее, чем создание прикладных продуктов на базе поиска. Исследования рынка показали своевременность и большие перспективы поисковых технологий. Тогда в Интернете и появился «Яndex».
 
Слово «Яndex» придумал за несколько лет до этого один из основных и старейших разработчиков поискового механизма. «Яndex» означает «Языковой index», или, если по-английски, «Yandex» — «Yet Another indexer». За 4 года публичного существования Яndex возникли и другие толкования. Например, если в слове «Index» перевести с английского первую букву («I» — «Я»), получится «Яndex».
 
Через два месяца, в ноябре 1997 года, был реализован естественно-языковый запрос. Отныне к Yandex.Ru можно обращаться просто «по-русски», задавать длинные запросы.
 
На сегодняшний момент Яндекс является одной из лучших поисковых систем в Рунете и имеет самую большую базу данных. Система построена на кластерной структуре и размещена на достаточно большом количестве серверов. Помимо веб-страниц в формате HTML, Яндекс индексирует документы в форматах
  • PDF (Adobe Acrobat),
  • Rich Text Format (RTF),
  • двоичных форматах Word (.doc),
  • Excel (.xls),
  • PowerPoint (.ppt),
  • Flash (.swf),
  • RSS (блоги и форумы).
С главной страницы доступен простой поиск, позволяющий формулировать запросы на естественном языке. Для гибкости в формировании запросов у данной поисковой машины имеется свой язык запросов (как впрочем практически каждая поисковая машина имеет свой язык запросов на сегодняшний день). Ознакомится с этим языком можно в разделе «Помощь – Язык запросов» на самом Яндексе. Среди возможностей языка запросов - указание расстояния между словами (расстояние в словах, предложениях, абзацах), назначение словам весовых коэффициентов, задание уточняющих выражений, ограничение поиска только фрагментом документа и прочее. Так же имеется логически понятный визуальный «Расширенный поиск» который позволит настроит гибко поисковый запрос.
 
Качество поиска
 
Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. Такие изменения, официально объявленные, происходили, например, в марте 2004 года, августе 2005 года и январе 2007 года; по неофициальным сведениям, их значительно больше (например, в августе-сентябре 2007 года). Крупное изменение произошло в ноябре 2009 года, когда была выложена обновленная версия поисковой программы «Снежинск». Последнее подобное изменение произошло в декабре 2010-го, когда Яндекс внедрил новую поисковую технологию «Спектр» (версия «Краснодар»). Она позволяет учитывать потребности пользователей, которые не были явно сформулированы в запросе. Например, по запросу [бетховен] пользоватям покажут результаты и про биографию композитора, и его музыку, и фильм «Бетховен».
 
В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам (реже — по целым семействам запросов).
 
Основная задача поисковой системы – дать ответ на вопрос пользователя. Когда пользователь задает запрос, поисковая система не обращается к каждому сайту в Интернете, а ищет по базе известных ей страниц – поисковому индексу. Там она находит все страницы со словами из запроса. Ссылки на эти страницы пользователь и видит на страницах результатов поиска.
 
Сейчас вообще уже сложно придумать такой запрос, по которому находится меньше десятка страниц. А по многим запросам результатов поиска - миллионы. И со временем их становится все больше – Интернет очень быстро растет. Поэтому поисковой системе уже недостаточно просто показать все страницы со словами из запроса – чтобы найти подходящий ответ, человеку придется листать десятки страниц с результатами поиска. Поисковая система должна расположить найденные страницы в нужном порядке – так, чтобы сверху оказались наиболее подходящие пользователю (наиболее релевантные).
Когда пользователь смотрит на найденные результаты, у него возникает ощущение – ему нашли и показали примерно то, что он хотел, или примерно не то. Это ощущение и описывает качество поиска с точки зрения пользователя – то есть насколько полезны оказались найденные результаты. У разных людей – разные ощущения, и их не всегда можно сформулировать четко. Для улучшения качества поиска нужно измерять и учитывать все эти ощущения в совокупности.
 
Упорядочивание результатов поиска в соответствии с запросом пользователя называется ранжированием. Именно ранжирование определяет качество поиска – то есть качество ответа на вопрос, заданный в поисковой строке.
 
Результаты поиска выводятся в очень компактной форме, но при этом выводится вся необходимая информация - название и URL документа, размер и кодировка, контекст, дата и время создания. Кроме того, возле каждого результата есть ссылка "найти похожие документы", помогающая уточнить тему поиска.
Поисковый робот (вернее роботы – их несколько) является одним из самых быстрых роботов, его еще в народе называют «Быстробот». После 2-8 часов индексируемые страничке появляются в индексе (в результатах поиска).
 
Поисковая система Яндекс ежедневно индексирует сотни тысяч страниц в Интернете. Для того чтобы поисковик проиндексировал сайт ему необходимо узнать о существовании такового. Существует два способа попадания сайта в базу Яндекса один из них, когда поисковый робот находит ссылки на уже проиндексированных ресурсах на новый сайт и второй способ это вручную добавления сайта через специальную форму AddURL или отправкой письма на адрес addurl@yandex.ru.
 
При ранжирование документов Яндекс предпочитает средние размеры страниц насыщенные текстом и не маловажный фактор уникальным текстом. Для тех, кто знаком с HTML, отметим, что такие мета-теги как keywords и description практически не оказывают влияния в ранжирование документов, однако не стоит все же опускать их применение. Содержание мета-тег должно состоят из слов, которые встречаются в тексте страниц. Важен фактор того, что Яндекс использует мета-тег description для выдачи описания страницы в результатах поиска. Такие мета-теги как revisit-after, content - не учитываются. Важным фактором является текст в заголовке страниц title, а также в тегах (h1-h6). Небольшой вес имеют описания рисунков в ALT.
 
Яндекс одинаково относится как к статическим документам так и к динамическим. Если на сайте имеются странички, которые по той или иной причине не подлежат индексации роботом Яндекса стоит их запретить в файле robots.txt. Как правильно это сделать, а также как запретить куски страницы к индексации вы можете найти в разделе советов веб-мастерам самого Яндекса.
 
Для каждой проиндексированной страницы Яндекс создает ее поисковый образ и сохраняет в поисковой базе. Причем далеко не все страницы сайта. Вернее не все поисковые образы сохраняются в базе индекса. Именно к этим образам мы обращаемся при поиске, т.е. если у сайта нет проиндексированных страниц, то он никогда не будет найден. Просмотреть количество и какие страницы портала Uzel.org проиндексированы и отсортированные по времени можно по такой ссылке http://yandex.ru/yandsearch?surl=www.uzel.org&numdoc=50&rd=0&lr=213&text=&how=tm
 
Яндекс не только индексирует страницы сайтов, но и сохраняет информацию о том, по каким запросам эти страницы и на каких позициях в выдаче находятся, и сколько на них было сделано переходов. Эта информация также используется при ранжировании страниц.
 
Сайты, которые «Яндекс» не индексирует или ограничивает ранжирование:
 
1.        Копирующие или переписывающие информацию с других ресурсов и не создающие оригинального контента.
2.        Единственной целью которых является перенаправление пользователя на другой ресурс, автоматически (редирект) или добровольно.
3.        С автоматически сгенерированным (бессмысленным) текстом.
4.        С каталогами (статей, программ, предприятий и т. п.), если они являются только агрегаторами контента, не создают тексты и описания самостоятельно и не предоставляют никакого уникального сервиса.
5.        С невидимым или слабовидимым текстом или ссылками.
6.        Отдающие разный контент пользователям и роботам поисковых систем (клоакинг).
7.        Предоставляющие товары или информацию по партнёрским программам, но не представляющие никакой ценности для пользователя.
8.        Использующие обманные техники (например, вредоносный код, скрипты, настройки серверов), перенаправляющие пользователей на сторонние ресурсы или меняющие окно результатов поиска на страницы других ресурсов при переходе из поисковых систем.
9.        Содержащие списки поисковых запросов (многократное повторение и перечисление ключевых слов), предназначенные исключительно для обмана поисковой системы и манипулирования результатами её работы, в том числе использование элементов страниц, скрывающих ключевые слова, например, посредством скроллинга или других технических приёмов.
10.     Группы сайтов одного владельца/компании, предоставляющие пользователю одни и те же товары или услуги, созданные с целью заполнения нескольких позиций в результатах поиска и сбора трафика.
11.     Немодерируемые форумы, доски объявлений, содержащие большое количество ссылочного спама.
12.     Ставящие внешние ссылки исключительно для обмана поисковых систем и «накачивания» релевантности и не являющиеся рекомендацией автора посетить ресурс.
13.     Сайты или группы сайтов, интенсивно ссылающиеся друг на друга (линкфармы).
14.     Страницы сайта с результатами поиска.
 
Компания зарегистрирована в России как ООО «Яндекс», акциями которого на 100 % владеет зарегистрированное в Нидерландах акционерное общество Yandex N.V. По словам Аркадия Воложа, решение о создании зарубежной материнской компании было обусловлено нерегулярностями в законодательстве РФ в части акционерных обществ.
 
Основные акционеры Yandex N.V.: Аркадий Волож (19,77 % голосующих акций), Илья Сегалович (4,15 %), фонды Baring Vostok Private Equity Funds (25,97 %), International Finance Corporation (5,51 %), Roth Advisors Ltd. (5,95 %), Tiger Global Holding Cooperatief (2,67 %), «золотая акция» — у Сбербанка[41]. 16,3 % акций находится в свободном обращении на NASDAQ (биржевой тикер NASDAQ: YNDX).
 
По состоянию на 14 февраля 2011 года, согласно рейтингу Alexa.com, по популярности сайт yandex.ru занимает 23 место в мире и 1 место в России.
 
Дата последнего обновления: 18.05.2012
Снять рекламу с этой страницы 100 руб. за год



Порекомендуйте друзьям  
© Код автора: FORM Aдминистратор: Портал Uzel.org Код баннера на эту визитку

Все права защищены
© АПСП 2001-2018