developing.ru - клуб программистов


поиск по сайту:

Google



статистика:

Rambler's Top100




А. Шкондин.
about@al.ru

Измерение релевантности. №10

Здравствуйте уважаемые подписчики.
Сегодняшний выпуск будет отличным от других, я бы даже назвал его экстренным, если бы подготовил его несколько пораньше. В общем, этот выпуск будет посвящён дальнейшей судьбе рассылки и сопутствующих товаров :). Во-первых следующие выпуски не будут содержать эти занудные таблицы с цифрами. Самые неленивые из вас уже закачали с сайта рассылки программу Page Analyzer (PAN), при помощи которой я эти таблицы и получал. Те, для кого данные цифры предоставляют интерес, могут поступить точно также. Правда, есть одна неприятность - под столь популярной в нашей стране платформой Win98 я её не тестировал. На моей машине мастдайка конечно стоит, но dialup для тестирования на этом дуршлаге я настраивать не собираюсь - мне хватает головной боли с дырами в NT Server/Workstation...

А теперь внимание - сюрприз номер раз. Всем, кто имеет желание и возможности развивать этот проект дальше, я готов отдать исходники PAN'a. Почти все пожелания по развитию проекта вы сможете найти на нашем форуме. За bugreport'ы и ценные замечания публично выражаю благодарность Александру Садовскому. Если желающие продолжить проект найдутся - не стесняйтесь обращаться, у меня есть ещё пара-тройка личных пожеланий к проекту, которые я если и буду реализовывать, то (увы :( ) только в следующем году (о причинах см. ниже). От себя могу дать совет использовать только идею проекта, и реализовать его на каком либо из диалектов Ц, т.к. разрабатывать htmlparser с нуля задача не из лёгких, а существующие для Дельфи оставляют желать лучшего. Для Ц же можно, например, использовать yacc (для тех кто не вкурсе yacc = yet another compiler of compiler)...

Тут необходимо сделать небольшое отступление. Почти за полгода существования проекта мне не раз приходили письма с просьбой выдавать вместо набора цифр всего одну, которая бы характеризовала релевантность документа. Другими словами предоставить формулу, по которой можно получить эту цифирь. М-да... запрос сродни просьбе о выводе формулы любви, или Общей теории всего. Не надо забывать, что соревнование в релевантности ведётся не с поисковой машиной, а с живыми людьми, которые создают релевантные страницы, не зная этой формулы. Кроме того, поисковые машины регулярно меняют свои алгоритмы определения релевантности. Хотя...

Среди студентов бытует байка, о том, как один злобный профессор никак не мог завалить студента, который на лекции не ходил, конспекты не читал, но, тем не менее, все теоремы доказывал сходу, правильно, но весьма оригинально (кустарными способами). Так вот, отчаявшись в своих попытках завалить одарённого вьюноша, профессор в сердцах бросает фразу - неужели Вы можете доказать всё и вывести любую формулу? На что тут же получает максималистский ответ - любую!
П: (злобно потирая руки) Ну тогда выведите мне формулу бороды! (Надо отметить, что профессор очень гордился своей карломарксовой бородой)
С: (задумавшись на минуту другую) Пожалуйста. борода= бор + ода ~ лес + стих ~ безветрие = безве + трие = (3-в)е, где е - основание натурального логарифма, а в - коэффициент волосатости.

Это я к тому, что мою голову посетила редкая гостья - мысль, о том, как получить формулу бороды (релевантности) для Яндекса. Разумеется, она не будет абсолютно совпадать с той, что используют в поисковике, но, смею надеяться достаточно точная, для того, чтобы помочь вебмастеру вплотную приблизиться к десятке по выбранному ключевому слову, и быть может попасть в неё.

Проницательный читатель уже наверняка заготовил парочку гнилых помидоров и дюжину тухлых яиц для того чтобы кинуть их в меня, после прочтения предыдущих строк. Да, безусловно, такой читатель может реализовать свое право на нашем форуме, но неспроста я до сих пор игнорировал просьбы о включении подобных расчётов в свою программу, потому что отдаю себе отчёт в том, что вывод подобной формулы занятие утопичное. Достаточно представить себе на минуту, что десять человек знают эту формулу, и использовали её при подготовке документа по одному и тому же ключевому слову. Что произойдёт, когда появится одиннадцатый? Правильно, кто-то пролетит как фанера над Парижем, оказавшись на второй странице поиска. Потому что тут-то и вступят в игру те параметры, которые учесть при выводе формулы весьма проблематично. Это может быть и link popularity (индекс цитирования), и ключевые слова, которые были сопоставлены странице при размещении в каталоге (для Яндекса и Апорта) или описание в ТОП100 (для Рамблера), позиция в каталоге и т.д. и т.п. Но я собираюсь провести вывод формулы публично в одной из ближайших рассылок, так что давайте яйцепомидорометание отложим до соответствующего выпуска.

Теперь собственно о рассылке. Начиная со следующего номера, я уже не буду единоличным автором. Дело в том, что вещание с трибуны в режиме монолога очень быстро приводит к "заносам" оратора. Замечательным иллюстративом этого тезиса является Е. Киселёв, который настолько увлёкся своей собственной персоной, что как-то упустил из виду, что его переход (и части команды НТВ) на ТВ6, порождает точно такую же ситуацию на этом канале. И главный редактор ТВ6 со своей командой имеет ровно такое же право перечёркивать логотип канала в эфире надписью "протест" и столь же убедительно говорить о притеснении СМИ и покушении на свободу слова. Так вот, нежелание впадать в подобные крайности является первой причиной, по которой я делюсь своим троном. А второй причиной, и не менее важной, является тот факт, что я всё же решил на законных основаниях получить право писать перед своей фамилией загадочные буковки к-т ф.-м.н. Для рождения диссертации осталось уже меньше 9-ти месяцев, и если я буду выпускать рассылку с той же частотой, то ребёнок рискует не только быть недоношенным, но и вообще не появиться на свет. Итак, сюрприз второй (и вроде бы последний)

Оферта (публичное предложение):

Я, Шкондин Артём Викторович, на правах выпускающего данной рассылки приглашаю к сотрудничеству всех, читающих данные строки. Я предлагаю всем, кому не безразличны проблемы поиска в сети и позиционирования в поисковиках, объединить усилия по ведению рассылки. Гордые имена постоянных авторов будут упоминаться в каждом выпуске рассылки. При желании, авторы могут размещать архив рассылки на своих сайтах. Со своей стороны я обязуюсь писать статьи для рассылки один-два раза в два месяца до конца года, потом чаще. Надеюсь что объяснять преимущества сотрудничества не надо :) Все предложения принимаются по адресу about@al.ru.

В первую очередь я рассчитываю на поддержку Сергея Петренко (aka Gray), Александра Садовского (aka funsad), Алексея Пылаева (aka ех-редактор журнала "Мир Internet"). Если же сотрудничество не сложится, то я гарантирую минимум два выпуска (один про формулу релевантности, один предположительно о клоакинге), а дальше будет видно. Пока же рассылка временно приостановлена до окончания моей сессии, которое случится в середине июня.


С уважением,
Артём (aka AiK)
P.S: aka = also known as, а не нечто обидное, как могли подумать некоторые :)


<< Предыдущая статья | Оглавление | Следующая статья >>