?

Log in

No account? Create an account
записи друзья календарь о пользователе Homepage назад назад вперёд вперёд
blogs.yandex.ru - Hook-nosed
sema
blogs.yandex.ru
А вот это — неприятно.
В моем журнале четко стоит настройка "не давать индексировать", которая в частности выливается в <meta name="robots" content="noindex, nofollow, noarchive">, а оно меня таки находит.
Какого?

тэги : ,
Comments
exper From: exper Date: December 22nd, 2004 12:21 pm (UTC) (ссылка)
интересно, как это против вас можно использовать? :)
kukutz From: kukutz Date: December 22nd, 2004 12:39 pm (UTC) (ссылка)
Как ты думаешь, эта галочка как-то протаскивается разработчиками ЖЖ в твой RSS?

Правильно, нет.

Мы писали им про эту проблему — они не ответили.
sema From: sema Date: December 22nd, 2004 12:40 pm (UTC) (ссылка)
Ясно. Но всё равно неприятно :)
kukutz From: kukutz Date: December 22nd, 2004 03:24 pm (UTC) (ссылка)
На всякий случай, чтобы не было недоразумений: я к этому проекту отношения не имею.
sema From: sema Date: December 22nd, 2004 03:25 pm (UTC) (ссылка)
Так я вроде лично и не наезжал :)
piggymouse From: piggymouse Date: December 22nd, 2004 01:35 pm (UTC) (ссылка)
Другой вопрос — а что удерживает Яндех (как и любую другую реализацию) от посылания этих флажков нах? Откомментируй на правах инсайдера. :)
sema From: sema Date: December 22nd, 2004 01:36 pm (UTC) (ссылка)
Насколько я помню, гугл поначалу таки посылал, но потом одумался..
kukutz From: kukutz Date: December 22nd, 2004 02:07 pm (UTC) (ссылка)
А зачем делать людям (таким, как sema) противно?
auto194419 From: auto194419 Date: December 22nd, 2004 03:16 pm (UTC) (ссылка)
проблема, как всегда, в головах. я что, обязан во всех директориях сайта хранить по копии robots.txt?! нет, только в корне. так в "корне моего жж" он и лежит:

http://auto194419.livejournal.com/robots.txt

а хуяндекс на него срёт, и индексирует, фактически,

http://auto194419.livejournal.com/rss/

ну не уроды ли?! ненавижу!!!
kukutz From: kukutz Date: December 22nd, 2004 03:22 pm (UTC) (ссылка)
Где для
http://www.livejournal.com/users/auto194419/data/rss/
который индексирует Яндекс, найти robots.txt?
auto194419 From: auto194419 Date: December 22nd, 2004 03:35 pm (UTC) (ссылка)
они индексируют не какой-то абстрактный сайт, который сами роботы нашли на просторах интернета, а вполне конкретный жж, про который всё прекрасно известно, в том числе - где у него лежат robots.txt (во вполне предсказуемом месте, кстати). но я уже как-то общался с тамошними разработчиками (через завалишина, правда, но сути дела это не меняет), по поводу невероятно неудобного и нелогичного языка запросов, но быстро перестал, т.к. мне откровенно ебали голову.
kukutz From: kukutz Date: December 22nd, 2004 03:39 pm (UTC) (ссылка)
>а вполне конкретный жж, про который всё прекрасно известно, в том числе - где у него лежат robots.txt

Чак, платных пользователей 1.7%.

Заплатили они не Яндексу.

Роботс есть только у них.

Скажи, а зачем Яндексу писать какие-то специальные процедуры для этих людей?

P.S. Anyway, в ближайшее время будут предприняты изыскания специально на этот счёт (не для платников, а для всех), насколько я слышал.
nestor_asa From: nestor_asa Date: December 25th, 2004 08:12 pm (UTC) (ссылка)
Да уж, все с этим Завалишиным окончательно ясно... Я его еще в 1998 году читать перестал, писал интересно - но как человек, он явно страдает звездной больезнью.
auto194419 From: auto194419 Date: December 25th, 2004 10:50 pm (UTC) (ссылка)
это вы к чему? голову мне ебал отнюдь не Завалишин, а уёбки из хуяндекса.
nestor_asa From: nestor_asa Date: December 25th, 2004 11:10 pm (UTC) (ссылка)
Но через Завалишина, или я неправильно понял предыдущий коммент, что вы не с ним (вариант: через него) общались?
auto194419 From: auto194419 Date: December 25th, 2004 11:32 pm (UTC) (ссылка)
через него, но его функция сводилась к получил-переслал.
auto194419 From: auto194419 Date: December 22nd, 2004 02:52 pm (UTC) (ссылка)
не понял - где он тебя нахоит? я вижу только упоминания о тебе в чужих журналах
sema From: sema Date: December 22nd, 2004 03:01 pm (UTC) (ссылка)
публичные записи мои он находит
я пробовал в расширенном поиске ограничить автором и поискать например "лошадь"
auto194419 From: auto194419 Date: December 22nd, 2004 03:06 pm (UTC) (ссылка)
точно! вот пидарасы!!! будем ненавидеть ещё больше.
iseg From: iseg Date: December 27th, 2004 07:51 am (UTC) (ссылка)
Я рад, когда меня ненавидят люди, не способные выразить свою мысль по-русски. Это наполняет мою душу гордостью!
auto194419 From: auto194419 Date: December 27th, 2004 08:29 am (UTC) (ссылка)
ничего, дружок, скоро смеяться буем мы.
iseg From: iseg Date: December 27th, 2004 02:18 am (UTC) (ссылка)
смех, смешанный с грязным матом? это эстетично
iseg From: iseg Date: December 27th, 2004 07:49 am (UTC) (ссылка)
Если ваш блог выдает RSS, значит вы явно выразили желание подвергнуться автоматической обработке: индексированию, репликации, синдикации. Другого смысла в этом формате нет: он создан вашим блогом НЕ ДЛЯ ЛЮДЕЙ, а для роботов.

http://forum.yandex.ru/yandex/improve.xhtml?message_id=1263072

У меня установлено с десяток RSS-ридеров и синдикаторов, в т.ч. с поиском. Локальных и вебовских. Ни один из них НЕ ВЫПОЛНЯЕТ требование пользователей ЖЖ "noarchive", указанное ими в их Html-файлах. Все они ПРЕКРАСНО архивируют (за годы и годы) накопленный у меня RSS постингов пользователей ЖЖ.

относится ко всему Html-документу (замечу, что "и только к нему") со всем ЖЖ-обрамлением. Комбинацию запрета на индекисрвание Html и инейблинга на архивирование, кеширование и индексирование собственно постингов, выраженного в виде раздачи их в виде RSS, формально следует трактовать как закрытие ЖЖ-обвязки от индексации и разрешение на индексацию собственно постингов.

Бред, согласен. Но это ВАШ бред.
sema From: sema Date: January 14th, 2005 05:04 am (UTC) (ссылка)
Я смотрю, справились таки с проблемой?
Вряд ли специально меня удалили из базы?
xodanie67ox From: xodanie67ox Date: December 30th, 2004 03:48 pm (UTC) (ссылка)

Do you speak russian?

Hi i was just owndering if u speak russian becuase i do.
читать[25] | ответить