RSS: подбираем выброшеный контент

27 сентября 2010, 00:11, posted by Zhenek | SEO методы, SEO статьи |

Сегодня я хотел бы рассказать об одной очень легкой теме по получению уникального контента. Как говорят наши коллеги буржуи: «Content is King». Каждому хочется иметь много уникального, полезного и правильного текста, картинок и прочего на своем сайте. Самый правильный с точки зрения этики способ – это писать свои тексты, делать свои фотографии, т.е. создавать что-то свое. Но все мы прекрасно знаем, любим и используем всевозможные заменители этого процесса: генерации, синонимизации, рерайты, копирайты и прочее… Сегодня мы будем просто подбирать выброшенный текст. Текст, который не нужен автору и удален вместе с блогом.

Для примера я хотел бы рассмотреть нашумевший в прошлом в вебмастерских кругах блог одного очень интересного человека (smsm с умаксфорума, если не ошибаюсь). Его блог находился по адресу http://epavel.ru/blog/. Сейчас же там сияет надпись о том, что блог закрыт и все закончилось.

Наша цель – получить старое содержание блога. Его текст и фотки. Многие сразу же скажут – ВебАрхив! Да, согласен, из ВебАрхива часто можно вытащить полезные тексты, но есть «но»:

1. Его обрабатывают в промышленных масштабах.
2. Не всегда есть нужные страницы, а только главная или частично.
3. Работает не для всех сайтов.

Но в нашей схеме мы все же воспользуемся ВебАрхивом, для того чтобы как можно быстрей и точней получить бывший адрес RSS-фида. Идем по адресу http://web.archive.org/, вбиваем адрес нашего пациента epavel.ru/blog и по ссылке http://web.archive.org/web/*/http://epavel.ru/blog получаем доступные копии страниц этого блога.

Перейдя по ссылке http://web.archive.org/web/20080413165303rn_1/epavel.ru/blog/ мы видим копию старого блога и справа находим ссылку на RSS-фид.

А именно http://epavel.ru/blog/feed . Нам повезло. В этом случае мы могли бы найти легко бывший адрес фида всего двумя подстановками domain.com/RSS и domain.com/FEED без помощи вебАрхива. Но очень часто адреса фидов какие-то зашифрованные и длинные и/или используют сторонние сервисы, что делает практически невозможным угадывание адреса фида. Именно поэтому первым делом я рекомендую обращаться к вебархиву за помощью. Получили мы адрес фида. А что дальше? Он же пустой. Для того, чтобы получить содержание RSS-фида (а в данном случае и содержание блога) нам понадобится аккаунт в Google и их сервис Google Reader.

Заходим по адресу http://www.google.com/reader , вводим свой логин и пароль и попадаем внутрь акка (это для тех кто еще не использовал гугл-читалку). И кликаем на кнопку Add a subscription:

Выскочит новое окошко, в которое мы и должны вписать найденный адрес фида и нажать кнопку Add.

Все! Нам сразу начнут поступать все тексты и фотографии из блога за всю историю его существования. Осталось скопировать и вставить куда нужно. Для примера работоспособности данного метода я взял пост датированный Jul 14, 2007 (Акулий Оскал „Блогомонстра”).

Далее я запостил его в сервис бесплатных блогов WordPress. Желающие проверить – добавляем фид, находим этот пост и проверяем в гугле позиции моего блога с этим постом. Итак, в посте есть фразы «Акулий оскал и Сео тусовки», глубокие НЧ, но для наших целей самое то. Сам блог находится по адресу http://rxprulit.wordpress.com/ и на момент написания статьи находится на 5/6 месте в Ru-Google по запросу Акулий Оскал и на первом месте по запросу сео-тусовки.

Резюмируем: мы нашли (подобрали текст), вставили его к себе в сплог/блог/сайт и получили топ/траф. Все. Самое важное найти бывший RSS-фид сайта/блога и просто добавив его в Google – Reader получить содержание. Содержание, которое уже удалено из просторов интернета.

ВАЖНО! Очень часто популярные блоги страдают от разных RSS-агрегаторов, которые забирают текст по RSS и потом берегут его у себя. Перед использованием текста для серьезных целей, всегда проверяйте его в гугле „фразой в кавычках” на наличие дубликатов.

Где же брать источники (доноров) для использования? Я перечислю несколько методов, которые юзал сам:

1. Парсинг RSS-директорий и поиск ошибок. Т.е. если фид добавлен, но сейчас не работает, то есть существует вероятность, что блог удален. Директории можно парсить по необходимой нам теме.
2. Мониторинг Expired доменов с подстановками /RSS /FEED и / или проверкой по ВебАрхиву.
3. Все остальное.

Вот как пример: не так давно был шум вокруг Хронопея и кто-то там, писал что то там на блоге http://chronoplay.livejournal.com/ , потом блог закрыли и этим записями все делились по аськам и личкам как чем то „ВАУ, Ух-ты, дай почитать”. Кто успел делал сейвы, восстанавливал записи из кэша гугла. Но все гораздо проще. Почти все блоги на этой платформе имеют адрес фида http://USERNAME.livejournal.com/data/rss — просто добавьте http://chronoplay.livejournal.com/data/rss в Google Reader и сможете прочитать всю информацию с этого блога.

А вы знаете, что LiveJournal сейчас продает закрытые и удаленные блоги ? http://www.livejournal.com/misc/expunged_list.bml — по этому адреску. Намек понятен? Ну и дальше включаем фантазию подобным образом и находим свои уникальные источники!

Желаю всем успехов и денег! 🙂

Автор статьи: LoNduk.

Теги: RSS, блоги, картинки, текст, уникальный контент

17 комментариев

комментарий by ЪЪЪ - 27.09.2010, 05:18

Что-то подобное рассказывали то ли здесь, то ли на 4сео в закрытом разделе.
Но интересно, спасибо, освежил в памяти )
комментарий by lordtime - 27.09.2010, 09:10

полезная статья, явно тема уже отжата почти полностью 🙂
комментарий by LoNduk - 27.09.2010, 10:06

2 lordtime — в плане отжата? Возьми любой из моих примеров, или придумай свой. Возьми проверь текст в гугле ). посмотри. Ее невозможно отжать. Постоянно будет контент. Ну и также некоторые из знающих эту тему уверены на 1000%, что она не работает и это бред.

Главное — это поиск источников.
комментарий by lalala - 27.09.2010, 12:47

круто! респект!
нереально это отжать думаеца, все равно что говорить «доры умерли» ))
комментарий by ne0zx - 28.09.2010, 00:24

баян, было в мануале джона даже
комментарий by LoNduk - 28.09.2010, 08:25

2 ne0zx — именно эта статья Была? С этими примерами, скринами, о лайвжурнале, с примерами блога в топе? Да? Ну сорри…
баян? Ну что ж. На первой странице ты можешь спокойно найти контакты админа и отправить ему супер-тему небаянистую, красивую, шикарную. С удовльствием почитаю, оценю.
🙂
комментарий by BadNews - 28.09.2010, 22:27

старая тема
комментарий by Sti_Letto - 29.09.2010, 08:45

Идея интересная с точки зрения seo, но с другой стороны как-то не особо… Не проще самому сделать что-то новое и интересное, чем использовать старое? Хотя, здесь тоже варианты могут быть 😉
комментарий by LoNduk - 29.09.2010, 11:42

2 BadNews — получил бек? Молодец.
больничный лист задним числом недорого — в футере веб-студии — это новая, красивая, шикарная тема ). А это да, боян. Согласен.
Есть что-то конкретно — напиши, нет — к чему эти отклики боян? старье? То , что вы слышали об этом в 95 году от бабушки — никак не делает теум менее полезной. конструктивную критику пожалуйста давайте , или хоть чуть чуть аргументов. Иначе ваши полуфразы вообще не понятны к чему

Sti_Letto — не особо, да согласен. Легче всего придумывать идеи типа ютубе, делать их и толкать, или креативить как лебедев, или сразу помереть. Хули, это же легче, приятней, красивей. Не? ЭТО ЛИШЬ МЕТОД. Я его ни с чем не сравниваю, никому не навязываю ).
комментарий by Zhenek - 29.09.2010, 12:12

Парочка комментов от бредовых ников тут проскакивала в теме (я их уже удалил) — просьба не удивляться, так как это мы тут кое-что апдейтили на блоге и тестили. 🙂
комментарий by gor - 30.09.2010, 16:39

Я не понял как перейти по ссылке http://web.archive.org/web/20080413165303rn_1/epavel.ru/blog/ где ее найти?
комментарий by olchik - 1.10.2010, 23:02

Боян притом уже много лет ходит… Умные люди контент всегда через rss и гугл ридер восстанавливали.
комментарий by Racerx - 8.10.2010, 11:15

Мне, кажется, в вебархиве как раз и больше уника хранится, а через RSS хорошие сайты разворовывают пока они еще стоят 😀
комментарий by wsx - 15.10.2010, 07:57

нормальная тема =) вот бы её на автомате выполнять…
комментарий by Юлия - 15.10.2010, 18:07

Читать очень интересно. Подозрения по поводу людей, которые называют баяном — просто не хотят, чтобы у людей была вера в дело и таким образом отбить конкурентов. Автору спасибо, Женьку отдельное, не успокоюсь пока не прочту все статьи на сайте.
комментарий by FubuBy - 13.11.2010, 11:04

пробовал востановить 5-10 фидов с продающихся аков на livejournal — ни один из них не был востановлён googleReader’ом.
комментарий by cоrе01 - 15.06.2011, 12:14

Нормальная тема, если сайт существует более пол года то тогда он появиться в werb.arhive.org…
gor, воспользуйся программой ianalysis чтобы получить эту ссылку

Оставить комментарий

Разделы

Теги

Полезные сайты