Previous Entry Share Next Entry
Миграция из жж. Как читать ленту друзей через RSS
totoro
spiiin
(Лично мне на политику жж, вообще говоря, пофиг, просто захотел почистить список друзей от мёртвых журналов, сообществ, а также от тех, кто переехал в dreamwidth, чтобы 2 раза их не читать, а через RSS-агрегатор это сделать намного удобней, другого способа получить последие несколько записей из каждого журнала/сообщества я не нашёл).

Но если вы из "переехавших", но хотите читать ленту друзей в живом журнале, вам может пригодиться.

RSS я не пользовался со времён закрытия Google Reader'а, лень было подбирать другую программу. Сейчас взял Inoreader, на первый взгляд он хорош.

Сам ЖЖ утверждает, что экспорт всей ленты друзей доступен только пользователям с подключенным пакетом "профессиональный". Не знаю, что это значит, но по ссылке http://www.livejournal.com/tools/opml.bml?user=<USERNAME> можно скачать файл со списком всех лент друзей в формате opml, который можно импортировать в любую программу по чтению RSS.

Единственное, что мне не понравилось, что в качестве названий блогов жж выдаёт название журнала, в котором большинство пользователей пишут шутки, афоризмы и прочие малопонятные для распознавания журнала вещи, поэтому я прогнал этот файл через такой python-скрипт, который заменяет название журнала на ник пользователя, по которому намного проще узнать журнал:

with open("lj.ompl") as f:
    ll = f.readlines()
 
for l in ll:
  if l.startswith("<outline"):
    for m in re.finditer('<outline text="(?P<t1>.*?)" xmlUrl="http://(?P<t2>[a-zA-Z0-9_\-]+).livejournal.com/data/rss" />', l):
      g1 = m.group('t1')
      g2 = m.group('t2')
      ans.append (l.replace(g1, g2))
 
 with open("lj_fixed.ompl") as f:
    f.writelines(ans)



This entry was originally posted at http://spiiin.dreamwidth.org/104491.html. Please comment there using OpenID.
Tags: ,

?

Log in