Я написал программу, которая полностью выкачивает журнал/коммьюнити с заданой авторизацией пользователя (исходники здесь https://github.com/tolyan/lj-downloader). Пока что она сохраняет данные в формате лисповских алистов. Думаю до конца недели доделать трансформацию в xml и верефикацию количества комментариев.Для теста выкачал метапрактик под своим аккаунтом. Архив занимает 11 мегабайт. Как сделаю в xml - выложу на своем сервере для скачивания.Теперь вопросы ко всем:- Какие журналы/коммьюнити бэкапить?- В каких форматах кроме xml ещё хочется получить бэкап?(Опционально) В принципе, на основе данной программы можно автоматизировать работу с ЖЖ, например, собирать дайджесты по активным темам в коммьюнити. Если есть запросы/идеи по этому поводу - тоже пишите, по возможности реализую.
Дайджест это хорошо. спасибоКлассно если комменты длинных тредов будет разворачивать все, без исключения.Можно ли настроить прогу, собирать комменты по юзерам и ключевым словам? (Конечно, поиск по блогам рулит, но...)xml потом можно конвертнуть в html, ведь так?
Бэкапить минимум: метапрактикБэкапить максимум: список журналов в заголовке метапрактика.Бэкапить оптимум: метапрактик + буквализм + кусткамера_нлп + ру_емдр + нлп_фтф_фтф_ + пока еще пустой журнал с нашими статьями. Кажется все.
Для теста выкачал метапрактик под своим аккаунтом. Архив занимает 11 мегабайт. Как сделаю в xml - выложу на своем сервере для скачивания.Еще пока не готово? Другие проги коряво качают, многие темы не зацепляя. Так и не удалось выкачать интересные коммьюнити за это время.Если есть Метапрактик и Опенмета, то готов получить по почте rbb.074 собака gmail точка com), ну понятное дело если удобно, или на недолгое время разместить на серваке, каком - то же готов узнать из письма.
Сейчас есть только программа скачивающая во внутреннем формате, который не очень удобен для чтения человеком. В ближайшее время доделаю конвертацию в XML, но его тоже не очень удобно читать, хотя и проще, чем первый формат. C HTML, который подходит для чтения сложнее и требует больше времени, которого к сожалению очень мало.Как доделаю, обязательно вышлю.
Сейчас есть только программа скачивающая во внутреннем формате, который не очень удобен для чтения человеком. В ближайшее время доделаю конвертацию в XML, но его тоже не очень удобно читать, хотя и проще, чем первый формат. C HTML, который подходит для чтения сложнее и требует больше времени, которого к сожалению очень мало.Как доделаю, обязательно вышлю.Уважаемый anglerhood сейчас занимаюсь созданием качественной копии метапрактика на отдельном домене, поэтому прошу вас сделать копию метапрактика, на сегодняшний день, в формате.xml.