Инструмент UNIX для дампа выбора HTML?

Вы говорите, что требуется выполнить медосмотр к виртуальному преобразованию системы каждую ночь? почему не только создают резервную копию хранилища данных или используют один из резервных продуктов Veeam для копирования данных?

Возможно, я пропускаю то, что Вы пытаетесь сделать...

Править: То, что мы делаем, за выходные, я закрою VM, затем использовать свободный клиент FastSCP Veeam для передачи подкаталога VM от сервера ESXI к локальному жесткому диску терабайта.

Технически я выполняю FastSCP в Windows VM в Virtualbox для копирования во внешний диск терабайта хоста, который рассматривается как сетевой ресурс, но конечным результатом является то же.

Зависит от того, насколько большой серверы - то, что Вы копируете относительно того, сколько времени это возьмет.

Некоторые серверы, которые я скопировал как это для создания резервного копирования "базового изображения" и гостевого Windows OS уже, имеют резервное копирование, выполняемое на нем до системы, был виртуализирован, таким образом, я должен в теории просто восстанавливать сервер ESXI, копировать базовое изображение назад, "воссоздавать" его в той точке, затем выполняет восстановление с нашим сервером резервного копирования для возвращения, файлы на грани последнего резервного копирования убегают лента.

1
задан 6 May 2010 в 02:04
2 ответа

Возможно не, что Вы ищете, но как насчет того, чтобы писать быстрый сценарий в Python, с помощью BeautifulSoup, чтобы обработать HTML и дать Вам разумно структурированный объект, который можно получить доступ к содержанию.

import urllib2
from BeautifulSoup import BeautifulSoup as BS
soup = BS(urllib2.urlopen('http://www.google.com').read())
soup.findAll('a')[1]
#returns
<a onclick="gbar.qs(this)" href="http://video.google.co.uk/?hl=en&amp;tab=wv" class="gb1">Videos</a>
2
ответ дан 3 December 2019 в 19:42
  • 1
    Я думал об использовании Красивого Супа, но полагал, что кто-то распознал проблему и уже делает допускающий повторное использование компонент из нее. Спасибо за пример все же. –  jldugger 6 May 2010 в 02:16
  • 2
    Я держал пари, что никто не имеет. Если Вы можете быть образованы дугу для создания этого достаточно универсальным, i' d предлагают, чтобы Вы закупорили проект на googlecode или подобный. –  Tom O'Connor 6 May 2010 в 02:54
  • 3
    Это - стратегия, с которой я пошел. There' s много инструментов XML, но их don' t справляются с плохо записанным HTML. I' ve обобщил код немного, но потребность провести немного больше времени UNIX, разрабатывающий его перед публикацией. –  jldugger 7 May 2010 в 00:04
  • 4
    :) Здорово. Довольный это было полезно! –  Tom O'Connor 7 May 2010 в 01:59

запишите сценарий Perl с LWP и HTML:: TreeBuilder:: XPath, возможно.

1
ответ дан 3 December 2019 в 19:42
  • 1
    Эффективно то же как мое предложение. Я нахожу, что BeautifulSoup является несколько более семантическим, чем Perl' s предложение. Зависит, что OP предпочитает, чтобы я предположил! –  Tom O'Connor 6 May 2010 в 02:12

Теги

Похожие вопросы