Таблица извлечения оценивает от веб-страниц HTML автоматически

При использовании cfengine (https://cfengine.com/), Вы могли бы сделать, это с отключает. Вы просто пишете файл обещания для группы хостов, и это применит себя в следующем выполненном cfagent. Выполнение этого с марионеткой или шеф-поваром или независимо от того, что должно также быть довольно простым.

0
задан 20 February 2012 в 10:46
2 ответа

Я наконец нахожу расширение Firefox iMacros для Firefox очень полезным при записи и воспроизведении повторяющейся работы. Он хорошо и эффективно извлекает данные с огромных веб-страниц с одинаковой структурой.

Более того, iMacros имеет подробные учебные пособия и образцы кода . iMacros для Firefox бесплатен для личного и коммерческого использования, если вы обеспокоены этим (например, я).

Я настоятельно рекомендую iMacros , если вы когда-нибудь захотите автоматизировать некоторую громоздкую работу!

0
ответ дан 4 December 2019 в 21:55

Вы можете обнаружить, что есть более эффективные способы получить нужные данные, чем анализ HTML, созданного MRTG (например, например, прямое использование SNMP). Однако это может помочь, если действительно нужно проанализировать HTML:

Если вы хотите использовать Python, тогда вам поможет библиотека BeautifulSoup. Вам все равно придется написать код, но BeautifulSoup довольно гибкий.

Вот грубый пример, который выгружает все таблицы HTML на странице в CSV:

import sys
import csv
import urllib2

import BeautifulSoup

page    = urllib2.urlopen(sys.argv[1]).read()
soup    = BeautifulSoup.BeautifulSoup(page)
csvout  = csv.writer(sys.stdout)

for table in soup.findAll('table'):
    print '#'
    print '# Table'
    print '# Fields: ' + ','.join([tr.text for tr in table.findAll('th')])
    for row in table.findAll('tr'):
        csvout.writerow([tr.text for tr in row.findAll('td')])
    print

Предполагается, что у вас также установлен Python как BeautifulSoup ( pip install BeautifulSoup или easy_install BeautifulSoup ) и, предполагая, что вы сохранили приведенный выше код как htmltable2csv.py , вы можете отобразить все таблицы на странице вот так:

python htmltable2csv.py http://www.w3schools.com/tags/tag_table.asp
1
ответ дан 4 December 2019 в 21:55

Теги

Похожие вопросы