Таблица извлечения оценивает от веб-страниц HTML автоматически

Question

Таблица извлечения оценивает от веб-страниц HTML автоматически

При использовании cfengine (https://cfengine.com/), Вы могли бы сделать, это с отключает. Вы просто пишете файл обещания для группы хостов, и это применит себя в следующем выполненном cfagent. Выполнение этого с марионеткой или шеф-поваром или независимо от того, что должно также быть довольно простым.

0

scripting data-extraction

задан Andrew 20 February 2012 в 10:46

Ссылка

2 ответа

Вы можете обнаружить, что есть более эффективные способы получить нужные данные, чем анализ HTML, созданного MRTG (например, например, прямое использование SNMP). Однако это может помочь, если действительно нужно проанализировать HTML:

Если вы хотите использовать Python, тогда вам поможет библиотека BeautifulSoup. Вам все равно придется написать код, но BeautifulSoup довольно гибкий.

Вот грубый пример, который выгружает все таблицы HTML на странице в CSV:

import sys
import csv
import urllib2

import BeautifulSoup

page    = urllib2.urlopen(sys.argv[1]).read()
soup    = BeautifulSoup.BeautifulSoup(page)
csvout  = csv.writer(sys.stdout)

for table in soup.findAll('table'):
    print '#'
    print '# Table'
    print '# Fields: ' + ','.join([tr.text for tr in table.findAll('th')])
    for row in table.findAll('tr'):
        csvout.writerow([tr.text for tr in row.findAll('td')])
    print

Предполагается, что у вас также установлен Python как BeautifulSoup ( pip install BeautifulSoup или easy_install BeautifulSoup ) и, предполагая, что вы сохранили приведенный выше код как htmltable2csv.py , вы можете отобразить все таблицы на странице вот так:

python htmltable2csv.py http://www.w3schools.com/tags/tag_table.asp

1

ответ дан 4 December 2019 в 21:55

Ссылка

Похожие вопросы

score 0 · Accepted Answer · 4 December 2019 в 21:55

Я наконец нахожу расширение Firefox iMacros для Firefox очень полезным при записи и воспроизведении повторяющейся работы. Он хорошо и эффективно извлекает данные с огромных веб-страниц с одинаковой структурой.

Более того, iMacros имеет подробные учебные пособия и образцы кода . iMacros для Firefox бесплатен для личного и коммерческого использования, если вы обеспокоены этим (например, я).

Я настоятельно рекомендую iMacros , если вы когда-нибудь захотите автоматизировать некоторую громоздкую работу!

Таблица извлечения оценивает от веб-страниц HTML автоматически

Теги

Похожие вопросы