Schöne Suppe

Schöne Suppe ist ein Python HTML / XML-Parser, der für schnelle Turnaround-Projekte wie Screen-Scraping entwickelt wurde.
Jetzt downloaden

Schöne Suppe Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Python License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Leonard Richardson
  • Website des Verlags:
  • http://newsbruiser.tigris.org/

Schöne Suppe Stichworte


Schöne Suppe Beschreibung

Schöne Suppe ist ein Python-HTML / XML-Parser, der für schnelle Turnaround-Projekte wie das Screen-Scraping entwickelt wurde. Schönes Suppenprojekt ist ein Python-HTML / XML-Parser, der für schnelle Turnaround-Projekte wie das Screen-Scraping entwickelt wurde. Drei Merkmale machen es leistungsstark: Die schöne Suppe erstickt, wenn Sie es mit schlechtem Markup geben. Es ergibt einen Analysebaum, der ungefähr so viel Sinn macht wie Ihr Originaldokument. Dies ist normalerweise gut genug, um die benötigten und weggelassenen Daten zu sammeln. Schöne Suppe bietet ein paar einfache Methoden und pythonische Idiome zum Navigieren, Suchen, Suchen und Ändern eines Analysebaums: ein Toolkit zum Abschneiden eines Dokuments und des Extraktivs, was Sie brauchen. Sie müssen nicht für jede Anwendung einen benutzerdefinierten Parser erstellen. Die schöne Suppe konvertiert automatisch eingehende Dokumente in Unicode- und ausgehende Dokumente in UTF-8. Sie müssen nicht über Kodierungen nachdenken, es sei denn, das Dokument gibt keine Kodierung an, und eine schöne Suppe kann nicht autodetieren. Dann müssen Sie nur die Originalcodierung angeben. Schöne Suppe analysiert alles, was Sie ihm geben, und tut das Baum durchquert für Sie. Sie können es mitteilen, dass Sie "alle Links suchen" oder "Alle Links von class externallink" oder "Finden Sie alle Links, deren URLs" foo.com "findet" oder "Finden Sie die Tabellenüberschrift, die mutigen Text erfüllt, dann geben Sie an Ich dieser Text. "Wertvolle Daten, die einst in schlecht gestalteten Websites eingesperrt wurden, sind jetzt in der Reichweite. Projekte, die Stunden in Betrieb genommen hätten, dauert nur wenige Minuten mit wunderschönen Suppe. Konvertieren Sie ungültige HTML- oder XML in etwas, das sich mit XHTML oder gültigem XML nähert.


Schöne Suppe Zugehörige Software