metadata_parser.

ein Modul, um Metadaten aus Dokumenten zu parsen
Jetzt downloaden

metadata_parser. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • MIT/X Consortium Lic...
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Jonathan Vanasco
  • Website des Verlags:
  • http://search.cpan.org/~jvanasco/Authen-PluggableCaptcha-0.05/lib/Authen/PluggableCaptcha/Tutorial.pm

metadata_parser. Stichworte


metadata_parser. Beschreibung

metadata_parser ist ein Python-Modul zum Ziehen von Metadaten aus Webdokumenten. Es erfordert wunderschönSOUP und basiert weitgehend auf dem Opengraph-Modul von Erik River (https://github.com/erikriver/opengraph).Ich brauchte etwas aggressiveres als Eriks Modul, so musste metadata_parationPip installieren Kann BS4 importieren, es tut es tut, ansonsten versucht es für die Geschwindigkeit, dass er einen schönen Anpeter mit LXML instanziiert und wieder auf 'None' (den internen reinen Python) zurückkehrt, wenn er nicht lxmlthe default "Strategie" laden kann Um in dieser Reihenfolge zu schauen: OG, DC, Meta, Seite og = OpenGraph DC = DublinCore Meta = Metadata Seite = SeitenelementeSyou kann eine Strategie als Kommas getrennte Liste der oben genannten angeben. Die derzeit nur 2 unterstützten Elemente sind: Wert -> Meta Daten -> Metadaten Usagefrom Eine URL >>> metadata_parser >>> Seite = metadata_parser.metadataparser (URL = "http://www.cnn.com") >>> Seite drucken = 'og') >>> drucken Seite.Get_Field ('Titel', Strategie = 'Seite, og, dc') von HTML >>> HTML = "" "" "" >>> Seite = metadata_parser.metadatApparSer (HTML = HTML) >>> Seite drucken ', Strategie =' Seite, og, dc ') der Homepage des Produkts


metadata_parser. Zugehörige Software