metadata_parser ist ein Python-Modul zum Ziehen von Metadaten aus Webdokumenten. Es erfordert wunderschönSOUP und basiert weitgehend auf dem Opengraph-Modul von Erik River (https://github.com/erikriver/opengraph).Ich brauchte etwas aggressiveres als Eriks Modul, so musste metadata_parationPip installieren Kann BS4 importieren, es tut es tut, ansonsten versucht es für die Geschwindigkeit, dass er einen schönen Anpeter mit LXML instanziiert und wieder auf 'None' (den internen reinen Python) zurückkehrt, wenn er nicht lxmlthe default "Strategie" laden kann Um in dieser Reihenfolge zu schauen: OG, DC, Meta, Seite og = OpenGraph DC = DublinCore Meta = Metadata Seite = SeitenelementeSyou kann eine Strategie als Kommas getrennte Liste der oben genannten angeben. Die derzeit nur 2 unterstützten Elemente sind: Wert -> Meta Daten -> Metadaten Usagefrom Eine URL >>> metadata_parser >>> Seite = metadata_parser.metadataparser (URL = "http://www.cnn.com") >>> Seite drucken = 'og') >>> drucken Seite.Get_Field ('Titel', Strategie = 'Seite, og, dc') von HTML >>> HTML = "" "" "" >>> Seite = metadata_parser.metadatApparSer (HTML = HTML) >>> Seite drucken ', Strategie =' Seite, og, dc ') der Homepage des Produkts
softwaresea.com bietet das neueste umweltfreundliche Downloadcenter für kostenlose Software im In- und Ausland, einschließlich Computersoftware, Apple-Anwendungen, Android-Anwendungen und anderen kostenlosen Software-Downloads für mobile Computer. Wenn Sie mehr über grüne kostenlose Software erfahren möchten, laden Sie sie auf softwaresea.com herunter!