Yape :: html.

YAPE :: HTML ist noch ein weiterer Parser / Extraktor für HTML.
Jetzt downloaden

Yape :: html. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Perl Artistic License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Jeff Pinyan
  • Website des Verlags:
  • http://search.cpan.org/~pinyan/YAPE-Regex-3.03/Regex/Element.pm

Yape :: html. Stichworte


Yape :: html. Beschreibung

YAPE :: HTML ist noch ein weiterer Parser / Extraktor für HTML. YAPE :: HTML ist noch ein weiterer Parser / Extraktor für html.synopsis benutze yape :: html; Verwenden Sie streng; meine $ content = " ... "; Mein $ PARSER = YAPE :: HTML-> NEU ($ Inhalt); meine ($ extor, @ Fonts, @ URLs, @ Rubriken, @ Kommentare); # Hier ist der Tokenizeteil, während (mein $ chunk = $ Parser-> Nächstes) {if ($ chunk-> Typ EQ 'Tag' und $ Chunk-> Tag EQ 'font') {if (mein $ face = $ punk -> Get_ATTR ('Face')) {Push @fonts, $ Face; }) } # Hier ist das Extrahierende Teil # -Tags mit HREF-Attributen # -Tags mit SRC-Attributen $ EXTOR = $ PARSER-> Extrakt (A => , IMG => ) ; während (mein $ chunk = $ extor -> ()) {Push @urls, $ chunk-> get_attr ($ chunk-> tag EQ 'A'? 'Href': 'src'); } #

,

, ...,

Tags $ EXTOR = $ PARSER-> Extrakt (QR / ^ H $ / => []); während (mein $ chunk = $ extor -> ()) {Push @Headings, $ Chunk; } # Alle Kommentare $ extor = $ Parser-> Extrakt (-Comment => []); während (mein $ chunk = $ extor -> (()) {Push @Comments, $ Chunk; } YAPE MODULSTHE YAPE-Hierarchie von Modulen ist ein Versuch einer einheitlichen Mittel zur Analyse und Extraktion von Inhalten. Es versucht, eine generische Schnittstelle aufrechtzuerhalten, die Einfachheit und Wiederverwendbarkeit zu fördern. Die API ist kraftvoll, doch einfach. Die Module do ToKenization (die abgefangen werden können) und bauen Bäume, so dass die Extraktion bestimmter Knoten ist. Dieses Modul ist für HTML-Dokumente ein weiterer Parser und Baum-Builder. Es ist so konzipiert, dass die Extraktion und Änderung von HTML-Dokumenten vereinfacht wird. Mit der API können Sie einfache benutzerdefinierte Ergänzungen an das Analyse des Dokuments ermöglichen, und ermöglicht sehr bestimmte TAG-, Text- und Kommentar-Extraktion. Anforderungen: · Perl.


Yape :: html. Zugehörige Software