Web :: schaber.

Web-Abkratzen von Toolkit mithilfe von HTML- und CSS-Selektoren oder XPath-Ausdrücken
Jetzt downloaden

Web :: schaber. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Perl Artistic License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Tatsuhiko Miyagawa
  • Website des Verlags:
  • http://search.cpan.org/~miyagawa/

Web :: schaber. Stichworte


Web :: schaber. Beschreibung

Web-Scrabing-Toolkit mit HTML- und CSS-Selektoren oder XPath-Ausdrücken Web :: Schaber ist ein Web-Schaber-Toolkit, inspiriert von Rubys äquivalentem Scrapi. Es bietet eine DSL-ISH-Schnittstelle zum Traversieren von HTML-Dokumenten und die Rückgabe eines ordentlich angeordneten Perl-Datenstranks. Die Abstreif- und Prozessblöcke liefern ein Verfahren, um festzulegen, welche Segmente eines Dokuments extrahiert werden. Es versteht CSS- und HTML-Selektoren sowie XPath-Ausdrücke.Synopsis Verwenden Sie URI; Verwenden Sie Web :: Scraper; # Erstellen Sie zuerst Ihren Abstreiferblock Meine $ Tweets = Schaber {# Parse ALL LIS mit dem Status der Klasse ", speichern Sie sie in einem resultierenden # Array 'Tweets'. Wir bündelten einen anderen Abstreifer für jeden Tweet. Prozess "li.status", "Tweets []" => Schaber {# und in diesem Array, ziehen Sie in diesem Array die Elemente mit dem Class # "Eingabe-Inhalt", "Einstiegsdatum" und des Link-Prozesses ". Inhalt ", Körper => 'Text'; Prozess ".entry-Datum", wann => 'Text'; Prozess 'a ', link => '@HREF'; }; }; Meine $ res = $ Tweets-> Scrape (Uri-> NEU ("http://twitter.com/miyagawa"); # Das Ergebnis hat das bevölkerte Tweets-Array für meinen $ Tweet (@ {$ res -> {Tweets}}) {drucken "$ Tweet -> {Körper} $ Tweet -> {wann} (Link: $ Tweet -> {Link })\n"; } Anforderungen: · Perl.


Web :: schaber. Zugehörige Software