Www :: pdascraper.

www :: pdascraper ist eine perl-Klasse zum Abkratzen von PDA-freundlichen Inhalten von Websites.
Jetzt downloaden

Www :: pdascraper. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Perl Artistic License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • John Horner
  • Website des Verlags:
  • http://search.cpan.org/~codyp/WWW-PDAScraper-0.1/PDAScraper.pm

Www :: pdascraper. Stichworte


Www :: pdascraper. Beschreibung

Www :: pdascraper ist eine perl-Klasse zum Abkratzen von pda-freundlichen Inhalten von Websites. Www :: pdascraper ist eine perl-Klasse zum Abkratzen von PDA-freundlichen Inhalten von Websites.Synopsis Verwenden Sie www :: pdascraper; Mein $ Scraper = www :: pdascraper-> NEUE QW (Newscientist Yahoo :: Entertainment); $ Scraper-> Scrape (); oder www :: pdascraper verwenden; Mein $ Scraper = www :: pdascraper-> neu; $ Scraper-> Scrape QW (Newscientist Yahoo :: Entertainment); oder perl -mwww :: PDASCRAPER -E "Scrape QW (Newscientist Yahoo :: Entertainment)" Nachdem Sie verschiedene kulgey-Skripts geschrieben haben, um pda-freundliche Inhalte von verschiedenen Websites herunterzuladen, i Beschlossen, eine verallgemeinerte Lösung zu schreiben, die den Abschnitt einer Nachricht analysieren würde, die die Links enthält, die wir aufnehmen möchten Für den Umzug der Seiten auf Ihre PDA ist nicht Teil des Umfangs des Moduls: der Open-Source-Browser und der "Distiller", Plucker, von http://plkr.org/ wird empfohlen. Holen Sie sich einfach, um die Datei index.html mit einer Tiefe von 1 von der Festplatte zu lesen, mithilfe einer URL-Datei wie Datei: //path/to/index.htmlthe sub-modules www :: pdascraper verwendet eine Reihe von Regeln zum Abkratzen einer bestimmten Website Von einem zweiten Modul, dh www :: pdascraper :: yahoo :: Entertainment :: TV enthält die Regeln für das Kratzen der Yahoo-TV-Nachrichtenwebsite: Paket www :: pdascraper :: yahoo :: Entertainment :: TV; # Www :: pdascraper.pm-Regeln für das Kratzen der # Yahoo-TV-Website Sub Config {Return {name => 'yahoo tv', start_from => 'http://news.yahoo.com/i/763', chunk_spec => , url_regex => }; } 1; Eine mehr oder weniger zufällige Auswahl an Modulen ist enthalten, sowie ein vollständiger Set für Yahoo, um einen logischen Satz von Modulen in den Kategorien zu demonstrieren Www :: pdascraper :: template.pm - Sie benötigen Namen, start_von, dann entweder chunk_spec oder url_spec, dann optional ein url_regex für die Umwandlung in die druckfreundliche URL.Das verschieben Sie Ihr neues Modul entweder an denselben Speicherort wie die anderen Ihr System, oder stellen Sie sicher, dass sie Ihrem Skript mit einer Zeile zur Verfügung stehen, wie Sie lib '/ path / path / local / modules / pdascraper /' Anforderungen verwenden: · Perl.


Www :: pdascraper. Zugehörige Software