Algorithmus :: Rabinkarp.

Rabin-Karp-Streaming-Hash
Jetzt downloaden

Algorithmus :: Rabinkarp. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Perl Artistic License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Norman Nunley, Jr
  • Website des Verlags:
  • http://search.cpan.org/~nnunley/

Algorithmus :: Rabinkarp. Stichworte


Algorithmus :: Rabinkarp. Beschreibung

Rabin-Karp-Streaming-Hash Algorithmus :: Rabinkarp ist eine Implementierung von Rabin und Karps Streaming Hash, wie in "Winning: lokale Algorithmen für Dokumentenfingerprinting" von Schleimer, Wilkerson und Aiken beschrieben. Nach dem Vorschlag von Schleimer benutze ich ihre zweite Gleichung: $ h ] = (($ h ] - $ c ** $ k) + $ c ) * $ KDer Ergebnisse dieses Hashs codiert Informationen über die nächsten K-Werte im Stream (Hense K-Gramm.) Dies bedeutet für einen bestimmten Längenstrom n Ganzzahlwerte (oder Zeichen), Sie erhalten N-K + 1 Hash-Werte zurück. FREE BESTE ERGEBNISSE, Sie möchten einen Codegenerator erstellen, der Ihre Daten filtert, um alle unnötigen Informationen zu entfernen. In einem großen englischen Dokument sollten Sie beispielsweise den gesamten weißen Raum entfernen und alle Kapitalisierung entfernen. Mein $ kgram = Algorithmus :: RABINKARP-> NEU ($-Fenster, $ Text); oder mein $ kgram2 = Algorithmus :: Rabinkarp-> Neu ($-Fenster, $ FH); oder mein $ kgram3 = Algorithmus :: RABINKARP-> Neu ($-Fenster, sub {... $ num, $ position;}); meine ($ Hash, $ start_position, $ end_position) = $ kgram-> nächstes; meine @Values = $ kgram-> Werte; meine% Vorkommnisse; # ein Wörterbuch aller kgrams. während (meine ($ Hash, @pos) = @ {SHIFT @Values}) {Push @ {$ Treffer {$ Hash}}, \ @ @ @ @ @ @ @ @ @ } meine $ nadel = algorithmus :: rabinkarp-> neu (6, "nadel"); Öffne mein $ FH, 'NEU (6, $ FH); meine $ nedle_hash = $ nadel-> als nächstes; während (mein ($ hay_hash, @pos) = HAYSTACK-> NEXT) {Warn "Mögliche Übereinstimmung für" Nadel "bei @POS" Wenn $ nadel_hash EQ $ hay_hash; } Anforderungen: · Perl.


Algorithmus :: Rabinkarp. Zugehörige Software