Dedupe

Python Deduplizierungsbibliothek
Jetzt downloaden

Dedupe Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • GPL v3
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Graham Poulter
  • Website des Verlags:
  • https://launchpad.net/~graham-poulter

Dedupe Stichworte


Dedupe Beschreibung

Python-Deduplizierungsbibliothek. dedupe ist eine Python-Bibliothek, um ähnliche Zeilen in einer Tabelle von Datengebieten zu finden (z. B. in einer Datenbank- oder CSV-Datei) oder die Verknüpfung ähnlicher Reihen zwischen zwei Tabellen. (1) Indexieren der Datensätze in Blöcke, (2) Vergleichen Sie alle Datenpaare in jedem Block mit einer Ähnlichkeitsfunktion und (3) Cluster Das Vergleichspaar in "Übereinstimmungen" und "Nicht-Matches". Anforderungen: · Python


Dedupe Zugehörige Software