Dedupe Ranking & Zusammenfassung
- Name des Herausgebers:
- Graham Poulter
- Website des Verlags:
- https://launchpad.net/~graham-poulter
Dedupe Stichworte
Dedupe Beschreibung
Python-Deduplizierungsbibliothek. dedupe ist eine Python-Bibliothek, um ähnliche Zeilen in einer Tabelle von Datengebieten zu finden (z. B. in einer Datenbank- oder CSV-Datei) oder die Verknüpfung ähnlicher Reihen zwischen zwei Tabellen. (1) Indexieren der Datensätze in Blöcke, (2) Vergleichen Sie alle Datenpaare in jedem Block mit einer Ähnlichkeitsfunktion und (3) Cluster Das Vergleichspaar in "Übereinstimmungen" und "Nicht-Matches". Anforderungen: · Python
Dedupe Zugehörige Software