Metaphone

Eine Python-Implementierung der Metaphon-Algorithmen
Jetzt downloaden

Metaphone Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • BSD License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Andrew Collins
  • Website des Verlags:
  • https://github.com/oubiwann/

Metaphone Stichworte


Metaphone Beschreibung

Metaphon ist eine Python-Implementierung der in der Wikipedia-Seite beschriebenen Metaphon-Algorithmen. Wie Soundex war es auf englischeiniggerechte Verwendung beschränkt. Der Metaphon-Algorithmus erzeugt keine phonetischen Darstellungen eines Eingangsworts oder eines Namens; Vielmehr ist der Ausgang eine absichtlich ungefähre phonetische Darstellung. Die ungefähre Kodierung ist notwendig, um die Art und Weise zu berücksichtigen, wie Lautsprecher ihre Aussprachen und Missspell variieren oder anderweitig variieren Wörter und Namen, die sie versucht, zu buchstabieren. Die Implementierung wurde in der Juni 2000-Ausgabe von C / C ++ User Journal beschrieben. Es macht eine Reihe grundlegender Konstruktionsverbesserungen gegenüber dem ursprünglichen Metaphonalgorithmus. Es heißt "Double", da er sowohl einen primären als auch einen Sekundärcode für eine Zeichenfolge zurückgeben kann; Dies macht einige mehrdeutige Fälle sowie für mehrere Varianten von Nachnamen mit der gemeinsamen Abstammung aus. Zum Beispiel ergibt der Kodieren des Namens "Smith" einen primären Code von SM0 und einen sekundären Code von XMT, während der Name "Schmidt" einen primären Code von XMT und einen sekundären Code von SMT ergibt - beide haben XMT in Common.Double Metaphon Versucht, unzählige Unregelmäßigkeiten auf Englisch von Slawic, Germanic, Celtic, Griechisch, Französisch, Italienisch, Spanisch, Chinesisch und anderem Ursprung zu berücksichtigen. So verwendet es ein wesentlich komplexeres Regelsatz für die Kodierung als sein Vorgänger; Zum Beispiel testet es etwa 100 verschiedene Kontexte der Verwendung des Buchstabens C allein . Seitdem wurden Verbesserungen von mehreren Mitwirkenden erstellt, im Git-History angeboten. Das Ressourcenverzeichnis ist in diesem Projekt enthalten, das Folgendes enthält: - Die ursprüngliche C ++ - Datei von Lawrence Philips-Kevin Atkinsons Verbesserungen der IT - eine C-Implementierung (für Verwendung in einer Perl-Erweiterung) von Maurice Aubreythe-Mitwirkenden der Python-Version, die ursprünglich von Andrew Collins begonnen haben Aus der Standardbibliothek und als solche sind seine Tests von den meisten Testläufern ausgeführt. Wenn Sie eine Nase installiert haben, können Sie Folgendes tun: GIT-Kasse https://github.com/oubiwann/metaphone.git-CD-CD-Doppelmetaphon-Nosetests -V. Wenn Sie verdreht installiert haben, können Sie: Studie ./metaphoneexample codethe Gerätestests sind voller Beispiele, also überprüfen Sie diese, um diese zu überprüfen. Aber hier ist ein Geschmack: Python >>> aus Metaphone Importdoppelimport >>> Doustrone ("archtkt") ("arktkt", "") >>> doubblemetaphon ("bajador") ("pjtr", "phtr") in der Die folgenden Entwicklern / Projekte nutzen diese Bibliothek: - Andrew Collins benutzte seinen ursprünglichen Code in verschiedenen Musikprojekten und den Umgang mit falschem Text aus Daten, die von verschiedenen Web-Services bereitgestellt werden. Dies wurde dann in Plone / Zope-Projekte integriert.- Matthew Somerville verwendet es auf Theateria, um den Namen der Menschen zu tun, und es scheint ganz gut zu funktionieren. Die Datenbank speichert die doppelten Metaphone für die Vor- und Nachnamen, und dann rechnet beim Suchen einfach die doppelten Metaphone dessen, was eingegeben wurde, und sucht alles, was Matches.- Duncan McGreggor ist auf dem TharSk-Projekt, um größere Volltextsuchfunktionen für mehr Volltext-Suchfunktionen bereitzustellen Indo-European Language Word-Listen und Wörterbücher.product's Homepage


Metaphone Zugehörige Software