Produkte.Unicodelexicon.

Unicode Aware Lexicon für ZCtextIndex
Jetzt downloaden

Produkte.Unicodelexicon. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • BSD License
  • Name des Herausgebers:
  • Stefan H. Holek

Produkte.Unicodelexicon. Stichworte


Produkte.Unicodelexicon. Beschreibung

Unicode Aware Lexicon für ZCtextIndex MotivationDas Standard ZCextIndex Lexicon befasst sich nur mit 8-Bit-Saiten (und nur, wenn Sie das Zope.Conf-Locale-Einstellung rechts erhalten). Es handelt nicht um Unicode oder UTF-8. Unicodelexicon füllt dieses Gap.InstallationProducts.unicodelexicon fügt einen ZCtextIndex-Unicode-Lexikon-Typ an Zope hinzu. Das Lexikon verfügt über Word-Splitter, Stop-Wortentferner, einen Fall Normalizer und zwei Akzent-Normalisierer. Wenn Sie GenericSetup installiert haben, können Sie das mitgelieferte Erweiterungsprofil installieren, um ein Unicodelexicon in Ihrem Portal_Catalog zu erstellen, und aktualisieren Sie den Titel, die Beschreibung und den Suchabbau ZCextIndexes . Es gibt keinen Upgrade-Pfad von Unicodelexicon 1.0. Wenn Sie 1.0 auf Ihrem System haben, müssen Sie den Lexicon.Pipeline ElementSthe Splitter löschen und neu erstellen . Es gibt einen Normalisierer für den lateinischen und westeuropäischen Text (FR, ES, PT, IT, EN, NL), und einer für deutschen und skandinavischen Text (DE, DK, NEIN, SE, FI, IS). Letzteres hält die Umlaut-Figuren ä, Ö und ü in tact.Caveatsthe Lexicon nimmt entweder Unicode oder UTF-8 an. Wenn Ihre Anwendung eine andere Kodierung verwendet, müssen Sie die ENC-Konstante in UnicodeSPlitter.py entsprechend ändern. RelatedFOR CJK-Text Sie möchten den Standard-ZCextIndex-Lexikon in Verbindung mit CJKSPlitter verwenden. Für den griechischen Text möchten Sie den Standard-ZCtextIndex Lexicon mit Grsplitter. Anforderungen: · Python Was ist neu in dieser Version: · Fügen Sie die Möglichkeit, Pipeline-Elemente in ZCML zu registrieren. · Fehler bei der Aktualisierung des PipelineFactory behoben.


Produkte.Unicodelexicon. Zugehörige Software