Poliqarp.

POLIQARP ist ein Dienstprogramm, um große Korpora zu durchsuchen.
Jetzt downloaden

Poliqarp. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • GPL
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Daniel Janus
  • Website des Verlags:

Poliqarp. Stichworte


Poliqarp. Beschreibung

Poliqarp ist ein Dienstprogramm, um große Korpora zu suchen. Poliqarp ist ein Dienstprogramm, um große Korpora zu suchen. Hier sind einige wichtige Funktionen von "poliqarp": Unterstützung für Tagged Corpora: · Die gesuchte Kollektion kann nicht nur RAW-Text enthalten, sondern auch Informationen zu den Wörtern und Texten, die es bilden (grammatische Formen von Wörtern; Struktur der Texte; verschiedene Meta-Informationen über die Texte wie Urheberschaft und Datum des Schreibens). Ausdrucksvolle Abfragesprache: Die Abfragesprache von poliqarp basiert auf regulären Ausdrücken und ermöglicht es Ihnen, nicht nur für ein bestimmtes Wort oder eine bestimmte Wortsequenz von Wörtern, sondern auch für: · Ein Adjektiv gefolgt von einem Substantiv · Fünf Substantive in einer Reihe · Fünf, sechs oder sieben Substantive in einer Reihe · Ein gegebenes Wort, das nahe kommt, aber nicht unbedingt als nächstes, an ein anderes Wort · Wörter, die mit 'Z' beginnen, die in den im 19. Jahrhundert veröffentlichten Texten auftreten · Sätze länger als 100 Wörter · ...und viele mehr Unterstützung für Positions-Tagsets: · Die den Wörtern zugewiesenen Tags können eine interne Struktur aufweisen, und diese Struktur kann in Abfragen eingebaut werden. Zum Beispiel könnten Substantive Gender, Nummer oder Fall, Verben haben möglicherweise Aspekte und so weiter. · Dies ist besonders nützlich bei Sprachen, die in der Flexion reich sind, beispielsweise polnisch (in der Tat wurde Poliqarp ursprünglich entwickelt und in einem polnischen Corpus-Projekt verwendet - der IPI Pan Corpus). · Hängt nicht von einem bestimmten Tagset ab · Unterstützung für Unicode · Sie können Corpora of Texts in fast jeder Sprache in seiner nativen Drehbuch erstellen - sei es Englisch, Polnisch, Japanisch oder Thai - solange sie im UTF-8-Format codiert werden. Unterstützung für Mehrdeutigkeiten: · Tags eines Wortes sind nicht unbedingt eindeutig: Es gibt Situationen, in denen ein Wort auf verschiedene Arten interpretiert werden kann (und dadurch mehrere Tags haben). POLIQARP kann solche Situationen umgehen und ermöglicht Ihnen, dass Ihre Anfrage mit einer der möglichen Interpretationen oder aller von ihnen übereinstimmen muss. Wenn ja, haben andere Concordancer diese Fähigkeit. Multi-Platform: · PoliQarp ist in Java und Portable C geschrieben und ist somit für Windows und unix-ähnliche Systeme verfügbar, darunter Linux, * BSD und Solaris. Derzeit unterstützt es nur wenigsteckende Architekturen, aber die Arbeit ist im Gange, um es endschen neutral zu machen. Effizient: · Es ist schwer, die durchschnittliche Zeit der Suche nach einem Korpus zu schätzen, da sie stark von der Struktur der Abfrage abhängt. Einfache Abfragen (für ein Wort oder einen Satz) dauert jedoch einige Sekunden sogar in der Corpora, die mehr als hundert Millionen Wörter enthält (in Bezug auf Rohtexte, das sind mehrere Gigabytes, einschließlich Tags und Metadaten!) Eine komplexere Abfrage dauert länger, aber Selbst dann erhalten Sie die Ergebnisse, sobald sie gefunden werden, so dass Sie nicht lange warten müssen. Kostenlos: · PoliQarp ist kostenlose / Open-Source-Software, die unter den Bedingungen der GNU General Public License erhältlich ist. Anforderungen: · Java 2 Standard Edition Runtime-Umgebung Was ist neu in dieser Version: · Eine große Regression in BPUGPRAD, die zu Datenverlust führen könnte, wurde behoben.


Poliqarp. Zugehörige Software

Docmgr

Docmgr ist ein voll ausgestattetes Dokumentenverwaltungssystem, das die automatische Indexierung von hochgeladenen Dateien enthält. ...

397

Herunterladen