Xapian und Omega.

XAPIAN ist eine open Source-probabilistische Informationsabrufbibliothek, die unter der GPL freigegeben wird.
Jetzt downloaden

Xapian und Omega. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • GPL
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Xapian Team
  • Website des Verlags:
  • http://www.xapian.org/

Xapian und Omega. Stichworte


Xapian und Omega. Beschreibung

Xapian ist eine Open Source probabilistische Information Retrieval-Bibliothek unter der GPL veröffentlicht. Xapian ist eine Open Source probabilistische Information Retrieval-Bibliothek unter der GPL veröffentlicht. Xapian iss in C geschrieben, mit Bindungen Verwendung von anderen Sprachen zu ermöglichen (Perl, Java, Python, PHP und TCL werden derzeit unterstützt, Guile und C # gearbeitet werden) .Xapian ist so konzipiert, ein höchst anpassungsfähiges Toolkit sein, damit Entwickler die einfache Indexierung Einrichtungen, um ihre eigenen applications.If nach einem verpackten Suchmaschine sind hinzufügen und suchen Sie Ihre Website für, sollten Sie einen Blick auf Omega, nehmen die eine Anwendung ist, dass wir auf Xapian gebaut liefern. Aber im Gegensatz zu den meisten anderen Website-Suchlösungen, Xapian Vielseitigkeit ermöglicht es Ihnen, Omega zu erweitern Ihre Bedürfnisse zu erfüllen, wie sie wachsen. Hier sind einige der wichtigsten Features von Xapian und Omega: · Free Software / Open Source - unter der GPL lizenziert. · Leicht zu transportieren - läuft auf vielen Linux, MacOS X, viele andere Unix-Plattformen und Microsoft Windows. · Geschrieben in C. Perl-Bindungen sind im Modul Suche :: Xapian auf CPAN verfügbar. Java JNI-Bindungen sind in dem xapian-Bindungen Modul enthalten. Wir unterstützen auch SWIG die Bindungen für 13 Sprachen generieren. Derzeit diejenigen für Python, PHP4 und TCL arbeiten. Guile und C # sind in Arbeit. · Auf Rang probablistic Suche - wichtige Worte bekommen mehr Gewicht als unwichtig Worte, so dass die relevantesten Dokumente eher kommen, in der Nähe der Spitze des Ergebnisliste sind. · Relevanz-Feedback - gegeben ein oder mehr Dokumente, Xapian können die relevantesten Indexbegriffe vorschlagen, eine Abfrage zu erweitern, deuten darauf hin, zugehörige Dokumente, kategorisieren Dokumente, etc. · Phrase und die Nähe searching - Benutzer nach Worten suchen können in einem exakten Ausdruck oder innerhalb einer bestimmten Anzahl von Worten, entweder in einer bestimmten Reihenfolge oder in beliebiger Reihenfolge auftreten. · Umfassendes Angebot an strukturierten boolean Suchoperator ( Lager NICHT Markt, etc). Die Ergebnisse der Booleschen Suche durch die probablistic Gewichte gewählt. Boolesche Filter können auch eine probabilistische Suche einzuschränken angewendet werden. · Unterstützt stammt von Suchbegriffen (zum Beispiel eines für Fußball suchen würden Dokumente gefunden, die Fußbälle oder Fußballer nennen). Dies hilft, relevante Dokumente zu finden, die sonst übersehen werden könnten. Abbeermaschinen sind derzeit für Dänisch, Niederländisch, Englisch, Finnisch, Französisch, Deutsch, Italienisch, Norwegisch, Portugiesisch, Russisch, Spanisch und Schwedisch enthält. · Unterstützt Datenbank-Dateien> 2GB - wesentlich für zu große Dokumentensammlungen Skalierung. · Plattformunabhängige Datenformate - Sie eine Datenbank auf einer Maschine bauen und es auf einem anderen suchen. · Erlaubt gleichzeitige Aktualisierung und Suche. Neue Dokumente werden sofort durchsuchbar. Neben der Bibliothek haben wir eine Reihe von kleinen Beispielprogrammen und eine größere Anwendung liefern - eine Indizierung und CGI-basierte Anwendung Omega genannt: · Der Indexer geliefert indizieren kann HTML, PHP, PDF, Postscript und Klartext. Hinzufügen von Unterstützung für die Indizierung andere Formate ist einfach, wo Konversionsfilter verfügbar sind (zum Beispiel Microsoft Word). Diese Indexer arbeitet das Ablagesystem verwenden, aber wir bieten auch ein Skript der htdig Web-Crawler zu ermöglichen Haken in sein, so dass Remote-Standorten mit Omega gesucht werden. · Sie können auch die Indexdaten von einem beliebigen SQL oder andere RDBMS durch die Perl DBI-Modul unterstützt. Dazu gehören MySQL, PostgreSQL, SQLite, Sybase, MS SQL, LDAP und ODBC. · CGI Suche Front-End mit hochgradig anpassbarer Optik geliefert. Dies kann auch zur Ausgabe von Ergebnissen in XML oder CSV angepasst werden, was nützlich ist, wenn Sie dynamisch Seiten zu erzeugen sind (zum Beispiel mit PHP oder mod_perl) und wollen einfach nur roh Suchergebnisse, die Sie in Ihrem eigenen Seitenlayout-Code verarbeiten kann. Was ist neu in dieser Version: API: · Xapian :: Dokument nicht immer speichert mehr explizit leere Werte. Das war nicht ein vorsätzliches Verhalten, und wie dieser Fall behandelt wurde nicht dokumentiert. Das geänderte Verhalten ist im Einklang mit Benutzer-Metadaten behandelt wird. Diese Änderung ist nicht beobachtbar mit Document :: get_value (), kann aber festgestellt werden, wenn das Iterieren mit Document :: values_begin () unter Verwendung von Document :: values_count () oder versuchen, den Wert mit Dokument :: remove_value () zu löschen. testsuite: · Fix Testfall scaleweight4 nicht auf x86 fehlschlagen, wenn mit -O0 zusammengestellt. Das Problem wurde in dem Testfall-Code, und wurde von überschüssiger Präzision in Zwischen FP-Werten verursacht. · Testfälle, die überprüfen, dass Operationen haben die erwartete O (...) Verhalten keine Überprüfung CPU-Zeit statt Wanduhr Zeit auf den meisten Plattformen, die von anderen Prozessen wegen Belastungsspitzen gelegentlich Fehler beseitigen sollten. · (Ticket # 308) · Fix Testfehler aufgrund SKIP_TEST_FOR_BACKEND ( inmemory) Überspringen nicht, wenn es mit == zu vergleichen char Strings zurückzuführen sollte (am Stamm wird der Rückgabewert geprüft std :: string statt const char *). · Verbesserung der Testabdeckung in mehreren Fällen Ecke. · Fix Testfall consistency2 tatsächlich ausgeführt wird (zum Glück geht es). · In den generierten Testfällen, Call GET_DESCRIPTION () auf dem Standard-konstruiertes Objekt jeder Klasse, um sicherzustellen, dass die Arbeiten (und nicht zu dereferenzieren NULL nicht versuchen, oder eine Behauptung fehlschlagen, etc). Alle derzeit geprüften Klassen sind in Ordnung - das ist Zukunft Regressionen oder solche Probleme mit neuen Klassen zu vermeiden. · In der Testabdeckung zu bauen, verwenden Sie --coverage anstelle von -fprofile-Bögen -ftest-Abdeckung. · Test-Harnisch hat nun die inMemory backend gekennzeichnet als vom Benutzer angegebenen Metadaten (abgesehen von Iteration über Metadaten Tasten) zu unterstützen. Matcher: · Wenn eine Abfrage eine matchall Unterabfrage enthält, denn es ist zu überprüfen, bevor die anderen Bedingungen, so dass die Schleife überprüft, die überprüfen, wie viele Begriffe Spiel alle Spiele früh, wenn sie verlassen kann. ein · Wenn OR oder ANY_MAYBE abgeklungen zu einem UND waren wir sorgfältig die Kinder für maximale Effizienz tauschen, aber die Bedingung umgekehrt wurde, so dass wir in der Tat waren die Dinge noch schlimmer. Dies bemerkt wurde, weil es wurde in der gleichen Abfrage resultierende schneller laufen, wenn mehr Ergebnisse wurden gebeten! · Nur die termname zu termfreq und Gewicht Karte zum ersten Subdatenbank bauen, anstatt es für jeden von dem Wiederaufbau. Auch kopiere diese Karte nicht zurück. Dies sollte bis sucht ein wenig, vor allem solche über mehrere Datenbanken beschleunigen. · Wenn ein submatcher versagt aber Fehlerbehandler sagt uns, ohne es fortzusetzen, verwenden wir nur einen NULL-Zeiger eher zu stehen als ein spezielles Dummy-Platzhalter-Objekt zugeordnet werden. · Entfernen AndPostList, für MultiAndPostList. AndPostList wurde nur als Zerfallsprodukt (durch AndMaybePostList und OrPostList) verwendet wird, und scheint nicht schneller zu sein. Entfernen sie reduziert die CPU-Cache-Druck, und ist weniger Code zu erhalten. · Anruf check () statt skip_to () auf dem optionalen Zweig der AND_MAYBE. Flint Backend: · Behebung eines Fehlers in TermIterator :: skip_to () über Metadaten Tasten. Remote-Backend: · Fix xapian-tcpsrv --interface Option zur Arbeit auf MacOS X (Ticket # 373). · Fix Tippfehler, die uns veranlasst, die docid anstelle des Maximalgewicht ein Dokument von einem Remote-Spiel zurückkehren könnten zurückkehren! Dies könnte zu falschen Ergebnissen geführt haben, wenn mehrere Datenbanken mit dem Remote-Back-End-Benutzer, aber wahrscheinlich haben in der Regel keine Rolle, mit BM25 die Gewichte im Allgemeinen klein sind (oft alle <1) w


Xapian und Omega. Zugehörige Software

Civicrm

CIVICRM ist Relationship Management-Software für Non-Profit- und Nongovennmental-Sektoren. ...

77

Herunterladen