Lingua :: DE :: zusammenfassen

Ein einfaches Werkzeug zum Zusammenfassen des englischen Textes.
Jetzt downloaden

Lingua :: DE :: zusammenfassen Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Perl Artistic License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Dennis Taylor
  • Website des Verlags:
  • http://www.funkplanet.com/spellcast/

Lingua :: DE :: zusammenfassen Stichworte


Lingua :: DE :: zusammenfassen Beschreibung

Ein einfaches Werkzeug zum Zusammenfassen des englischen Textes. Lingua :: DE :: faszinieren ist ein einfaches Perl-Tool zum Zusammenfassen des englischen Textes.Synopsis Verwenden Sie Lingua :: DE :: zusammenfassen; meine $ Summary = zusammenfassen ($ Text); # Easy, nein? :-) meine $ Summary = zusammenfassen ($ text, maxlength => 500); # 500-Byte-Zusammenfassung meine $ Summary = zusammenfassen ($ Text, Filter => 'HTML'); # Streifen HTML-Formatierung meiner $ Summary = zusammenfassen ($ Text, Wrap => 75); # Wickelleistung auf 75 COL.Die ist ein einfaches Modul, das bei der Zusammenfassung des englischen Textes unwissenschaftlich müde. Es erkennt einfache Muster, die aussehen, wie Aussagen aussehen, sie abgeben, und verkettet sie in etwas vage, das einer Zusammenfassung ähnelt. Es braucht mehr Arbeit an großen Textkörpern, aber es scheint einen anständigen Effekt auf kleine Eingänge in der Moment zu haben. und eine beliebige Anzahl von optionalen Richtlinien in Name => Wertform. Die Optionen, die es annehmen wird der Summarizer. Derzeit werden nur zwei Filter implementiert: "HTML", der HTML :: TreeBuilder und HTML :: formText verwendet, um alle HTML-Formatierung aus einem Dokument zu streifen, und "easyhtml", die schnell (und weniger genau) alle HTML aus einem Dokument ausleihen Verwenden eines einfachen regulären Ausdrucks, wenn Sie nicht über die oben genannten Module verfügen. Ein "E-Mail" -Filter, zum Konvertieren von E-Mail- und Nachrichtennachrichten auf ein leicht summarisierbarer Text, ist in den Werken für die nächste Version.un, das HTML :: Summarize-Modul (das ziemlich interessant ist und einen Look wert ist), sieht dieses Modul an Eingabe, um ein einfacher englischer Text zu sein, und versucht nicht, Informationen von der Formatierung zu sammeln. Somit ist ohne Hinweise aus dem Format des Dokuments das Schema, das HTML :: zusammenfassen, nicht anwendbar ist. Das aktuelle Schema geht so etwas: "Filtern Sie den Text entsprechend der Filteroption des Benutzers. Spalten Sie den Text in diskrete Sätze mit dem Text :: Satz-Modul, teilen Sie sie dann weiter in Klauseln auf Kommas und Semikolons auf. Halten Sie nur die, die haben ein (Subjekt sehr einfach-Verbobjekt) -Struktur. Konstruieren Sie die Zusammenfassung der ersten Sätze in der Liste, bleiben Sie innerhalb der MaxLength-Grenze oder unter 30% der Größe des Originaltextes, je nachdem, was kleiner ist. "Unnötig zu sagen Dies ist ein sehr einfaches und nicht furchtbares universell wirksames Schema, aber es ist gut genug für einen ersten Entwurf, und ich werde es später mehr darauf schlagen. Wie ich sagte, ist es kein wissenschaftlicher Ansatz für das Problem, aber es ist besser als nichts (und oft besser als HTML :: zusammenfassen!), Brauche ich nicht wirklich A.I. Qualitätsausgabe von ihm. Anforderungen: · Perl.


Lingua :: DE :: zusammenfassen Zugehörige Software