Text :: UNIDECODE.

Text :: UNIDECODE ist ein US-ASCII-Transliteration von Unicode-Text.
Jetzt downloaden

Text :: UNIDECODE. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Perl Artistic License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Sean M. Burke
  • Website des Verlags:
  • http://search.cpan.org/~sburke/

Text :: UNIDECODE. Stichworte


Text :: UNIDECODE. Beschreibung

Text :: UNIDECODE ist ein US-ASCII-Transliteration von Unicode-Text. Text :: UNIDECODE ist ein US-ASCII-Transliteration von Unicode Text.Synopsis Verwenden Sie UTF8; Verwenden Sie Text :: UNIDECODE; Drucken Sie UNIDECODE ("X {5317} x {4EB0} n" # # {4EB0} n "# #, sind die chinesischen Zeichen für Peking); # Das druckt: Bei Jingit gibt es oft, dass Sie nicht-römische Textdaten in Unicode verfügen, aber Sie können es nicht anzeigen - normalerweise, weil Sie versuchen, es einem Benutzer über eine Anwendung anzuzeigen, die nicht Unicode unterstützt, oder weil die Schriftarten, die Sie benötigen, nicht zugänglich sind. Sie könnten die Unicode-Zeichen als "???????" darstellen oder "15BA15A01610 ...", aber das ist fast nutzlos für den Benutzer, der tatsächlich lesen möchte, was der Text sagt, was der Text sagt. Jeder Text :: UNIDECODE bietet eine Funktion, UniDecode (...), das Unicode-Daten annimmt und versucht, es darzustellen In US-ASCII-Zeichen (dh die universell anzeigbaren Zeichen zwischen 0x00 und 0x7f). Die Darstellung ist fast immer ein Versuch der Transliteration - d. H. Förderung, in römischen Buchstaben Die Aussprache, die der Text in einem anderen Schreibsystem exprimiert hat. (Siehe das Beispiel in der Zusammenfassung.) Die Fähigkeit des UNIDECODE, Transliterate zu übersetzen. in einer Aussprache. S f y hv n vwls n th npt, y w nicht gt ny vwls n th tpt. (Dies ist eine spezifische Anwendung des allgemeinen Prinzips von "Müll in, Müll aus".) · Grundeinschränkungen in der UniDecode-Designwriting, die ein echter und cleverer Transliterationsalgorithmus für jede einzelne Sprache für jede einzelne Sprache benötigt, erfordert in der Regel viel Zeit und zumindest ein passierbares Wissen der beteiligten Sprache. Der Unicode-Text kann jedoch mehr Sprachen vermitteln, als ich möglicherweise lernen könnte (viel weniger einen Transliterator für) im gesamten Rest meiner Lebenszeit erstellen. Also legte ich eine Kappe auf, wie intelligente UNIDECODE sein könnte, indem Sie darauf bestehen, dass er nur eine kontextunensitive Transliteration unterstützt. Das bedeutet, die feineren Details eines bestimmten Schreibsystems zu fehlen, während noch hoffentlich nützlich sein Manchmal ist der Ausgang überhaupt nicht so schmutzig: Russisch und Griechisch scheinen passieren zu arbeiten. Und während Thaana (Divehi, alias Maldivian) ein definitiv nicht westliches Schreibsystem ist, scheint ein Mapping von IT nach römischen Buchstaben ziemlich gut zu arbeiten. Manchmal ist der Ausgang jedoch sehr dreckig: Unidecode macht recht schlecht auf japanisch und thailändisch Es anstelle von (oder zumindest zuvor) Anwenden von UniDecode. Andere andere Worte, der Ansatz von Unidecode ist breit (Wissen über Dutzende von Schreibsystemen), aber flach (nicht sorgfältig von ihnen). Anforderungen: · Perl.


Text :: UNIDECODE. Zugehörige Software