Unicode :: MAP8.

Unicode :: MAP8 ist ein Mapping-Tisch zwischen 8-Bit-Zeichen und Unicode.
Jetzt downloaden

Unicode :: MAP8. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Perl Artistic License
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Gisle Aas
  • Website des Verlags:
  • http://search.cpan.org/~gaas/

Unicode :: MAP8. Stichworte


Unicode :: MAP8. Beschreibung

Unicode :: MAP8 ist ein Mapping-Tisch zwischen 8-Bit-Zeichen und Unicode. Unicode :: MAP8 ist ein Mapping-Tisch zwischen 8-Bit-Zeichen und Unicode.Synopsis erfordern Unicode :: MAP8; Meine $ no_map = Unicode :: MAP8-> NEU ("ISO646-Nein") || sterben; Mein $ l1_map = Unicode :: MAP8-> NEU ("Latin1") || sterben; My $ ustr = $ no_map-> bis 16 ("V} re Norske Tegn B | R {RESN"); meine $ lstr = $ l1_map-> to8 ($ ustr); drucken $ lstr; drucken $ no_map-> tou ("v} re Norske Tegn B | R {RESN") -> utf8the Unicode :: MAP8-Klasse Implementieren effizienter Mapping-Tabellen zwischen 8-Bit-Zeichensätzen und 16-Bit-Zeichensätzen wie Unicode. Die Tabellen sind sowohl in Bezug auf die zugewiesene Raum- als auch in Bezug auf die Übersetzungsgeschwindigkeit effizient. Es wird angenommen, dass die 16-Bit-Zeichenfolgen angenommen werden, um den Netzwerkbyte-Reihenfolge zu verwenden. Die folgenden Methoden stehen zur Verfügung: $ M = Unicode :: MAP8-> NEU () Der Objektkonstruktor erstellt neue Instanzen der Unicode :: MAP8-Klasse. Ich nehme ein optionales Argument an, das den Namen eines 8-Bit-Zeichens angeben, der auf die Initialisierung von Zuordnungen von vornimmt. Das Argument kann auch ein Name einer Mapping-Datei sein. Wenn sich die Charset / Datei nicht befinden kann, kehrt der Konstruktor undef zurück. Wenn Sie das Argument weglassen, ist ein leerer Mapping-Tisch aufgebaut. Sie müssen dann mithilfe der unten beschriebenen Addpair () -Methode zu Mapping-Paaren hinzufügen. $ M-> Addpair ($ U8, $ U16); fügt dem Zuordnungsobjekt ein neues Mapping-Paar hinzu. Es dauert zwei Argumente. Der erste ist der Codewert in dem 8-Bit-Zeichensatz und der zweite ist der entsprechende Codewert in dem 16-Bit-Zeichensatz. Die gleichen Codes können mehrmals verwendet werden (aber mit demselben Paar hat keine Wirkung). Die erste Definition für einen Code ist derjenige, der verwendet wird.Consider Das folgende Beispiel: $ m-> addpair (0x20, 0x0020); $ m-> addpair (0x20, 0x00a0); $ M-> Addpair (0xA0, 0x00A0); Es bedeutet, dass das Zeichen 0x20 und 0xA0 in dem 8-Bit-Charset in dem 16-Bit-Set an sich selbst ist, aber in der 16-Bit-Zeichensatz-Set 0x0A0-Karten auf 0x20. $ m -> Default_to8 ($ U8) Legen Sie den Code des Standardzeichens fest, der beim Abbilden von 16-Bit-bis 8-Bit-Saiten verwendet wird. Wenn kein Mapping-Paar für ein Zeichen definiert ist, wird diese Standardeinstellung von TO8 () und Recode8 () ersetzt. $ M-> default_to16 ($ u16) Stellen Sie den Code des Standardzeichens ein, das beim Mapping von 8-Bit bis 16 verwendet wird -Bit-Saiten. Wenn kein Mapping-Paar für ein Zeichen definiert ist, wird dieser Standard von tO16 (), tou () und recode8 () verwendet. $ M-> Nostrict; Alle undefinierten Zuordnungen werden durch die Identitätszuordnung ersetzt. Indefinierter Zeichen werden normalerweise nur entfernt (oder ersetzt ersetzt, wenn er definiert), wenn sie zwischen den Zeichensätzen konvertiert werden. $ M-> to8 ($ etr); Konvertiert eine 16-Bit-Zeichenfolge in die entsprechende Zeichenfolge in den 8-Bit-Zeichensatz. $ M-> bis 16 ($ STR); Konvertiert eine 8-Bit-Zeichenfolge in die entsprechende Zeichenfolge in den 16-Bit-Zeichensatz. $ M-> TOU ($ STR); SAME AN TO16 (), aber eine Unicode zurückgeben :: String-Objekt anstelle einer einfachen UCS2-Zeichenfolge. $ M-> Recode8 ($ M2, $ STR); Karten Sie die Zeichenfolge $ str von einem 8-Bit-Zeichensatz ($ m) auf ein anderes ($ m2). Da wir davon ausgehen, dass wir die Zuordnungen in Bezug auf die gemeinsame 16-Bit-Kodierung kennen, können wir diese mit einem der 8-Bit-Zeichensätze konvertieren. $ M-> to_char16 ($ U8) kennzeichnet einen einzelnen 8-Bit-Zeichencode an einen 16 -Bit-Code. Wenn das 8-Bit-Zeichen nicht abgeschaltet ist, wird der konstante NoChar zurückgegeben. Die Standardeinstellung wird nicht verwendet und die Rückrufmethode wird nicht aufgerufen. $ M-> to_char8 ($ U16) kennzeichnet einen einzelnen 16-Bit-Zeichencode auf einen 8-Bit-Code. Wenn das 16-Bit-Zeichen nicht definiert ist, wird der konstante NoChar zurückgegeben. Die Standardeinstellung wird nicht verwendet, und die Callback-Methode ist nicht aufgerufen. Die folgenden Rückrufmethoden stehen zur Verfügung. Sie können diese Methoden überschreiben, indem Sie eine Unterklasse von Unicode erstellen: Es wird mit einem einzigen Ganzzahl-Argument aufgerufen, das der Code des nicht definierten 16-Bit-Zeichens ist. Es wird erwartet, dass es eine Zeichenfolge zurückgibt, die in die 8-Bit-Zeichenfolge eingebaut wird. Die Standardversion dieser Methode gibt immer eine leere Zeichenfolge zurück. Example: Paket MyMapper; @ ISA = QW (Unicode :: MAP8); SUMMED_TO8 {MY ($ self, $ Code) = @_; Unicode :: charname; ""; } $ M-> unmarkiert_to16-wißzweilig, wenn das Zeichnungszeichen von 16 Bit und kein Mapping definiert ist, dann wird dieses Verfahren aufgerufen. Es sollte eine 16-Bit-Zeichenfolge mit den Bytes in der Netzwerkbyte-Bestellung zurückgeben. Die Standardversion dieser Methode gibt immer eine leere Zeichenfolge zurück. Anforderungen: · Perl.


Unicode :: MAP8. Zugehörige Software