HTML-Entitätsbasierte Codepage-Inferenz

HEBCI ist eine Technik, mit der ein Web-Formular-Handler den Zeichensatz transparent erfasst, mit dem seine Daten codiert wurden.
Jetzt downloaden

HTML-Entitätsbasierte Codepage-Inferenz Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • GPL
  • Preis:
  • FREE
  • Name des Herausgebers:
  • Josh Myer
  • Website des Verlags:
  • http://www.joshisanerd.com/ruby_index/

HTML-Entitätsbasierte Codepage-Inferenz Stichworte


HTML-Entitätsbasierte Codepage-Inferenz Beschreibung

HEBCI ist eine Technik, mit der ein Web-Formular-Handler den Zeichensatz transparent erfasst, mit dem seine Daten codiert wurden. HEBCI ist eine Technik, mit der ein Web-Formular-Handler den Zeichensatz transparent erkennen kann, mit dem seine Daten getrennt wurden, mit dem seine Daten codiert wurden. Durch sorgfältig gewählte Zeichenreferenzen kann die Codierung des Browsers abgeleitet werden neutral und passiv. Leider definiert der HTML-Spec keinen Mechanismus dafür. Wir müssen etwas anderes, Sneakier finden, um den aktuellen Zeichen, das vom Browser kodiert, zu extrahieren. Bei uns gibt es einen Trick, den wir dafür verwenden können: Entitätscodes. Entitätscodes sind Saiten wie, die (sind), um bestimmte Zeichen ohne Verwendung von Unicode zu kodieren. Wenn der Browser eine Seite anzeigt, ersetzt er diese mit dem entsprechenden Zeichen der aktuellen Codierung, und wird in den meisten Codepages zum Zeichen 0x26. Übrigens ist dies nur die Implementierung von Trivia. Dieser Übersetzungsprozess tritt jedoch auf, wenn ein Benutzer ein Formular einreicht. Das heißt, der Browser greift beliebige Entitäten in Formvariablen an und ersetzt sie mit der aktuellen Codierungsdarstellung dieser Zeichen, wenn der Benutzer einreichen. Somit werden alle Entitätscodes innerhalb der Formfelder als Zeichenwerte in der aktuellen Codierung des Browsers übergeben. So müssen wir nur eine Entität finden, die in zwei verschiedenen Codepages unterschiedlich codiert ist. Wir rutschen das in ein Formularfeld und schauen Sie sich den Wert an, wenn wir Daten erhalten. Dadurch können wir zwischen den beiden Kodierungen unterscheiden. In der Tat können wir in vielen Codepages alle Entitäten anschauen und finden, die es uns ermöglichten, zwischen vielen Codepages zu diszenieren. Dies ist das, was ich getan habe Wenn der Benutzer das Formular übermittelt, nehmen wir jedes derjenigen ein und vergleichen Sie sie mit einer Liste von welchem Charakter mit welchem Wert in welcher Codepage hat. Das heißt, jede Codepage hat einen einzigartigen Fingerabdruck für die Werte von °, ÷, -. Für Macroman ist es A1, D6, D1; Für UTF-8, C2B0, C3B7, E28094. Somit müssen wir nur unsere Tabelle von Codepage-to-Fingerprint-Zuordnungen durchlaufen, und sehen Sie, welchen Fingerabdruck übereinstimmt. Nound, dass, sobald diese Tabelle entdeckt ist, die Kosten für Fingerabdrücke, die eine bestimmte Formularvorlage ergibt, sehr niedrig ist. Und im Falle von Fehlern können Sie annehmen, welche Standardcodepage Ihrer Seite ist. Dieser Fallthrough-Fall entspricht dem, was der Code vor dem Hinzufügen dieser Erfassungsschicht getan hätte.


HTML-Entitätsbasierte Codepage-Inferenz Zugehörige Software