Cuda Visual Profiler.

Ein nützliches Cuda-Werkzeug von Nvidia
Jetzt downloaden

Cuda Visual Profiler. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Freeware
  • Name des Herausgebers:
  • Nvidia
  • Betriebssysteme:
  • Windows XP / Vista / XP X64 / Vista64
  • Dateigröße:
  • 5.6 MB

Cuda Visual Profiler. Stichworte


Cuda Visual Profiler. Beschreibung

Cuda Visual Profiler ist ein dediziertes Werkzeug zum Arbeiten mit NVIDIA GPU-Karten und mit dem dedizierten Toolkit. Haupteigenschaften: Ausführen eines CudA-Programms mit der Profilierung aktiviert und zeigt den Profilerausgang als Tabelle an. Die Tabelle enthält für jede GPU-Methode die folgenden Spalten: Zeitstempel: Startzeitstempel Methode: GPU-Methodenname. Dies ist entweder "MEMCOPY" für Speicherkopien oder den Namen eines GPU-Kernels. GPU-Zeit CPU-Zeit Stream ID: Identifikationsnummer für den Stream Säulen nur für Kernel-Methoden: Belegung Profilerzähler: GLD Uncoalesced: Anzahl der nicht koaleszenzierten globalen Speicherlasten GLD Coalesced: Anzahl der koaleszenzierten globalen Speicherlasten GST UNCOALESCED: Anzahl der nicht koaleszenzierten globalen Memory-Shops GST COALESSED: Anzahl der koaleszenzierten globalen Memory-Shops Lokale Last: Anzahl der lokalen Speicherlasten Local Store: Anzahl der lokalen Speicherspeicher Zweig: Anzahl der Zweigveranstaltungen (Anweisungs- und / oder Sync-Stack) Divergierter Zweig: Anzahl abweichender Zweige innerhalb eines Warp Anweisungen: Anzahl der dynamischen Anweisungen (in FETCH) Warp Serialize: Anzahl der Threads in einer Warp-Serialize basierend auf der Adresse (GRF oder Konstant) CTA Start: Anzahl der CTAS, die auf dem PM TPC gestartet wurden Gittergröße X: Anzahl der Blöcke im Gitter entlang der Dimension x Gittergröße y: Anzahl der Blöcke im Gitter entlang der Dimension y Blockgröße x: Anzahl der Threads in einem Block entlang der Dimension x Blockgröße y: Anzahl der Threads in einem Block entlang der Dimension y Blockgröße Z: Anzahl der Threads in einem Block entlang der Dimension Z dyn SMEM pro Block: dynamische gemeinsame Speichergröße pro Block in Bytes STA SMEM pro Block: Statische gemeinsame Speichergröße pro Block in Bytes REG pro Thread: Anzahl der Register pro Thread Säulen nur für Memcopy-Methoden: MEM Transfer Dir: Speicherübertragungsrichtung, 0: Host an Gerät, 1: Gerät zum Host MEM Übertragungsgröße: Speicherübertragungsgröße in Bytes Bitte verweisen Sie den Abschnitt "Interpretations-Profiler-Zähler", um weitere Informationen zu Profilerzähler zu erhalten. Beachten Sie, dass Profilerzähler auch als Profilersignale bezeichnet werden. Zeigt die Zusammenfassungs-Profiler-Tabelle an. Es verfügt über folgende Spalten für jede GPU-Methode: Methode: Methodenname #calls: Anzahl der Anrufe GPU USEC: Gesamt-GPU-Zeit in Micro-Sekunden CPU USEC: Gesamt-CPU-Zeit in Micro-Sekunden % GPU-Zeit: Prozentsatz GPU-Zeit Gesamtzählungen für jeden Profilerzähler Zeigt verschiedene Arten von Plots an: Zusammenfassung Profiling Data Bar Plot GPU-Zeithöhe-Grundstück GPU Time Width Plot Profilerzähler-Bar-Plot Profiler-Ausgabetabellen-Spalte-Bar-Plot Vergleichszusammenfassung Plot Analyse der Profilerausgabe listet die Methode mit einer hohen Anzahl an: inkohärente Filialen inkohärente Lasten Warp Serialisations Vergleichen Sie die Profilerausgabe für mehrere Programmläufe desselben Programms oder für verschiedene Programme. Jeder Programmlauf wird als Sitzung bezeichnet. Speichern Sie Profilierdaten für mehrere Sitzungen. Eine Gruppe von Sitzungen wird als Projekt bezeichnet. Importieren / Exportieren von CUDA Profiler CSV-Format-Daten.


Cuda Visual Profiler. Zugehörige Software