Der Radiologe

, Volume 46, Issue 10, pp 847–860

Absorptiometrie

Authors

    • Department of RadiologyUniversity of California San Francisco
Osteoporose

DOI: 10.1007/s00117-006-1414-3

Cite this article as:
Prevrhal, S. Radiologe (2006) 46: 847. doi:10.1007/s00117-006-1414-3

Zusammenfassung

Die vorliegende Übersicht gibt eine Einführung zur Zweispektren-Röntgenabsorptiometrie oder DXA (dual X-ray absorptiometry), der erfolgreichsten und am weitesten verbreiteten Methode in der Osteoporosediagnostik. DXA-Untersuchungen dienen zur Messung der projektiven Knochendichte der Wirbelsäule, des Hüftknochens, des gesamten Skeletts und zur Erfassung morphometrischer Parameter an der Hüfte und Wirbelsäule sowie an der Skelettperipherie am Unterarm, an der Hand und der Ferse. Hauptsächliche klinische Anwendungsbereiche sind Diagnose und Verlaufskontrolle der Osteoporose und ihre Therapie. Aufgrund der hohen Genauigkeit, Präzision und guten Einschätzung des osteoporotischen Frakturrisikos sowie der relativ kostengünstigen Anwendbarkeit hat sich die DXA gegenüber alternativen Methoden weitgehend durchgesetzt. Im Folgenden werden physikalische und technische Grundlagen behandelt sowie die verschiedenen Aufnahmeprotokolle, Qualitätsmerkmale, Fehlerquellen und ihre Bedeutung. Verschiedene Messregionen mit Angaben von Präzision, nominalen Messwerten und Nutzen zur Vorhersage des Frakturrisikos sowie die Ergebnisse großer klinischer Studien werden ebenfalls beschrieben.

Schlüsselwörter

OsteoporoseZweispektrenverfahrenAbsorptiometrieKnochenmineraldichteÜbersicht

Absorptiometry

Abstract

This article is an introduction to dual X-ray absorptiometry (DXA), the most widely used method today for diagnosis of osteoporosis. DXA can be used to assess projective bone mineral density at the lumbar spine, the proximal hip, and the whole body as well as the skeletal periphery at the forearm, the hand, and the heel. The prominent area of application of DXA is the diagnosis and monitoring of osteoporosis and its treatment. Because of its high accuracy, precision, and ability to predict osteoporotic fracture as well as its relatively low cost, DXA has prevailed over alternative methods. This article discusses the underlying X-ray physics and technological aspects, acquisition protocols, quality characteristics, and sources of error and their relevance. It also describes the various skeletal regions accessible to measurement, details on precision, nominal results, usability to predict fracture risk, and results of influential clinical trials.

Keywords

OsteoporosisDual X-ray energy applicationsAbsorptiometryBone mineral densityReview

Osteoporose ist eines der größten Probleme der Volksgesundheit. Für eine weiße Frau beträgt das Risiko einer Hüftfraktur während der gesamten Lebenszeit ab Eintritt der Menopause 15–20% und weitere 15–20% für osteoporotische Frakturen an der Wirbelsäule und am Unterarm. Dies entspricht dem lebenslangen Risiko einer Herz-Kreislauf-Erkrankung [32]. Mehrere Medikamente zur Behandlung und Vorsorge stehen zur Verfügung, sodass Früherkennung sinnvoll und notwendig erscheint.

Diese Übersicht präsentiert eine Einführung in die Zweispektren-Röntgenabsorptiometrie oder DXA (dual X-ray absorptiometry), der erfolgreichsten und am weitesten verbreiteten Methode der Osteoporosediagnose. DXA-Untersuchungen dienen der Messung der projektiven Knochendichte der Wirbelsäule, des Hüftknochens, des gesamten Skeletts und zur Erfassung morphometrischer Parameter an der Hüfte und Wirbelsäule sowie an der Skelettperipherie am Unterarm, an der Hand und der Ferse. Die hauptsächlichen klinischen Anwendungsbereiche sind die Diagnose und Verlaufskontrolle der Osteoporose und ihrer Behandlung; aufgrund der hohen Genauigkeit, Präzision und relativ kostengünstigen Anwendbarkeit hat sich DXA gegenüber alternativen Methoden weitgehend durchgesetzt.

Nach einer einführenden Beleuchtung der zugrunde liegenden Physik und Technik behandelt dieses Kapitel die verschiedenen Aufnahmeprotokolle, Qualitätsmerkmale, Fehlerquellen und ihre Bedeutung und verschiedene Messregionen mit Angaben von Präzision, nominalen Messwerten und Nutzen zur Vorhersage von Frakturrisiko und Ergebnissen großer klinischer Studien.

Physik der Absorptiometrie

Während die Röntgenstrahlung das Körpergewebe durchdringt, wird sie durch Absorption und Streuung der Quanten aus dem Primärstrahl geschwächt. Da die Größe der Schwächung von den relativen Mengen von Knochen und Weichgewebe und deren Dichten abhängt, lassen sich aus der Messung der Schwächung mit einem geeigneten Röntgendetektor Rückschlüsse auf die Knochendichte ziehen. Bei den in der DXA verwendeten niedrigen Energien von 30–140 keV überwiegt für Knochen die Photoabsorption, während im Weichgewebe Comptonstreuung dominiert. Da die Stärke der Strahlintensitätsschwächung an einem Punkt x entlang des Strahls von der gewebespezifischen Schwächung μ abhängt,
$$ \frac{{dI}} {{dx}} = - \mu {\left( x \right)}dx $$
(1.1)
ergibt sich die am Dektektor gemessene verbleibende Strahlintensität I durch Integration über die Länge des Strahls L
$$ I = I_{0} e^{{{\int\limits_L {\mu {\left( x \right)}dx} }}} $$
(1.2)
Bei Kenntnis der röhrenseitigen Intensität I0lässt sich der Exponent explizit durch
$$ {\int\limits_L {\mu {\left( x \right)}dx} } = - \ln \frac{I} {{I_{0} }} $$
(1.3)

darstellen. Der Schwächungskoeffizient μ ist also als der relative Verlust von Strahlungsintensität (oder auch Anzahl Röntgenquanten) nach Durchdringen einer Längeneinheit (normalerweise 1 cm) eines bestimmten Materials definiert.

Die Schwächung hängt in komplizierter Weise von der atomaren oder bei Gemischen und chemischen Verbindungen von der effektiven Ordnungszahl des Materials ab. Mit der Materialdichte ρ allerdings besteht ein linearer Zusammenhang, sodass eine Darstellung als (material-)spezifischer Schwächungswert vorteilhaft ist (Abb. 1):
Abb. 1

Der lineare Schwächungskoeffizient ist als materialspezifischer relativer Intensitätsverlust pro Längeneinheit eines durchdrungenen Materials definiert

$$ \mu _{s} \frac{\mu } {\rho } $$
(1.4)
Da die Dichte als Masse pro Volumeneinheit definiert ist und z. B. in g/cm3 bestimmt werden kann, ergibt sich für den spezifischen Schwächungswert die Einheit cm2/g. Damit ergibt sich Gleichung (1.3) zu einem logarithmischen Transmissionsfaktor von
$$ - \ln \frac{I} {{I_{0} }} = {\int {\mu _{s} {\left( x \right)}\rho dx} } $$
(1.5)

und damit eine Abhängigkeit von ρ dx in g/cm2, oder Flächendichte genau der Größe, die in der Absorptiometrie bestimmt wird. Da allerdings entlang jedes Strahls sowohl Weichgewebe als auch Knochen durchdrungen werden, muss zur Berechnung der Knochendichte weiter separiert werden.

Zweispektrenverfahren

Diese Methoden nutzen die Tatsache, dass Schwächungskoeffizienten unterschiedlicher Materialien auch unterschiedliche Abhängigkeit von der Energie der Röntgenquanten zeigen. Dies ist in Abb. 2 dargestellt.
Abb. 2

Energieabhängigkeit der spezifischen Schwächungswerte von kortikalem Knochen und Wasser (Daten vom US National Institute of Standards)

Das Operationsprinzip projektiver Zweispektrenmethoden wird in Abb. 3 gezeigt. Dabei werden 2 Röntgenaufnahmen bei unterschiedlichen Energien durchgeführt. Danach wird die höherenergetische mit einem geeigneten Faktor k multipliziert und von der niederenergetischen Aufnahme subtrahiert. k wird dabei so gewählt, dass sich der Weichgewebeanteil im Differenzbild zu Null ergibt. Die im Differenzbild verbleibenden Werte stellen somit reinen Knochen dar.
Abb. 3

Am Detektor gemessene Schwächungsprofile. Die obersten Profile stellen die Messungen bei höherer bzw. niedrigerer Energie dar. Das höhere Profil wird mit einem Faktor k multipliziert, der so gewählt wird, dass sich bei Subtraktion der Profile der Weichgewebeanteil zu Null ergibt. Die verbleibenden Werte stellen damit den reinen Knochenanteil dar. (Aus [7], mit Genehmigung des Verlags)

Mit Hilfe des k-Faktors kann dann leicht die Knochenflächendichte berechnet werden. Da jedoch die Genauigkeit der Messungen kritisch ist, müssen Strahlaufhärtungseffekte berücksichtigt werden, welche die effektive Energie beeinflussen, von denen wiederum die spezifischen Schwächungswerte abhängen. Die Stärke der Strahlaufhärtung steigt mit der Dichte und der Größe des Knochenanteils im Strahlengang. GE Lunar und Hologic, die DXA-Hersteller mit den größten Marktanteilen, haben unterschiedliche Korrekturverfahren implementiert, die im nächsten Abschnitt einführend beleuchtet werden.

Technik

Röntgenquellen und Detektoren

Historisch gesehen stellt DXA eine Weiterentwicklung der „dual-photon absorptiometry“ (DPA) dar, die als Strahlungsquelle das Radionuklid Gadolinium-153 verwendet, welches Quanten mit 44 und 100 keV emittiert. Relativ niedrige Halbwertszeiten und Aktivitäten machen DPA-Geräte unattraktiv gegenüber Röntgenröhren-basierten DXA-Systemen. Röntgenstrahlung hat allerdings ein kontinuierliches, von Bremsstrahlung dominiertes Spektrum, und die benötigten 2 Energiebereiche müssen entweder durch geeignete Filterung oder durch Wechselschalten der Röhrenspannung generiert werden. Filtermethoden spalten das Röhrenspektrum durch röhrenseitige K-Kantenfilter (bestehend aus den seltenen Erden Cerium, Neodym oder Samarium) in einen niedrigen und hohen Bereich auf und bedingen weiterhin aufwändigere energiediskriminierende Detektoren (wie CZT-Detektoren im GE Lunar Prodigy) oder eine Anordnung von 2 getrennten Detektoren, da beide Energien zu gleicher Zeit emittiert werden (wie in den Lunar-DPX- und Norland-Geräten).

Das 1. auf diesem Prinzip beruhende Gerät, das Lunar DPX (nunmehr General Electrics, GE), wurde 1989 eingeführt [45]. Die bei den DPX-Varianten eingesetzten Röhren haben eine stationäre Anode und eine feste Spannung von 76 kV, welche der K-Kantenfilter aus Cerium in Bereiche mit effektiven Energien von 38 und 70 keV aufspaltet. Die Detektoren erfassen die Pulsrate und verwenden eine Pulshöhenanalyse, um zwischen den beiden Energien zu diskriminieren. Der Vorteil ist ein geringerer Einfluss von Strahlaufhärtung. Allerdings ist auch der Bereich der maximal erfassbaren Photonenfluenz begrenzt, was problematisch bei Ganzkörperuntersuchungen sein kann, da diese sehr hohe Kontraste haben.

In Geräten mit Wechselschaltung, wie erstmals das 1987 bereitgestellte Hologic QDR-1000 wird die Röhrenspannung zwischen 70 und 140 kV mit der Netzfrequenz (in Europa 50 Hz) hin- und hergeschaltet, wodurch sich effektive Röntgenenergien von 43 bzw. 110 keV ergeben. Bei neueren Geräten wurde die niedrigere Energie auf 100 kV geändert. Einfacher verschaltete energieintegrierende Detektoren können zum Einsatz kommen, da die 2 Energien nun in 10-ms-Abständen zeitlich diskret erfasst werden. Allerdings sind die 2 Energiespektren breiter als bei den röhrenfilterbasierten Systemen, und Fehler durch Strahlaufhärtung müssen aufwendig korrigiert werden.

Strahlaufhärtungskorrektur

Wie aus Abb. 2 ersichtlich ist, werden Röntgenquanten mit niedriger Energie vorzugsweise absorbiert oder gestreut, sodass der aus dem Körper austretende Röntgenstrahl stärkere Schwächung im Niederenergiebereich im Vergleich zu höheren Energien aufweist. Damit ist sein Spektrum gegenüber dem Eintrittsspektrum im Mittel zu höheren Energien verschoben. Dieses Phänomen wird Strahlaufhärtung genannt. In Systemen mit Spannungswechselschaltung, die breitere Spektren aufweisen als filterbasierte Systeme, führt sie zu einem Fehler bei der Abschätzung der Weichgewebeschwächung und damit bei der Berechnung der Knochendichte.

Hologic ist der einzige Anbieter von Systemen mit Spannungswechselschaltung und platziert im Strahlengang einen sich drehenden scheibenförmigen oder bei neueren Geräten zylinderförmigen internen Kalibrierstandard mit einer Unterteilung in 3 Sektoren, die Filterplatten aus weichgewebe-äquivalentem und knochenäquvalentem Epoxidharz enthalten. Der 3. Sektor ist leer. Jeder Sektor ist in 2 gleich große Abschnitte unterteilt, in denen zusätzlich eine 3 mm dicke Kupferfilterplatte unterlegt ist. Die Laufgeschwindigkeit des Kalibrierstandards ist mit der Spannungswechselschaltung derart synchronisiert, dass sich die Subsektoren mit Kupferfilter nur während der Phasen mit der höheren Energie im Strahlengang befinden und dann die niederenergetischen Anteile herausfiltern, was eine bessere Abgrenzung der beiden Energiebereiche bewirkt. Somit stehen für jedes Pixel im entgültigen Knochendichtebild 6 Werte zur Verfügung; Der k-Faktor lässt sich anstelle durch Abschätzung in Regionen von Körperweichgewebe nun für jedes beliebige Pixel als Verhältnis der Transmissionsunterschiede zwischen ungefilterter und mit dem weichgewebeäquivalenten Sektor gefilterten Messung bei niedriger und hoher Energie bestimmen.

Strahlengang

Im Wesentlichen kann nach dem Strahlengang zwischen 3 Klassen von Geräten unterschieden werden, den
  • Parallel-Einzelstrahl- (Pencil-beam-),

  • Fächerstrahl- (Fan-beam-) und

  • Kegelstrahl- (Cone-beam-)Geometrien.

Pencil-beam-Geräte tasten die zur erfassende Körperregion mit einem dünnen, immer zur Patientenliege senkrecht gehaltenen Strahl schlangenförmig ab und kommen mit einem einfachen Pin-hole-Detektor aus, während Fan-beam-Geräte eine fächerförmige Strahlebene linear über die interessierende Region bewegen und einen Zeilendetektor benötigen. Schließlich verwenden Cone-beam-Geräte einen Flächendetektor und benötigen maximal 2 stationäre Belichtungen zur Abdeckung der interessierenden Region.

Pencil beam

Aufgrund der orthogonalen Strahlgeometrie hat jedes Pixel in den erzeugten Knochendichtebilder die gleiche geometrische Durchdringungslänge, im Unterschied zu Fan- und Cone-beam-Scannern. Anders als bei Fan-beam-Geräten ensteht kein Vergrößerungsfehler (Abb. 4).
Abb. 4

Pencil-beam- und Fan-beam-Geometrie. Bei der Fan-beam-Geometrie hängt die Durchdringungsdicke vom Kosinus des Durchdringungswinkels ab: deff=d/ cosα. Dieser Winkel bestimmt zusammen mit dem relativen Abstand der Messregion von Röhrenfokus und Detektor auch den Vergrößerungsfehler von Flächenmessungen

Da sich der Knochenmineralgehalt BMC als Produkt der Dichte BMD und der Fläche A der Messregion bestimmt und A bei cone beam nicht fehlerfrei bestimmt werden kann, bedingt dieses Unterscheidungsmerkmal, dass sich nur Pencil-beam-Geräte gut zur Bestimmung von BMC eignen!

Untersuchungen mit Pencil-beam-Geräten dauern aufgrund der komplizierteren Abtastung länger, allerdings bieten neuere GE-Geräte einen Fast-scan-Modus an, der mit höherem Röhrenstrom kürzere Scanzeiten zulässt.

Fan beam

Die hauptsächliche Vorteile der Fächerstrahlgeometrie liegen in der kürzeren Untersuchungszeit aufgrund der einfacheren Abtastung, wobei während des Scans in der Praxis Röhre und Detektor über dem Patienten linear verschoben werden. Weiterhin bieten sie eine bessere Ortsauflösung, was v. a. bei Wirbelmorphometrieuntersuchungen zum Tragen kommt. Allerdings sind Fächerstrahlgeräte aufgrund der Kosten für den Zeilendetektor teurer, sodass Pencil-beam-Geräte zumindest für Praxen mit geringerem Patientendurchsatz interessant bleiben. Die beiden Bautypen werden von alle Herstellern angeboten. Fan-beam-Geräte sind so kalibriert, dass BMD-Messungen mit den Werten von Pencil-beam-Maschinen weitestgehend übereinstimmen, wobei Flächenmessungen und damit BMC-Berechnungen signifikant abweichen [5]. Die Kreuzkalibrierung ist auf jeden Fall ein Muss beim Austausch, größeren Servicearbeiten und Studien mit mehreren teilnehmenden Geräten, da auch BMD-Messungen systematische Fehler aufweisen können [28]. Beim Vergleich von Messungen an Kindern ist besondere Vorsicht geboten; die Ergebnisse korrelieren zwar sehr gut, aber systematische Unterschiede wurden aufgezeigt [55].

Neben reinen Pencil-beam- und Fan-beam-Geräten exisitieren auch hybride Geometrien, die einen beschränkten Fächerstrahl rektilinear über die Messregion rastern (GE Prodigy SmartFAN), um an die Geschwindigkeit der reinen Fan-beam-Scanner zu gelangen, aber ohne deren Nachteil der Verzerrung für Flächenmessungen in Kauf nehmen zu müssen. Messungen auf diesen Geräten weisen auch Abweichungen von Pencil-beam-Geräten auf [38].

Cone beam

Mit der besseren Verfügbarkeit digitaler flächiger Röntgendetektoren (flat panel) wurde die Entwickung von Cone-beam- oder Kegelstrahlgeräten eingeleitet. Derzeit vermarktet Diagnostic Medical Systems (DMS, Montpellier Pérols, Frankreich) das Lexxos, ein Ganzkörper-DXA mit einem 400 cm2 großen Flat-panel-Detektor, bestehend aus einem Gd2O2S-Szintillator und amorphen Siliziumphotodioden mit Unterteilung in 512×512 Detektorpixels und einer Röhre mit Wechselschaltung zwischen 75 und 140 kV. Aufgrund der Größe der Detektoren kommen solche Geräte praktisch ohne Scanbewegung aus, eine einzige stationäre Aufnahme genügt für eine Hüft- oder Wirbelsäulenuntersuchung. Dadurch reduziert sich die Untersuchungsdauer auf 1–2 s und wird damit zur Gänze von Patientenvor- und Nachbereitungszeiten bestimmt. Die unübertroffene räumliche Bildauflösung dieser Detektoren (am Lexxos 1,6 Linienpaare/mm,) ist praktisch doppelt so hoch wie auf einem Fan-beam-Gerät und homogen in beide Richtungen, was morphometrische Untersuchungen an der Wirbelsäule erleichtern sollte [10]. Nachteilig an Kegelstrahlgeräten ist der nun in beiden Richtungen (lateral und kraniokaudal) bestehende Vergrößerungseffekt.

Qualitätscharakteristika

Präzision

Die Präzision oder Reproduzierbarkeit ist eine wichtige Größe bei der Evaluierung verschiedener DXA-Methoden und Geräte, da sie die Güte von Verlaufskontrollmessungen bestimmen, wie im Folgenden gezeigt wird. Die Bestimmung der Kurzzeitreproduzierbarkeit wird am besten an einer kleinen Gruppe repräsentativer Versuchspersonen durchgeführt, wobei jeder Teilnehmer mehrmals gemessen wird und zwischen den Messungen komplett repositioniert werden sollte. Für jeden Teilnehmer lassen sich dann Mittelwert und Varianz errechnen:
$$ \begin{array}{*{20}l} {{\bar{x}_{j} = {\sum\limits_i {{x_{{ij}} } \mathord{\left/ {\vphantom {{x_{{ij}} } m}} \right. \kern-\nulldelimiterspace} m} }} \hfill} \\ {{\operatorname{var} {\left( {x_{j} } \right)} = {\sum\limits_i {{{\left( {x_{{ij}} - x_{j} } \right)}^{2} } \mathord{\left/ {\vphantom {{{\left( {x_{{ij}} - x_{j} } \right)}^{2} } {{\left( {m - 1} \right)},}}} \right. \kern-\nulldelimiterspace} {{\left( {m - 1} \right)},}} }} \hfill} \\ \end{array} $$
(1.6)
wobei m die Anzahl der Messwiederholungen, i die Nummer der Messung und j die Nummer des Teilnehmers bedeuten. Daraus lassen sich das Gesamtmittel, die mittlere Varianz und der Variationskoeffizient CV (coefficient of variation) mit
$$ \begin{array}{*{20}l} {{\bar{x} = {\sum\limits_i {{x_{j} } \mathord{\left/ {\vphantom {{x_{j} } n}} \right. \kern-\nulldelimiterspace} n} }} \hfill} \\ {{\overline{{\operatorname{var} {\left( x \right)}}} = {\sum\limits_i {{\operatorname{var} {\left( {x_{j} } \right)}} \mathord{\left/ {\vphantom {{\operatorname{var} {\left( {x_{j} } \right)}} n}} \right. \kern-\nulldelimiterspace} n} }} \hfill} \\ {{{\text{CV}}{\left( x \right)} = {{\sqrt {\overline{{\operatorname{var} {\left( x \right)}}} } }} \mathord{\left/ {\vphantom {{{\sqrt {\overline{{\operatorname{var} {\left( x \right)}}} } }} {\bar{x} \bullet 100\% }}} \right. \kern-\nulldelimiterspace} {\bar{x} \bullet 100\% }} \hfill} \\ \end{array} $$
(1.7)

für die Teilnehmer berechnen. Obwohl die mittlere Varianz das statistisch sinnvollere Maß als CV ist, erleichtert der dimensionslose Variationskoeffizient CV den Vergleich zwischen Methoden mit stark verschiedenen Mittelwerten. Allerdings ist Vorsicht bei der Interpretation von CV für Techniken geboten, bei denen der Mittelwert Null oder nahe Null sein kann, wie beispielsweise für die quantitative CT. Weiterhin muss in Betracht gezogen werden, dass die Bestimmung von CV selbst Fehlergrenzen unterliegt, die zum einen von der Anzahl der Einzelmessungen und Teilnehmern durch die Anzahl der Freiheitsgrade df = n·(m−1) und zum anderen von tatsächlichen Unterschieden der Reproduzierbarkeit der Messungen für einzelne Teilnehmer abhängt. So ist es einsichtig, dass ein junger gesunder Patient sich besser repositionieren lässt als ein älterer osteoporotischer Patient; daher ist es wichtig, die Präzision im Kontext der untersuchten Teilnehmergruppe zu verstehen.

Die Messanzahl sollte df ≥30 erreichen, z. B. 4 Messungen an 10 Teilnehmern; Genaueres dazu kann bei Glüer et al. [24] nachgelesen werden . Mit CV lässt sich eine weitere wichtige Kenngröße, der kleinste signifikante Unterschied LSD (least significant difference), berechnen: LSD gibt den kleinsten Unterschied zwischen 2 Messungen an, der bei gegebener Messunschärfe auf einem Niveau p <0,05 noch als signifikant bezeichnet werden darf; kleinere Unterschiede als LSD müssen der Messunschärfe zugeschrieben werden. Der prozentuelle LSD berechnet sich zu LSD=2.77CV.

Anders formuliert besagt LSD, dass der Nachweis einer tatsächlichen Veränderung von 3% (in etwa der durchschnittliche jährliche Dichteverlust postmenopausaler Frauen an der Lendenwirbelsäule) eine Gerätepräzision von mindestens CV=1% voraussetzt. Durch Dividieren der LSD durch die erwartete Veränderung pro Jahr lässt sich die charakteristische Wartezeit berechnen, welche die Mindestzahl der Jahre zwischen 2 Messungen ergibt, nach denen mit einer signifikant messbaren Veränderung zu rechnen ist [23].

Die Langzeitreproduzierbarkeit ist zusätzlichen Fehlerquellen wie Drift in der Geräteeichung, Veränderung des Teilnehmers (Gewicht, Knochendichte, Weichgewebezusammensetzung) und Veränderungen in der Aufnahmetechnik unterworfen und daher schwerer durchführbar, obwohl sie nützlichere Ergebnisse zur Abschätzung des LSD liefert, da Verlaufskontrollmessungen ebenfalls den gleichen zusätzlichen Fehlerquellen unterworfen sind. Um ihre Erfassung von tatsächlichen Veränderungen der Knochendichte der Teilnehmer unabhängig zu machen, werden zuerst teilnehmerspezifische Standardfehler aus linearer Regression (SEEj) gewonnen. Mit Ersetzen der Varianz in den Gleichungen 1.6 und 1.7 mit dem mittleren SEE-Quadrat lässt sich CVLangzeit berechnen.

Allerdings erlauben Variationskoeffizient und LSD allein keinen fairen Vergleich der Präzision von Geräten oder Techniken, deren Messwerte stark unterschiedliche Bandbreiten besitzen, sondern sie müssen im Kontext der zu erwartenden Dichteveränderungen interpretiert werden: Kleine Veränderungen benötigen höhere Präzision. Dem versucht neben der charakteristischen Wartezeit auch der standardisierte Variationskoeffizient Rechnung zu tragen, bei dessen Berechnung die Varianz nicht durch das Mittel, sondern durch die klinische Bandbreite dividiert wird. Obwohl die meisten Untersuchungen die Definition der klinischen Bandbreite nach Miller et al. [48] verwenden, wonach die Werte einer großen Gruppe prä- und postmenopausaler Frauen zwischen ihrem 5- und 95%-Perzentil herangezogen werden sollen, gibt es noch keine definitive Einigung über die Berechnung dieser Kenngröße. Große Vorsicht beim Vergleich der Präzision zwischen Geräten oder Techniken ist auch bei der Wahl des Teilnehmerkollektivs geboten, da unterschiedliche Teilnehmergruppen zu unterschiedlichen Ergebnissen führen müssen.

Genauigkeit

Während die Präzision die Messunschärfe oder Streuung einzelner Messungen um einen Mittelwert angibt, definiert Genauigkeit die Abweichung des Messmittelwerts vom wahren Wert. Auch sie hängt von vielen Faktoren ab, und es steht zu erwarten, dass Unterschiede in Patientenmerkmalen wie Knochendichte selbst, aber auch Knochenfett, Weichgewebezusammensetzung, Leibesumfang usw. auch Einfluss auf die Genauigkeit haben. Im Allgemeinen lässt sich der wahre Wert des Knochenmineralgehalts BMC nur durch Ex-situ-Veraschung eines entfetteten Knochens bestimmen. Der Vergleich der radiographisch ermittelten Projektionsfläche mit jener aus einer DXA-Messung ist problematisch, da Unterschiede in der Vergrößerung und Kantenbestimmung unvermeidlich sind, selbst wenn sie in situ vorgenommen werden. Daher geben die wenigen dazu durchgeführten Studien auch stark abweichende Ergebnisse [27, 37]. Geringe, über die Bandbreite aller Messwerte konstante Genauigkeitsfehler sind in der Praxis unbedeutend, allerdings sollten sie in Studien, die mehrere Geräte involvieren (auch gleichen Typs!), durch Kreuzkalibrierung ausgeglichen werden. Von Patientenmerkmalen abhängige Genauigkeitsfehler lassen sich praktisch nicht korrigieren – ein gutes Beispiel ist der in der quantitativen (Einspektren-)CT bekannte Fettfehler – und führen oft zu großen Problemen bei Multicenterstudien.

Kreuzkalibrierung

Bei einem Geräteaustausch oder in einer Multicentrenstudie wird die Kalibrierung zwischen den Geräten notwendig, wobei der Wechsel zu einem Gerät eines anderen Herstellers aufgrund der Unterschiede in Hardware und Implementierung von Berechnungsalgorithmen die Verlaufskontrollen sehr problematisch machen kann [38]. Die Einführung der standardisierten BMD (sBMD) durch das Internationale DXA-Standardisierungskomittee sollte die Situation für Multicentrenstudien erleichtern [20], allerdings wurden weiterhin bestehende systematische Unterschiede erst mit einer Neuüberarbeitung ausgeräumt [29, 59]. Dabei werden die Unterschiede nach Überprüfung der Linearität der BMD-Ergebnisse derselben Teilnehmergruppe zwischen den einzelnen Geräten durch Subtraktion der gerätespezifischen Mittelwerte von den Messwerten nivelliert und dann gerätespezifische Skalierungsfaktoren berechnet, welche die Abweichungsquadrate zwischen den Scannern minimieren. Schließlich wird eine universelle Konstante addiert, die die gemessene Dichte des European Spine Phantom (ESP) möglichst nahe an dessen wahren Wert bringt. Für die Gerätetypen Hologic QDR-2000, GE/Lunar DPX-L und Norland XR-26 ergaben sich für BMD-Messungen an der Wirbelsäule von 100 gesunden weißen Frauen aller Alter zwischen 20 und 80 Jahren
$$ \begin{array}{*{20}c} {{sBMD_{H} = 1.0550{\left( {X - 0.972} \right)} + 1.0436}} \\ {{sBMD_{L} = 0.9683{\left( {Y - 1.100} \right)} + 1.0436}} \\ {{sBMD_{N} = 0.9743{\left( {Z - 0.969} \right)} + 1.0436}} \\ \end{array} $$
(1.9)

wenn die Messwerte von Hologic (H) mit X, von GE/Lunar (L) mit Y und von Norland (N) mit Z bezeichnet werden [29]. Ähnliche Umrechnungen existieren für Femur und Unterarm [41, 59].

Interpretation der Messung

DXA-Messungen werden klinisch hauptsächlich zur Diagnose und Verlaufskontrolle von Osteoporose und deren Therapie und zur Evaluierung der Wirksamkeit neuer Osteoporosemedikamente eingesetzt. Dabei ist es wichtig, die sehr allgemein gehaltene Definition der Weltgesundheitsorganisation (WHO) von 1993 zu kennen, die Osteoporose als ein Krankheit beschreibt, die durch niedrige Knochenmasse und Verschlechterung der Knochenarchitektur gekennzeichnet ist und zu erhöhter Fragilität und Knochenfrakturrisiko führt [12]. Letztlich ist die Knochendichte ein Surrogat für die wirklich interessierende Höhe des Frakturrisikos, das allerdings von wesentlich mehr Faktoren wie z. B. Prävalenz von Frakturen und Stürzen abhängt. Ob die Knochendichte eines Patienten niedrig ist, wird im Allgemeinen durch Vergleiche mit den Mittelwerten einer Gruppe gleichaltriger oder junger gesunder Kontrollpersonen abgeschätzt. Dazu dienen die statistischen Konstrukte Z-score (gleichaltrige) und T-score (junge), die durch
$$ \begin{array}{*{20}c} {{T - score = \frac{{BMD_{{gemessen}} - \overline{{BMD}} _{{jung}} }} {{SD{\left( {BMD_{{jung}} } \right)}}}}} \\ {{Z - score = \frac{{BMD_{{gemessen}} - \overline{{BMD}} _{{gleichalt}} }} {{SD{\left( {BMD_{{gleichalt}} } \right)}}}}} \\ \end{array} $$
(1.10)
bestimmt werden (SD steht für Standardabweichung). Die Definition jung zielt hierbei auf jene Population ab, welche die höchste Knochendichte innerhalb eines Erwachsenenlebens umfasst und normalerweise als die Gruppe der gesunden 20- bis 29-Jährigen interpretiert wird. Die WHO unterscheidet 4 T-score-Bereiche:
  • normal sind Personen mit einem T-score größer als −1,0,

  • osteopenisch sind Personen mit einem T-score zwischen −1 und −2,5,

  • Personen mit einem T-score unter −2,5 sind per definitionem osteoporotisch,

  • wenn zusätzlich zu T <−2,5 noch nichttraumatische Frakturen vorliegen, spricht man von manifester Osteoporose.

Diese Definitionen sind Richtwerte, denn sie garantieren nicht, dass ein Patient mit normalem T-score keine Fraktur erleiden wird oder umgekehrt. Trotz der breiten Verwendung von T- und Z-scores bestehen schon seit langem Empfehlungen, statt dessen das absolute Frakturrisiko für die gesamte nach der Messung verbleibende Lebenszeit oder für die nächsten zehn Jahre zu verwenden [4].

Referenzdaten

Die Hersteller stellen gerätespezifische Referenzmessungen gesunder Frauen verschiedener ethnischer Herkunft zur Verfügung, deren altersstratifizierte Mittelwerte und Standardabweichungen zur Berechnung des T- und Z-scores für einzelne Patientinnen dienen. Während die Referenzdaten verschiedener Geräte für die Lendenwirbelsäule sehr gute Übereinstimmung der „Scores“ zwischen den Geräten erzielen, sind die Abweichungen an der Hüfte erheblich [38]. Die oben erwähnte BMD-Standardisierung schafft hier keine Abhilfe, da die Referenzdaten selbst von Hersteller zu Hersteller variieren, was nicht nur an den Unterschieden der Teilnehmer, sondern auch an unterschiedlichen statistischen Methoden und dem oft kleinen Gruppenumfang liegt [17]. Aufgrund der klinischen Bedeutung des T-score an der Hüfte könnten Messungen derselben Person auf verschiedenen Geräten zu unterschiedlichen Diagnosen führen. Daher bieten alle Hersteller seit 1997 Vergleiche zu einer einheitlichen Referenzpopulation an (Abb. 5). Diese wurde während des in den USA durchgeführten National Health and Nutrition Survey (NHANES III) erhoben, im Zuge dessen der BMD am proximal Femur von über 14.000 Personen mit einem Hologic QDR-1000 gemessen wurde [39]. Mit Hilfe der standardisierten BMD lassen sich diese Messungen auf jedes andere Gerät übertragen, und für die Gruppe der 20 -bis 29-jährigen (amerikanischen) weißen Frauen nichthispanischer Abstammung ergibt sich ein sBMD = 956 mg/cm2 mit einer Standardabweichung von 123 mg/cm2 und einer jährlichen Verlustrate von 7 mg/cm2 (in etwa 0,7% der maximalen Dichte) zwischen 50 und 60 Jahren.Damit lassen sich nun herstellerunabhängige T-scores berechnen.
Abb. 5

Auswertung einer Hüftmessung durch Vergleich mit NHANES-III-Daten (Patientennamen frei erfunden)

Obwohl NHANES III alle Femurregionen einbezieht, können nur die gesamte proximale Femurregion, nicht aber Trochanter, Femurhals, Intertrochanterregion und das Ward-Dreieck herstellerunabhängig ausgewertet werden. Daher bieten die Hersteller weiterhin die Möglichkeit der Auswertung auf Basis der eigenen (unterschiedlichen) Referenzdaten an.

Qualitätskontrolle

Aufgrund der harten Anforderungen an die Präzision von DXA-Geräten über die oft langen Zeiträume von Verlaufskontrollen hinweg ist eine Kontrolle ihrer ordnungsgemäßen Funktion und Kalibrierung durch serielle Messung geeigneter Phantome unerlässlich und sehr zu empfehlen [49]. Zusätzlich zu Gerätefehlern kann man beispielsweise die Veränderung der spektralen Zusammensetzung der Röntgenstrahlung aufgrund von Röhrenalterung, mechanischer Veränderung des Detektors (z. B. durch versehentliche Traumatisierung des Detektorarms) oder starke (z. B. jahreszeitlich bedingte) Schwankungen der Raumtemperatur aufdecken und korrigieren.

Manche Hersteller liefern 2 Phantome mit, wobei eines der täglichen Qualitätskontrolle und Eichung dient. Ein weiteres antropomorphes Phantom (hier: QC-Phantom) hilft, langfristige Schwankungen und Drifts in BMD-Werten zu erfassen und eine retrospektive Korrektur der Patientenmessungen zu ermöglichen. Phantome bestehen entweder aus Polymethylmetacrylat mit Beimengung von Kalzium-Hydroxylapatit (chemische Summenformel Ca2HPO4), demselben kristallinen Material, das in längerer Kristallform auch echtem Knochen mechanische Belastbarkeit verleiht, oder Aluminum, welches sich leichter und genauer verarbeiten lässt und knochenähnliche Röntgenabsorptionseigenschaften besitzt (allerdings muss seiner höheren Dichte Rechnung getragen werden). Antropomorphische Phantome bieten den Vorteil, die Kantendetektionsalgorithmen der Analysesoftware testen zu können, wobei diese so stark für die menschliche Anatomie spezialiert sind, dass das Phantomdesign nicht alle Feinheiten erfassen kann. Kalibrierungsmessungen sollten täglich erfolgen, manche Geräte lassen allerdings den Patientenbetrieb ohne vorangehende Kalibrierungsmessungen zu. Für die Kalibrierung gilt generell die Empfehlung, das QC-Phantom zu Beginn jeden Tags mit Patientenbetrieb, jedoch mindestens 3-mal wöchentlich, zu messen [33]. Das QC-Phantom sollte mindestens wöchentlich gemessen werden.

Herstellerübergreifend lässt sich das semiantropomorphische European Spine Phantom (ESP) verwenden, das 3 anatomieähnliche, jedoch geometrisch exakte Wirbel mit volumetrischer trabekulärer Knochendichte von 50, 100 und 200 mg/cm3 und Kortikalisdicken von 0,5, 1,0 und 1,5 mm simuliert, die ihrerseits in ein torsoförmiges Volumen aus Epoxpyharz mit 10% simuliertem Fett eingebettet sind [31]. Für Projektionsmessungen wie mit DXA ergeben sich rechnerischere BMD-Werte von 0,5, 1,0 und 1,5 g/cm2. Es wird hauptsächlich zur Kreuzkalibrierung in Multizentrenstudien eingesetzt.

Auch das von Hologic mit den Scannern gelieferte Wirbelsäulenphantom wird oft herstellerübergreifend verwendet. Es simuliert 4 anatomisch korrekt geformte, in einen Epoxidharzwürfel eingelassene Lendenwirbel, deren homogene Dichten für jedes einzelne Phantom angegeben werden. Da Hologic-Geräte mit einem internen Kalibrierstandard versehen sind (s. vorangehenden Abschnitt), verwenden sie ausschließlich dieses Phantom zur gleichzeitigen täglichen Kalibrierung und Qualitätskontrolle. GE/Lunar verwenden 2 Phantome, einen Block mit 3 Einsätzen unterschiedlicher BMD zur Kalibrierung sowie ein Wirbelsäulenphantom zur Qualitätskontrolle, das aus einem Alumiumquader besteht, dessen Unterteilungen L1–L4 begrenzen und einen Knochendichtebereich von 0,92–1403 g/cm2 simulieren. Optional ist es in einen Epoxidharzblock eingelassen, kann aber auch in einem Wasserbad zur Simulation des Weichgewebes gemessen werden. Für neuere Geräte liefert auch GE/Lunar ein Wirbelsäulenphantom aus Hydroxylapatit zur Qualitätskontrolle anstelle des Aluminiumquaders mit. Norland-Geräte verwenden ebenfalls 2 Phantome, das aluminumbasierte Kalibrierphantom und ein Wirbelsäulenphantom aus Hydroxylapatit für Qualitätskontrolle.

Neben einer Reihe technischer Parameter werden bei der Qualitätskontrolle die Kurzzeitpräzision der Phantom-BMD sowie deren Abweichungen von Basiswerten bestimmt, die zu Beginn des Gerätebetriebs sowie nach der Servicearbeit neu bestimmt werden. Mit Hilfe von Shewhart-Regeln und CUSUM-Statistik lässt sich die Einhaltung von Langzeittoleranzgrenzen überprüfen.

Ein QC-Plot ist in Abb. 6 dargestellt. Gegen das Messdatum auf der Abszisse wird der gemessene Phantomwert aufgetragen. Stärkere Veränderungen wie Sprünge oder starker Drift lassen sich leicht visuell feststellen. Um Shewhart-Regeln zu verwenden, werden der Basiswert sowie die Schwankungsbreite der Phantommessungen durch Mittelung und Berechnung der Standardabweichung einer über 25 Tage gestreckten Messreihe bestimmt. Für die meisten modernen Geräte beträgt die Standardabweichung (SD) in etwa 0,5% des Mittelwerts, daher sind die horizontalen ±1,5%-Linien in Abb. 6 äquivalent zu ±3 SD.
Abb. 6

Plotgraphik zur Qualitätskontrolle (Lunar Prodigy). Ein Sprung im April 2004 ist auf Servicearbeiten zurückzuführen

Diese Linien stellen für die Anwendung der Shewhart-Regeln den so genannten Trigger dar: Liegt ein Messwert außerhalb, werden die vorhergehenden Messungen mit 5 weiteren Regeln überprüft, um festzustellen, ob es sich bei dem Messwert um einen Ausreißer oder eine tatsächliche Schwankung handelt [53]. In diesem Fall muss der Servicedienst des Herstellers kontaktiert werden. Allerdings ergibt sich durch die direkte Anwendung der Shewhart-Regeln eine hohe Rate von falschem Alarm. Diese kann gesenkt werden, indem im Triggerfall das Phantom 10 weitere Male gemessen wird. Nur wenn der Mittelwert dieser Messungen ebenfalls außerhalb des Kontrollbereichs fällt, werden die weiteren Regeln überprüft [40].

CUSUM (Cumulative Sums) Analyse ist komplizierter [40], wird aber bei manchen Herstellern von der Software automatisch durchgeführt. Sie liefert ähnliche Ergebnisse zu Shewhart-Regeln [56]. Unter der Annahme der Normalverteilung der Messschwankungen sollte die Summe CS der Abweichungen vom Basiswert um Null schwanken
$$ CS = {\sum\limits_n {{\left( {BMD_{n} - BMD_{{Basis}} } \right)}} }. $$
(1.11)

Wie bei Shewhart-Regeln wird ein Kontrollbereich errechnet, dessen Überschreitung als Gerätefehler interpretiert wird. Zwei verschiedene Methoden wurden für die Bestimmung der Bereichsgrenzen vorgeschlagen [40]. Es ist wichtig anzumerken, dass bei Geräten, die sowohl im Pencil-beam- als auch Fan-beam-Modus betrieben werden können, beide Modi getrennt kalibriert und kontrolliert werden müssen.

Aufnahmetechniken

Wirbelsäule

Die Wirbelsäule ist die am häufigsten untersuchte skelettale Region, da ihre Knochendichte am stärksten von fortschreitendem Alter, Menopause und sekundären Osteoporosen beeinflusst wird. Messungen an der Wirbelsäule erfassen das Risiko einer osteoporotischen Wirbelfraktur besser als die meisten anderen Regionen: Die Ergebnisse einer Metaanalyse von Marshall et al. [43] zeigten ein relatives Risiko von RR=2,3 für einen Knochendichteverlust von −1 SD an der Wirbelsäule.

Da die Thorakalwirbel nicht von den Rippen freiprojiziert werden können, werden gewöhnlich die Lendenwirbelbereiche L1–L4 oder L2–L4 gemessen. Gleiches gilt für L5, der im DXA-Bild oft nicht gut vom Becken separiert werden kann. Ein zusätzlicher Vorteil der Messung der Lendenwirbelkörper liegt in ihrem größeren Volumen, das sie präziser messen lässt und die Ergebnisse repräsentativ für die gesamte Wirbelsäule macht. Innerhalb von L1–L4 besteht im Mittel ein leichter BMD-Gradient in kaudaler Richtung, der aber vermutlich mit dem von L1 zu L4 zunehmenden Volumen erklärt werden kann. Üblicherweise wird der unterste noch von Rippen überlagerte Wirbel als T12 angenommen, allerdings machen Abweichungen in der Anatomie es nötig, die Identifikation der zu messenden Wirbel sorgfältig vorzunehmen, da sonst die Interpretation der Messwerte durch Vergleich mit den Referenzwerten fehlgeleitet wird. Noch drastischer wirkt sich ein Fehler wegen der unterschiedlichen Größen der Wirbel bei BMC-Auswertungen aus. Bonnick u. Lewis [9] geben Richtlinien für die korrekte Identifizierung an.

Posteroanteriore (p.a.) Aufnahme

Die am meisten eingesetzte Patientenpositionierung für DXA an der Wirbelsäule ist die Rückenlage. Bei fast allen Geräten ist die Röntgenquelle unter und der Detektor über der Patientenliege angebracht, sodass man von der Posteroanterior-Aufnahmetechnik spricht. Üblicherweise werden die Knie mit Lagerungshilfen unterstützt, um der Lordose entgegenzuwirken und damit eine gleichmäßige Projektion zu ermöglichen. Die Bemessung des Scanbereichs sollte großzügig genug sein, um eine gute Identifizierung von L1–L4 zuzulassen. Falls das während des Messvorgangs kontinuierliche updating des Projektionsbildes auf eine Fehlpositionierung schließen lässt, kann der Scan abgebrochen und nach Patientenrepositionierung wiederholt werden. Abb. 7 zeigt das Kontrollbild mit überlagerten ROIs. Für die komplette Analyse einer p.a. Wirbelsäulenmessung werden für jeden Wirbelkörper BMD, BMC sowie T-score und Z-score ausgegeben. Die Grauwerte des mitangezeigten Bildes sind nicht für BMD geeicht, aber sollten vom Bedienpersonal und vom Arzt zur Überprüfung der Richtigkeit der Auswerteregionen herangezogen werden.
Abb. 7

Auswertung einer PA-Wirbelsäulenuntersuchung

Auf eine Reihe möglicher Fehlerquellen bei dieser Aufnahmetechnik soll hingewiesen werden. Zusätzlich zur erwähnten Fehlidentifizierung der Lendenwirbelkörper liegen oft strukturelle Veränderungen der Wirbel selbst wie Skoliose, Wirbelfrakturen, Osteophyten, Osteochondrosen und Sklerosen vor, aber auch andere Fehlerquellen wie eine stark kalzifizierte Aorta, metallische Prothesen, Schmuck und Kleidungsgegenstände (Gürtel!) verfälschen die Messwerte stark. Für Skoliosen stellen die Hersteller spezielle Auswerteroutinen zur Verfügung, allerdings erscheint der Referenzdatenvergleich in diesem Fall wenig sinnvoll. Milde Wirbelkompressionen liegen mit höherer Wahrscheinlichkeit in der T7–T9- und der T12–L2-Region vor [52] und können anhand des DXA-Bildes nur schwer diagnostiziert werden. Sie aber verursachen einen erhöhten BMD-Wert, der im Vergleich zu den benachbarten Wirbeln oft gut unterscheidbar ist. Eine Fehldiagnose wäre in diesem Fall doppelt tragisch, da bereits vorliegende Frakturen stark prädiktiv für künftige osteoporotische Frakturen sind (relatives Risiko 4.4 für künftige Wirbelfrakturen, 2 für andere osteoporotische Frakturen; [36]). Als frakturiert erkannte Wirbel sollten daher von der Auswertung ausgespart werden.

Osteophyten sind v. a. in der peri- und postmenopausalen Population stark prävalent und können die BMD-Messwerte um 10–20% erhöhen [58]. Eine schwere Verkalkung der Aorta kann die Messung ebenfalls nach oben verfälschen, während leichtere Verkalkungen anscheinend keinen signifikanten Einfluss haben [11, 54]. Da die Aorta in der p.a -Technik überlagernd mit der Wirbelsäule projiziert wird, ist ihre Verkalkung ohne ergänzende Bildgebung nur schwer feststellbar.

Laterale Aufnahme

Die meisten eben erwähnten Fehlerquellen können mit der lateralen Aufnahmetechnik vermieden werden. Dabei wird die Patientin in Dekubitusposition gelagert; alternativ werden bei einem dafür ausgerüsteten DXA-Gerät die Röntgenröhre und der Detektor um 90° in horizontale Position geschwenkt. Diese teurere Option erlaubt die Beibehaltung der Rückenlagerung und die Berechnung von Wirbelvolumenkorrekturfaktoren aus einer vorangehenden, gepaarten p.a. Aufnahme und ist daher präziser (CV in etwa 1% vs. 4% für Dekubitus; [6]). Eine laterale Aufnahme erlaubt weiterhin die Aussparung der dorsalen Wirbelanteile, die hauptsächlich aus kortikalem Knochen bestehen, der im Allgemeinen nur wenig an Masse verliert und daher die diagnostische Sensititivät nur negativ beeinflusst. Der große Nachteil der lateralen Aufnahmetechnik besteht in den sehr häufigen Überlagerungen von L4 mit dem Beckenknochen und L1 und L2 mit den untersten Rippen. In solchen Fällen kann nur L3 ausgewertet werden, was die Präzision dieser Technik stark begrenzt. Sie sollte daher zur Knochendichtemessung nur eingesetzt werden, wenn die p.a. Technik aufgrund starker struktureller Veränderungen der Wirbelsäule nicht sinnvoll ist. Die laterale Aufnahme ist von großer Bedeutung für die anschließend beschriebene Morphometrie an der Wirbelsäule, die der Diagnose osteoporotischer Veränderungen der Wirbelsäule wie Kompressionsfrakturen dient.

Morphometrie an der Wirbelsäule

In Übereinstimmung mit der eingangs erwähnten WHO-Definition der Osteoporose [11] wird die morphometrische Untersuchung komplementär zur Knochendichtemessung dringend angeraten. Dies ist umso wichtiger, da nur ein Bruchteil der osteoporotischen Kompressionsfrakturen klinisch erkannt wird [19]. Abb. 8 zeigt eine laterale DXA-Aufnahme für Morphometrie. Für diese Technik wird statt des Zweispektren-Subtraktionsverfahrens der DXA wegen der besseren Rauschcharakteristik oft nur eine Röhrenenergie verwendet. Bei manchen Geräten werden auch schmälere Kollimatoren verwendet, um die Bildschärfe zu erhöhen. Diese ist schlechter als bei einer konventionellen lateralen Röntgenaufnahme, allerdings kann mit dem schmäleren Fächerstrahl des DXA-Geräts der Vergrößerungseffekt in kraniokaudaler Richtung vermieden und somit eine bessere Projektion der vertebralen Endplatten erzielt werden. Zudem wird die Exposition der Lunge und des Brustgewebes vermieden, was die Dosis je nach Technik auf 2–40 μSv begrenzt, im Vergleich zu ca. 0,7–1 mSv für eine konventionelle laterale Röntgenaufnahme.
Abb. 8

Laterale DXA-Aufnahme für Morphometrie, auch MXA (morphometric X-ray analysis) oder VFA (vertebral fracture assessment) genannt. Trotz geringer Strahlenbelastung können die Wirbel klar abgebildet werden

Die Bildauswertung kann semiquantitativ nach Genant et al. [21] und/oder quantitativ nach verschiedenen Methoden geschehen [3]. Die semiquantitative Genant-Methode (SQ) beruht auf der Erfahrung des auswertenden Radiologen und klassifiziert jeden Wirbel nach Aussehen als nicht, wenig, mäßig und stark deformiert (SQ-Grade 0–3). Diese Methode wird von der Software mancher Hersteller automatisch angewendet. Bei den quantitativen Methoden markiert der auswertende Radiologe die vertebralen Endplatten mit je 3 Punkten, aus deren Abständen die anteriore, mittlere und posteriore Höhe jedes Wirbelkörpers errechnet wird. Je nach Methode werden verschiedene Kriterien verwendet, um im Vergleich zu einer Referenzpopulation Frakturen von Nichtfrakturen zu unterscheiden. Die Methoden nach Eastell, Black und Melton berechnen die Verhältnisse der 3 Höhen zueinander und können somit zwischen nichtfrakturierten Wirbelkörpern, keilförmigen und bikonkaven Kompressionen unterscheiden [3]. Wenn eines dieser 3 Verhältnisse um mehr als 3 SD niedriger ist als der Mittelwert der Referenzpopulation, liegt per definitionem eine Fraktur vor. Allerdings kommt es damit zu einer hohen falsch-positiven Rate. Das Verfahren nach McCloskey et al. [47] versucht dies durch Einführung eines weiteren Verhältnisses der anterioren Höhe zu einer von benachbarten Wirbeln vorausgesagten posterioren Höhe zu vermeiden, indem nun zusätzlich das neue Verhältnis unterhalb von 3 SD des Referenzmittels liegen muss.

Hüfte

Hüftfrakturen sind eine häufige Konsequenz von Osteoporose und mit höherer Morbidität und Mortalität als alle übrigen osteoporotischen Frakturen assoziiert. Die einflussreiche epidemiologische Studie von Cummings et al. [13] zeigte, dass eine DXA-Messung an der Hüfte eine bessere Abschätzung des Risikos einer osteoporotischen Fraktur zulässt als Messungen anderer skelettaler Regionen einschließlich der Wirbelsäule (Messungen an der Ferse waren allerdings nur geringfügig schlechter). Ein BMD-Unterschied von −1 SD am Femurhals im Vergleich zu normalen Gleichaltrigen ist mit einem relativen Frakturrisiko von RR=2.6 assoziiert. Die Motivation für eine DXA an der Hüfte ist also klar gegeben.

Aus Gründen der Praktikabilität wird meistens die linke Hüfte gemessen, anders als bei den Unterarmen, deren dominante Seite eine höhere Dichte hat, gibt es kaum Unterschiede zwischen den Seiten. Der komplexen Anatomie des proximalen Femurs und dem Verlaufsmuster des altersbedingten Knochenverlusts, insbesondere der Spongiosa, werden durch Erfassung mehrerer Auswerteregionen Rechnung getragen: Neben dem gesamten proximalen Femur wird die Knochendichte im Femurhals, großen Trochanter, intertrochanterischen Bereich (zwischen großem und kleinem Trochanter) und im sog. Ward-Dreieck bestimmt (Abb. 5). Ein großer Anteil aller Frakturen involviert den Femurhals, eine weitere bevorzugte Frakturregion verläuft durch den großen Trochanter in die Intertrochanterregion, das Ward-Dreieck befindet sich im Zentrum der trabekulären Zug- und Druckbänder und verliert früh und stark an Knochenmasse. Allerdings ist die Präzision dieser Region durch ihre schwierige Positionierung und geringe Fläche begrenzt (CV=3–5% im Vergleich zu 1–2% für den Femurhals und 1% für den gesamten Femur). Die Herstellersoftware wertet alle diese Bereiche automatisch aus. Zwar eignen sie sich alle ähnlich gut zur Vorhersage des Frakturrisikos [13], jedoch ist die Gesamtregion aus mehreren Gründen vorzuziehen. Zum einen hat sie die beste Präzision, des Weiteren ist die Auswertung dank der Standardisierungsformeln (1.9) unabhängig vom Gerät und dessen Implementierung, und letztlich beruht auch die Bestimmung der T- und Z-scores auf den herstellerunabhängigen NHANES-III-Daten. Die anderen Auswerteregionen unterstützen die bessere Interpretation von Verlaufskontrollstudien, da die Auswertesoftware die Übertragung der während der 1. Messung definierten Regionen auf alle nachfolgenden zulässt und damit das Präzisionsproblem entschärft.

Strukturanalyse

Aufbauend auf frühen Arbeiten von Marin u. Burr [44] entwickelten Beck et al. [1] ein Analyseprogramm, um aus den DXA-Knochenmineralbildern der Hüfte geometrische und mechanische Parameter wie Widerstandsmoment, Biegefestigkeit, Querschnittsfläche und Trägheitsmoment des Femurhalses unter einigen Modellannahmen zu berechnen. Trotz der relativ kleinen ausgewerteten Flächen und resultierenden niedrigen Präzision [34] ließ sich an großen Datenkollektiven ein zur Dichte zusätzlicher Verlust an Trägheitsmoment bei Frauen in der Menopause feststellen [2]. Für die Beurteilung einzelner Patienten ist die Methode jedoch komplett ungeeignet.

Ganzkörperuntersuchung

Mit der DXA-Ganzkörperuntersuchung lassen sich die totale Knochenmineralmasse sowie die adipösen (Triglyzeride) und nichtadipösen Anteile am köpergesamten Weichgewebe bestimmen. Obwohl die Osteoporosediagnose sehr gut mit der Ganzkörper-DXA erfolgen kann, liegt die heutige Bedeutung mehr im klinischen Management von Ernährungsstörungen und chronischen Erkrankungen mit beeinträchtigtem Stoffwechsel sowie in der Sportmedizin. Die Unterscheidung zwischen Knochenmineral und allem Weichgewebe funktioniert nach der regulären, oben beschriebenen Zweispektrentechnik. Die Dichteanteile des adipösen und nichtadipösen Weichgewebes werden dann in jenen Bildpunkten, die überhaupt keinen Knochenanteil enthalten, unter Ausnutzung der unterschiedlichen Energieabhängigkeit ihrer Röntgenschwächung in einem ganz ähnlichen Schritt bestimmt. Als Referenzmaterialien werden Stearinsäure und Kochsalzlösung oder Polyoxymethylen und Wasser verwendet [46].

Die Anteile der Bildpunkte, die Knochen enthalten, werden dann von den Verhältnissen in benachbarten Punkten abgeschätzt. Aus den Ganzkörperdichteanteilen lassen sich durch Multiplikation mit der gesamten projizierten Fläche die Gesamtmassen berechnen. Je nach Bauweise dauert ein Ganzkörperscan 3–15 min mit Fan-beam-Geräten am unteren und Pencil-beam-Geräten am oberen Ende der Skala. Die Untersuchung ist einfach durchzuführen und liefert präzise Ergebnisse, wobei totale Knochenmineraldichtewerte unter Ausnahme des Kopfes von 1,1 g/cm2 für junge gesunde Frauen und 1,2 g/cm2 für Männer erwartet werden. Die normale Verlustrate beträgt in etwa 3 mg/Jahr für Frauen und 1,5 mg/Jahr für Männer. Die Präzision für die Gesamtkörpermessung liegt bei etwa 1%, für die Subregionen (Körperstamm, Arme, Beine, Becken) muss mit schlechteren Werten gerechnet werden. Zwischen verschiedenen Gerätetypen wurden zwar gute Korrelationen, aber beträchtliche absolute Unterschiede berichtet [61]. Diessel et al. [15] zeigten dies auch für ein eigens für die Ganzkörper-DXA entwickeltes Phantom.

Periprosthetische Untersuchung

Mit entsprechender optionaler Software lässt sich die DXA auch zur Erfassung der Knochendichteveränderungen im nach einer Hüftoperation verbleibenden Femurschaft verwenden. Die traditionelle visuelle Beurteilung anhand von Röntgenbildern ist wenig sensitiv und subjektiv [16], sodass der zusätzliche Einsatz quantitativer Verfahren sinnvoll erscheint. In den ersten 6–12 Monaten nach der Operation ist mit Veränderungen aufgrund von stress shielding zu rechnen, worunter die stark veränderte Krafteinleitung des Beckens auf den Femur verstanden wird. Danach stabilisiert sich der Knochenumbau normalerweise [35, 63]. Die Auswerteregionen sind den Zonen nach Gruen, wie sie in der Röntgendiagnostik der prothetischen Hüfte verwendet werden, nachempfunden. Die Präzision wird mit etwa CV=2–3% angegeben, wobei die Durchführung der Innenrotation des Beins und dessen Fixierung sehr wichtig sind. Auch für die Knieprothetik existieren DXA-Analyseprotokolle mit einer Präzision von CV=2–5% [62].

Periprothetische Osteolysen sind häufig fokal auftretende entzündliche Läsionen, die z. Z. nur per Revisionsoperation behandelt werden können. Das Bisphosphonat Alendronat ist allerdings ein aussichtsreicher Kandidat zur Prävention und Behandlung von periprothetischer Osteolyse [51], dafür werden sensitive quantitative Verfahren benötigt. Shepherd et al. [60] arbeiten an einer digitalen, DXA-basierten Methode zur Visualierung und Quantifizierung dieser Osteolysen.

DXA am peripheren Skelett

Eine Reihe von Geräten für die Erfassung der Knochenmineraldichte an peripheren Skelettregionen wie Unterarm, Ferse und Hand steht zur Verfügung [8, 22]. Die Attraktivität dieser Techniken liegt in den niedrigeren Kosten, niedriger Strahlenexposition, sehr kurzer Untersuchungsdauer und dem geringerem Platzbedarf, wobei einige Geräte sogar mobil einsetzbar sind. Die Präzision ist durchwegs gut bis exzellent, und gute Assoziierung der peripheren Knochendichte mit dem Frakturrisiko am axialen Skelett wurde nachgewiesen. Allerdings gibt es bislang nur kleine kontrollierte Studien, die einen Behandlungseffekt auf periphere BMD nachweisen [26].

Unterarm

Der Unterarm war die 1. skelettale Region, die mit der Einführung der Single-photon- (SPA-) und Dual-photon- (DPA-)Absorptiometrie für Knochendichtemessungen überhaupt zugänglich war. Auch die späteren DXA-Geräte können Messungen am Unterarm kostengünstig, schnell und mit extrem niedriger Strahlenbelastung durchführen.

In vielen prospektiven Studien und deren Metaanalysen konnte gezeigt werden, dass eine niedrige Knochendichte am Unterarm mit einem erhöhten Frakturrisiko an der Hüfte (RR=2.1 pro −1 SD) und an der Wirbelsäule (RR=2.2) assoziiert ist [13, 30, 43]. Außerdem treten Frakturen des distalen Radius und des Styloids der Ulna (auch Colles-Frakturen genannt) bei prävalenter Osteoporose häufiger auf.

Die meisten Hersteller bieten zumindest eine distale und eine proximale Auswerteregion (ROI) an, wobei die später entwickelte zusätzliche ultradistale ROI aufgrund des höheren trabekulären Knochengehalts (50–60% der Gesamtmasse) besser zur Frakturrisikoabschätzung geeignet ist, aber eine schlechtere Präzision aufweist.

Anders als an der Wirbelsäule und der Hüfte sind weder die genauen Platzierungen noch die Nomenklatur der Auswerteregionen zwischen den Herstellern harmonisiert. Bei einem Wechsel zu einem Gerät desselben Herstellers kann man von hohen Korrelationen zwischen den Geräten ausgehen [27], zwischen den Herstellern gibt es allerdings beträchtliche Unterschiede. Shepherd et al. [59] fanden in einer Studie an etwa 100 Frauen mit 6 Geräten, dass die Unterschiede in den Größen und Positionen der ROI die Korrelationen zwischen den Geräten stark beschränkten und gaben Standardisierungsformeln wie die oben für die Wirbelsäule und die Hüfte ausgeführten Formeln für die ähnlichsten ROIs an. Prevrhal et al. [57] zeigten, dass eine standardisierte ROI im mittleren Bereich die Korrelation signifikant verbessern würde. Im Mittel finden sich distale Werte von 0,44 g/cm2 für prämenopausale Frauen, 0,38 g/cm2 und eine Verlustrate von ca. 1%/Jahr für die ersten 15 Jahre der Menopause [25], wobei eine erhöhte Verlustrate einen separaten Frakturrisikofaktor unabhängig vom Absolutwert darstellt.

Ferse

Der Kalkaneus besitzt sehr hohen trabekulären Knochengehalt und wird starken mechanischen Belastungen ausgesetzt. Viele große epidemiologischen Studien zeigten eine exzellente Assoziierung einer Kalkaneusmessung mit Hüftfrakturrisiko. Die Study of Osteoporotic Fractures [13] an über 8000 Frauen zeigte sogar ein besseres relatives Risiko pro Standardabweichung (RR) für den Kalkaneus (RR=2.3) als für die Lendenwirbelsäule (RR=1.7). Die DXA-Messung am Kalkaneus benötigt ein dediziertes Gerät wie das Norland Apollo oder das GE Lunar Pixi. Diese Geräte sind klein und mobil, die Messung dauert nur einige Sekunden mit extrem niedriger Strahlenbelastung und sehr guter Präzision von 1,5–2%. Das GE Lunar Pixi kann für Unterarmmessungen gedreht werden und hat außerdem relativ zu anderen DXA-Geräten eine hohe Ortsauflösung, was eine weiterführende Bildanalyse der trabekulären Struktur zulässt [64].

Hand

Die Photodensitometrie (auch radiographische Absorptiometrie, RA) und Radiogrammetrie wurden bereits früh zur Osteoporosediagnose eingesetzt und messen die Knochenmineraldichte der Metakarpalknochen und Phalangen der Zeige-, Mittel- und Ringfinger [42] mit nur einem Spektrum. Auch hier ist die Dosis extrem gering und die Präzision ausgezeichnet. Beide Verfahren kamen während der großen amerikanischen NHANESI-Studie zum Einsatz, anhand derer relative Risiken für eine Hüftfraktur von 1.8 (RA) und 1.6 (PD) errechnet wurden [50]. Alara, der Hersteller des MetriScan RA-Geräts, gibt CV=1.1% an. Das Schick accuDEXA ist das einzige derzeit erhältiche DXA-Gerät für die Phalangen und arbeitet mit 50 und 70 kVp Röhrenspannung. Auch hier liegt die Präzision bei etwa 1%.

Vergleich der unterschiedlichen anatomischen Messungen

Anders als bei den Messungen am Stammskelett korrelieren periphere Messungen an unterschiedlichen Regionen und mit unterschiedlichen Geräten oft schlecht, und die Osteoporoseklassifizierung derselben Patientin anhand der T-scores und der WHO-Kriterien verschiedener Messungen wäre nicht einheitlich [18]. Nur für einige Unterarmtechniken existieren Standardisierungsformeln für die ähnlichsten ROIs, und selbst diese machen einen direkten Vergleich der Ergebnisse nur bedingt möglich [59]. Blake et al. [8] schlagen vor, zur Diagnose einzelner Patienten anstelle von T-scores gerätespezifische Schwellwerte für die absoluten Messungen einzuführen, unterhalb derer Osteoporose an der Hüfte oder Wirbelsäule mit 90% Sensitivität und Spezifität diagnostiziert werden kann. Dabei soll die axiale DXA als Referenz dienen.

Welche Messung?

Angesichts der Vielfalt an Messregionen und Techniken stellt sich die Frage, welche Messung am besten geeignet ist, um eine Diagnose zu stellen. Im Allgemeinen ist eine Messung nur sinnvoll, wenn sich daraus eine Behandlungsentscheidung ergeben kann, sodass die Erhebung der klinischen Vorgeschichte, eine körperliche Untersuchung und Tests zum Ausschluss von Krankheiten mit ähnlichen Bildern wie Osteomalazien, Vitamin-D-Stoffwechselstörungen und bestimmten Krebsarten zwingend notwendig ist. Andererseits ist niedrige BMD prädiktiv für einen Behandlungserfolg: Je niedriger die BMD, desto höher ist die Anzahl der durch Behandlung verhinderten Frakturen [14].

Obwohl die Osteoporose eine systemische Erkrankung ist und daher Knochendichteverlust an allen Regionen vorausgesetzt werden kann, sind die Messungen am axialen und peripheren Skelett nicht ausreichend korreliert, um das Frakturrisiko mit gleicher Güte bestimmen zu können. Eine Messung an der Hüfte ist aus vielen Gründen vorzuziehen: unter anderem beste Bestimmung des v. a. im fortgeschrittenen Alter aufgrund der hohen Morbidität und Mortalität wichtigen Hüftfrakturrisikos und einheitliche NHANES-III-Referenzdaten und Relevanz zur von der WHO aufgestellten Definition der Osteoporose. Für jüngere Patienten empfiehlt sich hingegen eher eine Messung an der Wirbelsäule, da sie das Risiko einer beliebigen osteoporotischen Fraktur genauso gut bestimmt und der Knochendichteverlust in den frühen Jahren der Menopause oft höher ist als an der Hüfte [43]. Bei älteren Patienten ist außerdem die Prävalenz störender degenerativer Veränderungen wie Arthrose, Osteophyten, Schmorl-Knoten usw. an der Wirbelsäule höher.

Fazit für die Praxis

In diesem Kapitel wurden die Grundlagen, Anwendungen sowie die Bedeutung der Zweispektren-Absorptiometrieverfahren beleuchtet. Ohne Zweifel haben sie einen zentralen Stellenwert bei der Diagnose und Verlaufskontrolle der Osteoporose und ihrer Behandlung. Dabei soll aber nicht übersehen werden, dass in der Gesamtbetrachtung die Sensitivität der Knochenmineraldichtebestimmung niedrig und daher trotz akzeptabler Knochenmineraldichte zum Zeitpunkt der Menopause das Auftreten einer osteoporotischen Fraktur während der restlichen Lebensdauer wahrscheinlich ist [43]. Eine Messung ohne Indikation kann aktuell nicht empfohlen werden.

Interessenkonflikt

Keine Angaben

Copyright information

© Springer Medizin Verlag 2006