Überraschung bei der Speicherberechnung: Warum sizeof(class) oft ein falsches Ergebnis liefert

In der Welt der C++-Programmierung ist die Funktion sizeof() ein scheinbar einfaches und unverzichtbares Werkzeug. Sie verspricht, uns die genaue Größe eines Datentyps oder einer Variablen im Speicher zu verraten. Doch gerade wenn es um Klassen geht, kann das Ergebnis von sizeof(class) oft zu Verwirrung und sogar zu gravierenden Fehleinschätzungen führen. Was auf den ersten Blick wie ein direkter Weg zur Bestimmung des Speicherverbrauchs eines Objekts aussieht, entpuppt sich bei genauerer Betrachtung als eine deutlich komplexere Angelegenheit. In diesem Artikel tauchen wir tief in die Gründe ein, warum sizeof(class) uns eine „Überraschung“ bereiten kann und wie man den wahren Speicherverbrauch von Klassen in C++ realistisch einschätzt.

Was `sizeof()` wirklich misst – und was nicht

Bevor wir die Geheimnisse lüften, sollten wir klären, was sizeof() bei einer Klasse überhaupt misst. Grundsätzlich liefert sizeof(MyClass) die Anzahl der Bytes, die ein Objekt der Klasse MyClass selbst im Speicher belegt. Das umfasst primär:

Alle nicht-statischen Datenmember der Klasse.
Die Datenmember aller Basisklassen (im Falle der Vererbung).
Mögliche zusätzliche Bytes für die Ausrichtung (Padding) der Datenmember im Speicher.
Im Falle von virtuellen Funktionen: Einen Zeiger auf die virtuelle Methodentabelle (vtable).

Was sizeof() hingegen nicht misst, ist oft der Kern der Überraschung:

Speicher, der dynamisch auf dem Heap allokiert wird und von Zeigern innerhalb des Objekts verwaltet wird (z.B. der Inhalt einer std::string oder eines std::vector).
Der Speicher, den statische Datenmember belegen. Diese gehören zur Klasse selbst, nicht zu einzelnen Objekten.
Der Code der Member-Funktionen. Dieser wird einmal im Code-Segment gespeichert, unabhängig davon, wie viele Objekte existieren.
Die virtuelle Methodentabelle (vtable) selbst. sizeof() berücksichtigt lediglich den Zeiger darauf.

Die Hauptgründe für das „falsche” Ergebnis

Die Diskrepanz zwischen dem Wert von sizeof(class) und dem tatsächlich vom Objekt genutzten Speicher resultiert aus mehreren Faktoren, die wir im Folgenden detailliert beleuchten.

1. Zeiger und dynamische Speicherallokation: Die „Eisberg”-Problematik

Dies ist der wohl häufigste und größte Grund für Missverständnisse. Viele Klassen verwalten intern Speicher, der dynamisch zur Laufzeit auf dem Heap allokiert wird. Ein sizeof()-Aufruf für eine solche Klasse misst jedoch lediglich die Größe der Zeiger oder der kleinen internen Verwaltungsstrukturen innerhalb des Objekts, nicht den Speicher, auf den diese Zeiger verweisen.

Betrachten wir ein gängiges Beispiel:


class MyStringWrapper {
public:
    std::string myString;
    int id;

    MyStringWrapper(const std::string& s, int i) : myString(s), id(i) {}
};

// ...
MyStringWrapper obj("Dies ist ein sehr langer Text, der viel Speicher benötigt.", 42);
std::cout << "sizeof(MyStringWrapper): " << sizeof(MyStringWrapper) << " Bytes" << std::endl;

Man könnte erwarten, dass sizeof(MyStringWrapper) die Länge des Strings plus die Größe des Integers widerspiegelt. Die Realität ist jedoch, dass sizeof(MyStringWrapper) nur die Größe von std::string (typischerweise 24 oder 32 Bytes, je nach Compiler und Plattform) und die Größe von int (meist 4 Bytes) plus eventuelles Padding misst. Der tatsächlich belegte Speicher für den Text „Dies ist ein sehr langer Text, der viel Speicher benötigt.” wird vom std::string-Objekt dynamisch auf dem Heap verwaltet und ist für sizeof() unsichtbar. Er ist wie die Spitze eines Eisbergs: sizeof() zeigt nur den sichtbaren Teil (die Zeiger auf dem Stack oder im Objekt), während der weitaus größere Teil (der dynamisch allokierte Speicher) verborgen bleibt.

Ähnliche Effekte treten bei Klassen auf, die char* für C-Strings, std::vector<T>, std::map<K, V> oder andere containerartige Strukturen verwenden. sizeof() gibt hier nur die Größe des Containers selbst zurück, nicht die Größe der darin enthaltenen Elemente.

Cold-Brew-Trend: Darum sollten Sie Ihren Tee unbedingt mal mit kaltem Wasser zubereiten

2. Virtuelle Funktionen und die Virtuelle Methodentabelle (vtable)

Die Einführung von virtuellen Funktionen in einer Klasse ist ein mächtiges Feature von C++, das Polymorphie über Zeiger und Referenzen ermöglicht. Um dies zu realisieren, fügt der Compiler jedem Objekt einer Klasse, die virtuelle Funktionen besitzt, einen versteckten Zeiger hinzu: den virtuellen Tabellenzeiger (vptr). Dieser Zeiger zeigt auf die virtuelle Methodentabelle (vtable), die statisch für die Klasse definiert wird und Zeiger auf die implementierten virtuellen Funktionen enthält.

Der wichtige Punkt ist: sizeof(class) umfasst die Größe dieses vptr (normalerweise 4 oder 8 Bytes, je nach Architektur), aber nicht die Größe der vtable selbst. Die vtable wird einmal pro Klasse erstellt und liegt typischerweise im schreibgeschützten Datensegment des Programms. Wenn eine Klasse also virtuelle Funktionen einführt, wird ihr sizeof() um die Größe eines Zeigers erhöht.


class Base {
    int x;
};

class DerivedVirtual : public Base {
public:
    virtual void doSomething() {}
    int y;
};

std::cout << "sizeof(Base): " << sizeof(Base) << " Bytes" << std::endl;
std::cout << "sizeof(DerivedVirtual): " << sizeof(DerivedVirtual) << " Bytes" << std::endl;

Sie werden feststellen, dass sizeof(DerivedVirtual) größer ist als die Summe der Größen von Base und y, nämlich um die Größe des vptr.

3. Padding und Ausrichtung (Alignment): Die unsichtbaren Lücken

Um die Effizienz beim Speicherzugriff zu optimieren, legen Prozessoren Daten nicht immer direkt hintereinander ab. Stattdessen bevorzugen sie, dass Daten an bestimmten Speichergrenzen ausgerichtet sind (z.B. ein int an einer 4-Byte-Grenze, ein double an einer 8-Byte-Grenze). Compiler fügen daher oft Padding-Bytes (Füllbytes) zwischen den Datenmembern einer Klasse oder am Ende der Klasse ein, um diese Ausrichtungsanforderungen zu erfüllen.

Dieses Padding ist für sizeof() vollständig sichtbar und wird in die Berechnung einbezogen, kann aber die intuitive Erwartung trügen, dass sizeof() der reinen Summe der Member-Größen entspricht.


struct S1 {
    char c1; // 1 Byte
    int i;   // 4 Bytes
    char c2; // 1 Byte
}; // Erwartet: 1+4+1 = 6 Bytes. Tatsächlich: oft 12 Bytes (auf 64-Bit-Systemen)

struct S2 {
    int i;   // 4 Bytes
    char c1; // 1 Byte
    char c2; // 1 Byte
}; // Erwartet: 4+1+1 = 6 Bytes. Tatsächlich: oft 8 Bytes

Im Beispiel S1 könnte der Compiler nach c1 3 Padding-Bytes einfügen, damit i an einer 4-Byte-Grenze beginnt. Nach i könnten erneut 3 Padding-Bytes folgen, damit c2 an einer 4-Byte-Grenze beginnt. Und am Ende könnten weitere Padding-Bytes hinzukommen, damit die gesamte Struktur eine Vielfaches der stärksten Ausrichtungsanforderung (hier 4 Bytes für int) ist, was wichtig ist, wenn die Struktur in einem Array abgelegt wird.

Die Reihenfolge der Member-Variablen hat einen großen Einfluss auf die Menge des Paddings. Durch geschicktes Anordnen der Member (z.B. große Typen zuerst) lässt sich Padding minimieren. Auch wenn es selten empfohlen wird, kann man mit #pragma pack die Ausrichtung explizit steuern, aber dies kann zu Performance-Einbußen führen und ist nicht portabel.

4. Vererbung, insbesondere Virtuelle Vererbung

Bei der Vererbung fließen die Datenmember der Basisklasse in die abgeleitete Klasse ein. sizeof(Derived) ist daher mindestens so groß wie sizeof(Base). Bei mehrfacher Vererbung werden Subobjekte für jede Basisklasse in die abgeleitete Klasse eingebettet, was zu komplexeren Layouts und zusätzlichem Padding führen kann.

Noch komplizierter wird es bei der virtuellen Vererbung. Diese wird verwendet, um das „Diamond-Problem” bei mehrfacher Vererbung zu lösen, indem sichergestellt wird, dass nur eine einzige Instanz einer gemeinsamen Basisklasse existiert. Um dies zu realisieren, fügen Compiler oft einen weiteren versteckten Zeiger (einen „virtuellen Basisklassen-Zeiger” oder ähnliches) in das Objekt ein, der zur virtuellen Basisklasse zeigt. Dies erhöht ebenfalls den Wert von sizeof().

5. Statische Datenmember

Statische Datenmember sind ein fester Bestandteil der Klasse, aber sie gehören nicht zu einzelnen Objekten. Stattdessen gibt es nur eine einzige Instanz des statischen Members, die im Datensegment des Programms abgelegt wird. Dementsprechend werden sie nicht in die Größe eingerechnet, die sizeof() für ein Objekt der Klasse zurückgibt.


class MyClassWithStatic {
public:
    int x;
    static int counter; // Wird nicht von sizeof() berücksichtigt
};

std::cout << "sizeof(MyClassWithStatic): " << sizeof(MyClassWithStatic) << " Bytes" << std::endl;

sizeof(MyClassWithStatic) wird hier nur die Größe von x plus eventuelles Padding widerspiegeln, nicht die Größe von counter.

6. Leere Klassen (Empty Class Optimization)

Selbst eine scheinbar leere Klasse hat eine Größe, die von sizeof() gemeldet wird, normalerweise 1 Byte:


class Empty {};
std::cout << "sizeof(Empty): " << sizeof(Empty) << " Bytes" << std::endl; // Oft 1 Byte

Warum? Jeder Objektinstanz muss eine eindeutige Adresse zugewiesen werden können, insbesondere wenn man ein Array von Objekten dieser Klasse erstellt. Dieses einzelne Byte stellt sicher, dass zwei verschiedene Objekte von Empty unterschiedliche Speicheradressen haben.

WinSCP herunterladen: Eine detaillierte Anleitung zur Installation und Nutzung des sicheren FTP-Clients für Windows

Es gibt jedoch eine wichtige Ausnahme: die Empty Base Class Optimization (EBCO). Wenn eine leere Klasse als Basisklasse dient, ist es Compilern erlaubt, die leere Basisklasse keine Größe belegen zu lassen (0 Bytes), da sie effektiv „in” die abgeleitete Klasse gepackt werden kann, ohne deren Layout zu stören. Dies ist eine Optimierung und nicht immer garantiert.

Auswirkungen und Best Practices

Das Verständnis dieser Nuancen ist entscheidend für die Entwicklung robuster und effizienter C++-Anwendungen:

Genauer Speicherverbrauch: Verlassen Sie sich bei der Schätzung des Gesamt-Speicherbedarfs einer Anwendung niemals allein auf sizeof() für Klassen, die dynamisch Speicher verwalten. Sie müssen den Speicher, der von Zeigern auf dem Heap verwaltet wird, explizit mitberücksichtigen. Tools wie Valgrind oder spezielle Speichermesswerkzeuge können hier unerlässlich sein.
Performance: Padding und Alignment sind keine reinen Kostenfaktoren. Sie optimieren den Speicherzugriff für den Prozessor. Ein schlecht ausgerichtetes Objekt kann zu langsameren Zugriffszeiten führen („Cache Misses”). Achten Sie auf die Reihenfolge Ihrer Datenmember, um unnötiges Padding zu vermeiden und die Cache-Effizienz zu verbessern.
Design-Entscheidungen: Wenn Speicher ein kritischer Faktor ist (z.B. bei Embedded Systems), sollten Sie die Verwendung von virtuellen Funktionen, komplexen Vererbungshierarchien und großen dynamischen Containern sorgfältig abwägen.
Serialisierung: Wenn Sie Objekte serialisieren möchten, denken Sie daran, dass sizeof() nicht ausreicht, um die Menge der zu schreibenden Daten zu bestimmen, wenn Zeiger auf dynamischen Speicher existieren.

Fazit

sizeof() ist ein mächtiges, aber auch trügerisches Werkzeug in C++. Bei primitiven Datentypen oder POD-Strukturen (Plain Old Data) liefert es ein direktes und oft ausreichendes Ergebnis. Bei Klassen, insbesondere solchen, die dynamischen Speicher verwalten, virtuelle Funktionen nutzen oder komplexe Vererbungshierarchien aufweisen, zeigt sizeof() nur einen Teil des Bildes – die Größe des Objekts selbst im Stack oder Heap, nicht jedoch den gesamten Footprint, den das Objekt im Speichersystem hinterlässt. Die „Überraschung” ist also oft ein Hinweis darauf, dass das Verständnis der zugrundeliegenden Compiler-Implementierungen und Speicherverwaltung tiefer gehen muss, als man zunächst annimmt. Ein umfassendes Verständnis dieser Mechanismen ist der Schlüssel zu optimierter und zuverlässiger C++-Programmierung.

Tech

Véded a gyereked a káros tartalomtól? 2 intő jel, hogy egy műsort azonnal ki kell kapcsolnod

Ilyen egy igazán sikkes home office: 10 inspiráló ötlet, amitől nem akarsz majd szabadulni

Zene nélkül vagy zenével? Így dobd fel a szabadtéri edzés hangulatát

Gumi- és TRX szalaggal a természetben: a hordozható szabadtéri edzés

Pár négyzetmétered van csak? Megmutatjuk, hogyan lesz belőle álom-home office!

Forradalmi újdonság az intim egészségben? Minden, amit a probiotikumos tamponokról tudnod kell

Express Posts List

Hartnäckiger Alias? So kann die outlook.com Domäne entfernt werden, wenn nichts mehr geht

Der Internetanschluss im Verteilerkasten: So optimieren Sie Ihr Heimnetzwerk von Grund auf

Drag & Drop-Magie: Wie Sie ein PDF mühelos direkt in eine E-Mail ziehen

Warten auf die Bestätigung? Was zu tun ist, wenn Ihre Verification Mails einfach nicht durchkommen

Probleme in Outlook Classic 2024? So können Sie trotzdem eine weitere E-Mail-Adresse hinzufügen!

Schreibe einen Kommentar Antworten abbrechen

Verwandte

Die perfekte SQL-Query: Summierte Menge für einen 7-Tage-Zeitraum berechnen – so geht’s

Ist eine Investition in die RTX 5070 wirklich sinnvoll? Eine Zukunfts-Analyse

Kompatibilitäts-Check: Ist es eine gute Idee, SQL Server 2022 auf Windows Server 2025 zu installieren?

Leistungsbremse aktiv? Darum wird Ihre Grafikkarte in Fortnite nur zu 40-50% ausgelastet

Das volle Potenzial entfesseln: So überprüfen und maximieren Sie die NPU Nutzung auf einem Surface Laptop Studio 2

Leistungsschub für Ihren PC: Was könnte ich an meinem System sinnvoll upgraden?

Olvastad már?

Hartnäckiger Alias? So kann die outlook.com Domäne entfernt werden, wenn nichts mehr geht

Der Internetanschluss im Verteilerkasten: So optimieren Sie Ihr Heimnetzwerk von Grund auf

Drag & Drop-Magie: Wie Sie ein PDF mühelos direkt in eine E-Mail ziehen

Warten auf die Bestätigung? Was zu tun ist, wenn Ihre Verification Mails einfach nicht durchkommen

Probleme in Outlook Classic 2024? So können Sie trotzdem eine weitere E-Mail-Adresse hinzufügen!

Verpassen Sie das nicht

Hartnäckiger Alias? So kann die outlook.com Domäne entfernt werden, wenn nichts mehr geht

Der Internetanschluss im Verteilerkasten: So optimieren Sie Ihr Heimnetzwerk von Grund auf

Drag & Drop-Magie: Wie Sie ein PDF mühelos direkt in eine E-Mail ziehen

Warten auf die Bestätigung? Was zu tun ist, wenn Ihre Verification Mails einfach nicht durchkommen

Tech

Express Posts List

Was sizeof() wirklich misst – und was nicht

Die Hauptgründe für das „falsche” Ergebnis

1. Zeiger und dynamische Speicherallokation: Die „Eisberg”-Problematik

2. Virtuelle Funktionen und die Virtuelle Methodentabelle (vtable)

3. Padding und Ausrichtung (Alignment): Die unsichtbaren Lücken

4. Vererbung, insbesondere Virtuelle Vererbung

5. Statische Datenmember

6. Leere Klassen (Empty Class Optimization)

Auswirkungen und Best Practices

Fazit

Schreibe einen Kommentar Antworten abbrechen

Verwandte

Verpassen Sie das nicht

Was `sizeof()` wirklich misst – und was nicht