Hallo liebe Linux-Community, hallo an alle Hardware-Hacker, Kernel-Gurus und Open-Source-Enthusiasten! Ich wende mich heute an euch, weil ich mit meinem Latein am Ende bin und dringend eure Expertise brauche. Seit Jahren bin ich ein überzeugter Linux-Nutzer. Die Freiheit, die Anpassbarkeit und die Philosophie des offenen Quellcodes sind für mich unschlagbar. Doch aktuell stehe ich vor einer Herausforderung, die meinen Nerven gehörig zusetzt und meine Geduld auf eine harte Probe stellt: Meine brandneue **AMD Radeon RX 9070 XT Acer Predator Bifrost OC** Grafikkarte will einfach nicht mit meinem geliebten Linux-System koexistieren. Und das, obwohl AMD für seine exzellente Linux-Unterstützung bekannt ist!
**Die Hardware, die mir Kopfzerbrechen bereitet**
Lassen wir uns kurz über das Prunkstück sprechen, das eigentlich mein Gaming- und Produktivsystem befeuern sollte. Die **AMD Radeon RX 9070 XT** ist, wie viele von euch wissen werden, eine Top-Tier-Karte der neuesten Generation. Sie verspricht brachiale Leistung, modernste Features und eine Effizienz, die ihresgleichen sucht. Das „XT” im Namen steht für die volle Leistung, die AMD in diesem Segment zu bieten hat.
Meine spezifische Karte ist die **Acer Predator Bifrost OC** Edition. Für diejenigen, die nicht vertraut sind: Die Bifrost-Serie von Acer Predator ist bekannt für ihre massiven, oft überdimensionierten Kühllösungen und eine werkseitig auf ein Maximum optimierte Übertaktung („OC”). Das Design ist aggressiv, die Kühlung ist phänomenal, und die Erwartungshaltung an die Performance ist entsprechend hoch. Diese Karte ist nicht nur ein Leistungsträger, sondern auch ein Statement. Ich habe sie bewusst gewählt, weil ich dachte, dass die von AMD traditionell starke Unterstützung für offene Treiber unter Linux mir hier keine Steine in den Weg legen würde.
Mein gesamtes System ist ebenfalls topaktuell:
* **Prozessor:** AMD Ryzen 9 7950X3D
* **Mainboard:** ASUS ROG Crosshair X670E Hero (mit aktuellem BIOS, Version 1904)
* **RAM:** 64 GB DDR5-6000 CL30
* **Netzteil:** be quiet! Dark Power 13 1200W (ATX 3.0, PCIe 5.0 ready)
* **Speicher:** Diverse NVMe SSDs (Samsung 990 Pro, WD Black SN850X)
* **Monitor:** Dell AW3423DWF (3440×1440, 165Hz) über DisplayPort
Ich habe großen Wert auf Kompatibilität und eine solide Basis gelegt, um Engpässe auszuschließen. FreeSync Premium Pro ist natürlich auch ein Feature, das ich unter Linux nutzen möchte, aber davon sind wir derzeit noch meilenweit entfernt.
**Das Problem: Was „nicht laufen” wirklich bedeutet**
Das ist der frustrierendste Teil. „Sie will nicht laufen” ist eine Untertreibung. Es sind vielmehr eine Reihe von Symptomen, die das System unbenutzbar machen, sobald die **RX 9070 XT** die Kontrolle übernehmen soll:
1. **Black Screen auf dem Desktop:** Nach dem Bootvorgang – manchmal noch vor dem Login-Bildschirm, manchmal direkt danach – bleibt der Bildschirm schwarz. Das System scheint noch zu laufen (ich höre Festplattenaktivität, SSH-Zugriff ist teilweise möglich), aber es gibt keine Videoausgabe.
2. **Kernel Panics:** Nicht selten friert das System komplett ein und präsentiert einen **Kernel Panic**. Die Fehlermeldungen variieren, aber oft ist `amdgpu` oder ein verwandter Kernel-Modul Teil des Stack Traces. Dies deutet auf tiefgreifende Probleme im Treiber hin.
3. **Unendliche Boot-Schleifen:** Manchmal kommt das System nicht einmal über den initialen Boot-Bildschirm hinaus und startet immer wieder neu, sobald der Kernel die Grafikkarte initialisieren will.
4. **Grafikfehler und Artefakte:** Wenn ich es doch mal schaffe, einen grafischen Desktop zu sehen, ist dieser voller Artefakte, Flickern und zerrissener Bilder. Fenster werden nicht richtig dargestellt, und das System stürzt schnell ab.
5. **Lüftersteuerung außer Kontrolle:** Die Lüfter der Acer Predator Bifrost OC drehen manchmal unkontrolliert hoch, selbst im Idle, oder bleiben komplett stehen, was zu einer schnellen Überhitzung führt – ein klares Zeichen dafür, dass der Treiber die Hardware nicht korrekt anspricht.
6. **Komplette Instabilität:** Sobald eine Anwendung die GPU wirklich nutzen möchte (z.B. ein Webbrowser mit Hardwarebeschleunigung, ein Spiel, eine Rendering-App), stürzt das System entweder ab oder die Anwendung beendet sich ohne Fehlermeldung.
Es ist eine Achterbahnfahrt der Frustration. Unter Windows 11 funktioniert die Karte übrigens einwandfrei, erreicht Spitzenwerte und ist stabil – was die Sache nur noch ärgerlicher macht, da es beweist, dass die Hardware selbst nicht defekt ist.
**Was ich bisher versucht habe (und wo ich gescheitert bin)**
Ich habe wirklich keine Mühen gescheut und unzählige Stunden in die Fehlersuche investiert. Hier ist eine Liste meiner bisherigen Schritte:
1. **Verschiedene Distributionen getestet:**
* **Ubuntu 23.10 (Mantic Minotaur) & 24.04 (Noble Numbat) Daily Build:** Mit den neuesten Kerneln und Mesa-Versionen.
* **Fedora Workstation 39 & 40 Beta:** Ebenfalls mit den aktuellsten Paketen.
* **Arch Linux:** Hier habe ich die meiste Zeit verbracht, da es die Flexibilität bietet, die allerneuesten Kernel, Mesa (oft direkt aus Git) und Firmware-Dateien zu nutzen.
* **Pop!_OS 22.04 LTS (mit Kernel-Updates):** Obwohl LTS, habe ich hier versucht, neuere Kernel einzuspielen.
In allen Fällen das gleiche oder ähnliche Fehlerbild.
2. **Kernel-Versionen:**
* **Stock Kernel:** Die Standard-Kernel der jeweiligen Distributionen (meist 6.5.x bis 6.8.x).
* **Mainline Kernel:** Ich habe verschiedene **Kernel von kernel.org** kompiliert und installiert, von 6.6.x bis zum aktuellen 6.9-rc. Speziell der 6.8er-Zweig und höher sollten laut Roadmap die beste Unterstützung für neuere AMD-Hardware bieten.
* **Kernel-Parameter:** Ich habe mit unzähligen Kernel-Parametern experimentiert, darunter `amdgpu.dpm=0`, `amdgpu.ppfeaturemask=0xffffffff`, `amdgpu.sg_display=0`, `nomodeset` (was natürlich nur ein Workaround ist, der mir aber nicht mal einen sauberen TTY brachte), und `pci=noaer`. Nichts davon brachte eine stabile Lösung.
3. **Mesa-Treiber:**
* **Standard-Mesa:** Die von den Distributionen bereitgestellten Versionen.
* **Oibaf PPA / Kisak Mesa PPA (für Ubuntu):** Um aktuellere Versionen zu erhalten.
* **Mesa aus Git (für Arch):** Selbst kompiliert, um die allerneuesten Entwicklungsversionen zu testen. Die Hoffnung war, dass ein Commit, der die Unterstützung für die **RX 9070 XT** verbessert, kürzlich integriert wurde.
4. **Firmware und Microcode:**
* Ich habe sichergestellt, dass mein `initramfs` die neuesten `amdgpu` Firmware-Dateien enthält. Dafür habe ich die Dateien direkt aus dem **linux-firmware** Git-Repository heruntergeladen und manuell in `/lib/firmware/amdgpu` platziert, bevor ich das `initramfs` neu generiert habe. Ich habe auch sichergestellt, dass die relevanten `vcn`, `sdma`, `gfx` und `smu` Microcode-Dateien für die (fiktive, aber hier relevante) RDNA4-Generation vorhanden sind.
* Manchmal gibt es spezifische Firmware-Pakete wie `linux-firmware-git` oder Ähnliches, die ich ebenfalls ausprobiert habe.
5. **BIOS/UEFI-Einstellungen:**
* **Above 4G Decoding:** Aktiviert.
* **Resizable BAR (ReBAR) / Smart Access Memory (SAM):** Aktiviert.
* **PCIe Generation:** Habe zwischen Auto, Gen4 und Gen5 gewechselt, um mögliche Instabilitäten bei Gen5 auszuschließen.
* **CSM:** Deaktiviert (reines UEFI-Boot).
* **Integrierte Grafik (iGPU):** Deaktiviert, da der Ryzen 9 7950X3D keine iGPU besitzt, aber zur Sicherheit geprüft.
6. **Log-Dateien:**
* `dmesg`, `journalctl -b`, `/var/log/Xorg.0.log`: Ich habe diese Logs akribisch durchsucht. Die häufigsten Fehler sind `amdgpu: [gfx_vX_0_init_microcode] failed to load microcode` oder ähnliche Meldungen, die auf fehlende oder inkompatible Firmware hindeuten. Auch `Bad page state` oder `GPU ring 0 timeout` sind häufige Gäste, was auf ein Timeout beim Zugriff auf die GPU hinweist.
* `lspci -nnk` und `lsmod | grep amdgpu` zeigen, dass der `amdgpu`-Treiber geladen ist und die Karte erkannt wird, aber offensichtlich nicht richtig initialisiert werden kann.
7. **Physische Checks:**
* Alle Stromkabel (3x 8-Pin PCIe) wurden mehrfach geprüft und sitzen fest.
* Das DisplayPort-Kabel wurde ausgetauscht.
* Die Karte wurde einmal aus dem Slot entfernt und wieder eingesetzt.
**Meine Vermutung und Hoffnung**
Meine stärkste Vermutung ist, dass es sich um ein Problem handelt, das entweder mit der sehr neuen Architektur der **RX 9070 XT** im Zusammenspiel mit dem `amdgpu`-Kernel-Treiber zusammenhängt, oder spezifischer mit der Custom-VBIOS der **Acer Predator Bifrost OC**. Manchmal haben Hersteller wie Acer für ihre OC-Varianten spezielle VBIOS-Versionen, die unter Windows mit ihren proprietären Treibern gut funktionieren, aber unter Linux Probleme bereiten können, wenn der Open-Source-Treiber diese spezifischen Anpassungen nicht erwartet oder nicht korrekt interpretieren kann (z.B. bei Power-States, Lüfterkurven oder Taktfrequenzen).
Es könnte auch sein, dass ich einen ganz spezifischen Kernel-Parameter übersehe, der für diese Generation von AMD-Karten entscheidend ist, oder dass die benötigte Firmware noch nicht „offiziell” in den regulären Linux-Firmware-Paketen enthalten ist und ich eine noch neuere, möglicherweise instabile Version benötige.
**Warum Linux für mich so wichtig ist**
Trotz dieser Rückschläge bleibe ich Linux treu. Die Möglichkeit, mein System bis ins kleinste Detail zu kontrollieren, die Stabilität und Sicherheit, die es bietet, und die florierende Community sind für mich unverzichtbar. Ich möchte nicht auf Windows zurückkehren, nur weil eine Grafikkarte zickt. Das Ziel ist es, meine High-End-Hardware auch für Gaming und Content Creation unter Linux voll ausnutzen zu können.
**Eure Hilfe ist gefragt!**
Daher meine dringende Bitte an euch, die **Linux-Experten**: Habt ihr ähnliche Erfahrungen mit sehr neuen AMD-Karten oder speziell mit Custom-Designs wie der Acer Predator Bifrost OC gemacht? Kennt ihr seltene Kernel-Parameter, obskure Firmware-Quellen oder spezielle Patches, die ich ausprobieren könnte? Gibt es Diagnose-Tools unter Linux, die tiefer in die GPU-Initialisierung blicken können, als es `dmesg` und `journalctl` tun?
Jeder Hinweis, jede Idee und jeder Gedanke ist willkommen. Ich bin bereit, weitere Testreihen durchzuführen, Kernel zu patchen und bis an die Grenzen meiner Kenntnisse zu gehen, um diese Karte unter Linux zum Laufen zu bringen. Lasst uns gemeinsam dieses Problem lösen und zeigen, dass auch die neueste und leistungsstärkste Hardware ihren Platz im Open-Source-Ökosystem finden kann!
Vielen Dank im Voraus für eure Zeit und Unterstützung! Ich halte euch natürlich auf dem Laufenden, was meine Fortschritte angeht.