Tumbleweed Btrfs: System friert kurz nach Start reproduzierbar zeitweise ein

Hinweis: In dem Thema Tumbleweed Btrfs: System friert kurz nach Start reproduzierbar zeitweise ein gibt es 36 Antworten auf 4 Seiten. Der letzte Beitrag () befindet sich auf der letzten Seite.
  • Hallo,


    ich habe meinen neuen PC (Asus ROG STRIX X470-F mit AMD Ryzen 7 2700X, 2 x 16 GB DIMMs, Samsung NVMe SSD 970 EVO Plus 1TB) Mitte Juli erstmals mit SuSE Tumbleweed installiert. Als Filesystem habe ich wie empfohlen btrfs genommen, die Installation hat dann automatisch Subvolumes für home, usr, var, etc. angelegt.


    Seit Freitag nun habe ich Probleme, die anscheinend auf btrfs zurückzuführen sind: kurz nach dem Start des Systems ist der Rechner zeitweise nicht benutzbar, die Uhr im Systray bleibt mehrere Sekunden lang stehen, der Spotify-Client stoppt die Wiedergabe, "top" wird nur alle paar Sekunden aktualisiert, ... Festgestellt habe ich das Problem zuerst beim Start eines Win10-Gasts in VirtualBox und hatte es auf VirtualBox geschoben (siehe auch hier im Forum). Das System friert allerdings nicht komplett ein, zwischendurch kann ich immer mal wieder z.B. zwischen Fenstern oder Desktops umschalten, Kommandos im Terminal eingeben etc. Eingaben werden z.B. auch gepuffert. Wenn ich im Terminal während der Einfrierphase 3x Enter drücke, erscheinen die dann auch irgendwann.




    Inzwischen habe ich mittels "top" festgestellt, dass zu diesem Zeitpunkt immer die Prozesse btrfs-cleaner und btrfs-transaction laufen.Sobald die beiden weg sind, läuft das System wieder rund. Bei der Ursachenforschung bin ich unter anderem auf Bug 1063638 (btrfs balance renders system unresponsive and eventually even kills WiFi when quota is enabled) gestoßen. Hier wird mein Problem ziemlich genau beschrieben, allerdings ist dieser Bug aus 2018 inzwischen geschlossen.


    Ich habe in /etc/cron.{daily|weekly|monthly} auch keine btrfs-Skripte liegen.


    Das Problem tritt seit letztem Freitag auf. Ich hatte von Donnerstag auf Freitag rund 500 Updates bekommen (überwiegend KDE) und das System anschließend zur Sicherheit neu gestartet. Seitdem habe ich nach jedem Neustart in den ersten Minuten diese Probleme. btrfs-Updates waren am Freitag allerdings nicht dabei.


    Hat jemand ähnliche Probleme bzw. eine Idee, wie ich sie beheben kann? Das System komplett neu mit ext4 zu installieren möchte ich momentan noch nicht.

    Für den Inhalt des Beitrages 135279 haftet ausdrücklich der jeweilige Autor: Oceanwaves

  • Hatte ich vor längerer Zeit auch mal.
    Zur Kontrolle poste bitte auch:

    Code
    btrfs device stats /
    Code
    systemctl list-timers --all
    Code
    systemctl --failed
    Code
    btrfs qgroup show /

    Für den Inhalt des Beitrages 135285 haftet ausdrücklich der jeweilige Autor: sterun

  • Hatte ich vor längerer Zeit auch mal.
    Zur Kontrolle poste bitte auch:

    Code
    btrfs device stats /




    Code
    systemctl list-timers --all
    Code
    systemctl --failed
    Code
    btrfs qgroup show /

    Gerne doch:

    Code
    btrfs device stats /
    [/dev/nvme0n1p1].write_io_errs    0
    [/dev/nvme0n1p1].read_io_errs     0
    [/dev/nvme0n1p1].flush_io_errs    0
    [/dev/nvme0n1p1].corruption_errs  0
    [/dev/nvme0n1p1].generation_errs  0

    Argh! Jetzt erst gesehen, dass im Betreff "Timbleweed" statt "Tumbleweed" steht. So was Blödes. Lässt sich aber anscheinend nicht mehr korrigieren...

    Einmal editiert, zuletzt von Oceanwaves ()

    Für den Inhalt des Beitrages 135287 haftet ausdrücklich der jeweilige Autor: Oceanwaves

  • Wie du siehst, kommen die "großen" BTRFS Timer 1x wöchentlich bzw. einer alle 4 Wochen.
    Ich vermute, du hast eine große Anzahl von Snapshots.
    Diese würde ich anzeigen lassen mit:

    Code
    snapper ls

    ...und nicht benötigte anschl. löschen mit:

    Code
    snapper delete --sync von[Nr]-bis[Nr]

    Diese werden nämlich mit einbezogen, wenn bestimmte BTRFS-Timer laufen - und das dauert.
    Anschl. ein:

    Code
    btrfs quota rescan -w /

    Und:

    Code
    btrfs balance --full-balance /

    Der Letzte Befehl dauert.
    Aber dann sollte es laufen.

    Für den Inhalt des Beitrages 135289 haftet ausdrücklich der jeweilige Autor: sterun

  • Wann sind es denn "viele"? Aktuell sieht es für / so aus

    Allerdings dauert obiges "snapper ls" auch 1:30 min. Ist das normal? Und wie viele Snapshots sollten es höchstens sein?


    Habe am 20.08. allerdings auch Snapshots für /home aktiviert. Der macht ja stündlich Snapshots, aktuell sind es 17.

    Für den Inhalt des Beitrages 135290 haftet ausdrücklich der jeweilige Autor: Oceanwaves

  • Auch noch:
    systemctl cat btrfs-balance.timer

    Für den Inhalt des Beitrages 135291 haftet ausdrücklich der jeweilige Autor: Oceanwaves

  • Also bei mir ist OnCalendar nicht doppelt:


    Leap 15.0

    Für den Inhalt des Beitrages 135292 haftet ausdrücklich der jeweilige Autor: Sauerland