Watchdog Problem mit sp5100_tco

Hinweis: In dem Thema Watchdog Problem mit sp5100_tco gibt es 3 Antworten. Der letzte Beitrag () befindet sich ganz unten auf dieser Seite.
  • Beim booten, wenn die Meldungen durchlaufen, bleibt das System mit folgender Meldung paar Sekunden stehen.


    I/O Adress 0x0cde sp5100_tco allready in use
    (Meldung frei aus dem Gedächtnis, die Adresse und sp5100_tco stimmen aber)


    Nun hab ich recherchiert und ermittelt, was mir die Meldung sagen will und habe folgendes erfahren:


    "Hardware-Watchdog-Treiber für den AMD / ATI SP5100 Chipsatz. Der TCO (Total Cost of Ownership) -Timer ist ein Watchdog-Timer, der den Rechner nach seinem Ablauf neu startet."


    So tief stecke ich nicht in der Materie, das mir die Meldung jetzt viel sagt. Es muß wohl auch ein Kernel-Problem sein, denn diese Meldung geistert schon seit 2011 oder noch früher durch die Gegend.
    Es gab diverse Bug-Reports, in denen nach der Meldung mitgeteilt wurde, das der "Fehler" mit dem nächsten Kernel beseitigt wäre. Dem scheint aber wohl nicht so zu sein, denn das Problem steckt auch im aktuellen Kernel (oder wieder).
    Aufgefallen ist mir dieses Problem erst seit Leap 42.x. In Linux 13.2 konnte ich das Verhalten nicht feststellen.


    Ausser das der Rechner im Bootvorgang einige wenige Sekunden unterbrochen ist, sind keine weiteren Nachteile festzustellen.
    Vorgeschlagen wurde, den sp5100_tco zu Blacklisten. Habe ich gemacht, bringt keinerlei Änderung. Die Meldung kommt dennoch und der Rechner hält weiterhin einige Sekunden an. Systemd-analyze blame zeigt dazu keinen Eintrag.
    Der aktuell bei mir laufende Kernel ist der 4.8.12.1.


    Konnte jemand dieses Verhalten schon einmal beobachten bzw. kann nähere Erklärungen dazu liefern?

  • Das Akronym TCO hat viele Bedeutungen. Die TotalCostofOwnership schliesse ich vollständig aus.
    Hier wird das wohl eher TemperatureControlledOscillator meinen.


    Der Watchdog -ein Wachhund- ist ein Teil des Kernels. Dort können sich Geräte oder Programme registrieren.
    Entweder sie senden in regelmäßigen Intervallen irgendeine "Ich-lebe-noch-und-tue-meinen-Job"- Nachricht an den Watchdog, oder der Watchdog prüft mittels einer bei Konfig angegebener Routine, ob das Gerät/Programm noch reagiert.


    Fällt das Geräte/Programm aus -also keine Message oder Reaktion- dann wird es vom Kernel zwangsweise neu gestartet.


    Ich habe weder diesen Chipsatz, noch einen vergleichbaren Watchdog. Kann also nicht spezifischer beitragen.


    Ich würde als erstes nachgucken, ob es nicht ein BIOS Update vom Hersteller des Boards gibt.
    Und dann in den BIOS Einstellungen mit allem spielen, was irgendwie mit Temperatur, Powermanagent und Taktfrequenzen zu tun hat.


    Beim Weg des Blacklistens mag es nötig sein, auch alle abhängigen Module zu gucken und da ggf. das ein- oder andere auch zu blacklisten.


    Bash
    # DEPendencies of kernel MODule
    depmod show <modulename>

    Manche Module kennen auch Optionen und Argumente. Mag sein, dass du das gewünschte Verhalten bei Aufruf festlegen kannst.

  • Danke für die Info. Such ich mal in der Richtung.


    Gesendet von meinem SM-T530

  • Nachtrag: Ich habe das Modul jetzt einfach auf die schwarze Liste gesetzt. Und Ruhe ist.