OpenMPI: No preset parameters found

Hinweis: In dem Thema OpenMPI: No preset parameters found gibt es 6 Antworten. Der letzte Beitrag () befindet sich ganz unten auf dieser Seite.
  • Hallo zusammen,


    wir haben einen neuen Computer gekauft und bekommen jetzt beim Ausführen von Programmen mit OpenMPI eine Fehlermeldung, die wir nicht verstehen. Wir hoffen, dass wir hier ein paar Ratschläge oder Hinweise erhalten können.


    Diese Fehlermeldung wird ausgegeben, wenn wir z. B mpirun oder mpiexec benutzen:



    Ein Ausschnitt aus der angesprochenen Konfigurationsdatei:


    Die Ausgabe von 'lscpu':



    Leider habe ich keine Lösung über die Suche gefunden, die eine Änderung des Eintrages in der ini-File oder eine andere Anpassung vorschlägt.


    Gibt es jemanden mit einem ähnlichen Problem oder einer möglichen Hilfestellung?


    Beste Grüße

    Für den Inhalt des Beitrages 130187 haftet ausdrücklich der jeweilige Autor: phanlipo

  • Das Memlock limit konfigurierst du in /etc/security/limits.conf
    Lies dazu man 5 limits.conf
    Und die Zahl -1 steht für unlimited.


    Soll man mehr dazu sagen, solltest du schreiben, was ihr denn so über das MessagePassingInterface schaufeln wollt.

  • Vielen Dank für diesen Hinweis. Damit ist jetzt ein Teil der Fehlermeldung gelöst. Jedoch ist weiterhin ein Problem mit den nicht gesetzten Parametern.



    MPI benutzen wir zur Simulation mit selbst geschriebenen Programmen auf einer eigens betreuten Serverinfrastruktur. (10 Knoten mit >100 Cores, >1TB RAM).
    Auf dem neuesten der 10 Knoten existiert dieses Problem.

    Für den Inhalt des Beitrages 130408 haftet ausdrücklich der jeweilige Autor: phanlipo

  • Mit


    Bash
    mpiexec -n 42 -mca btl_openib_warn_no_device_params_found 0 ./a.out


    kann ich jetzt die Warnung ausschalten. Es gibt aber immer noch eine Fehlermeldung, die mehrmals angezeigt wird:



    Bash
    libi40iw-i40iw_vmapped_qp: failed to pin memory for SQ
    libi40iw-i40iw_ucreate_qp: failed to map QP

    Muss man sich dort Sorgen machen?

    Für den Inhalt des Beitrages 130487 haftet ausdrücklich der jeweilige Autor: phanlipo

  • Das solltest du die Leute fragen, die über diese Queue kommunzieren (lassen).



    Wir können nicht wissen, was eure Programme da machen, was über diese MPIs laufen.
    Das mag harmlos sein, und lediglich auf schlampige Programmierung zeigen, es mag auch ein subtiler Bug sein, oder ein nicht so subtiler...
    Wir können das nicht wissen.
    Nicht ohne ausführliche Infos über alle beteiligte Softwareteile.
    (Und die wirst du wohl eher nicht hier posten (dürfen))

  • Mit einem Hello World Programm von hier lässt sich das Problem einfach reproduzieren.

    So richtig schlau werde ich nicht, ob die Hardware oder das Betriebssystem Probleme macht.

    Für den Inhalt des Beitrages 130497 haftet ausdrücklich der jeweilige Autor: phanlipo