OpenMPI: No preset parameters found

Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

Hinweis: In dem Thema OpenMPI: No preset parameters found gibt es 6 Antworten. Der letzte Beitrag () befindet sich ganz unten auf dieser Seite.
  • OpenMPI: No preset parameters found

    Hallo zusammen,

    wir haben einen neuen Computer gekauft und bekommen jetzt beim Ausführen von Programmen mit OpenMPI eine Fehlermeldung, die wir nicht verstehen. Wir hoffen, dass wir hier ein paar Ratschläge oder Hinweise erhalten können.

    Diese Fehlermeldung wird ausgegeben, wenn wir z. B mpirun oder mpiexec benutzen:

    Shell-Script

    1. --------------------------------------------------------------------------
    2. WARNING: No preset parameters were found for the device that Open MPI
    3. detected:
    4. Local host: xxx
    5. Device name: i40iw0
    6. Device vendor ID: 0x8086
    7. Device vendor part ID: 14289
    8. Default device parameters will be used, which may result in lower
    9. performance. You can edit any of the files specified by the
    10. btl_openib_device_param_files MCA parameter to set values for your
    11. device.
    12. NOTE: You can turn off this warning by setting the MCA parameter
    13. btl_openib_warn_no_device_params_found to 0.
    14. --------------------------------------------------------------------------
    15. --------------------------------------------------------------------------
    16. The OpenFabrics (openib) BTL failed to initialize while trying to
    17. allocate some locked memory. This typically can indicate that the
    18. memlock limits are set too low. For most HPC installations, the
    19. memlock limits should be set to "unlimited". The failure occured
    20. here:
    21. Local host: n026
    22. OMPI source: btl_openib.c:794
    23. Function: ompi_free_list_init_ex_new()
    24. Device: i40iw1
    25. Memlock limit: 65536
    26. You may need to consult with your system administrator to get this
    27. problem fixed. This FAQ entry on the Open MPI web site may also be
    28. helpful:
    29. http://www.open-mpi.org/faq/?category=openfabrics#ib-locked-pages
    30. --------------------------------------------------------------------------
    Alles anzeigen

    Ein Ausschnitt aus der angesprochenen Konfigurationsdatei:

    Shell-Script: /usr/lib64/mpi/gcc/openmpi/share/openmpi/mca-btl-openib-device-params.ini

    1. ############################################################################
    2. # Intel has several OUI's, including 0x8086. Amusing. :-) Intel has
    3. # advised us (June, 2013) to ignore the Intel Phi OpenFabrics
    4. # device... at least for now.
    5. [Intel Xeon Phi]
    6. vendor_id = 0x8086
    7. vendor_part_id = 0
    8. ignore_device = 1
    9. ############################################################################
    Alles anzeigen
    Die Ausgabe von 'lscpu':


    Shell-Script

    1. Architecture: x86_64
    2. CPU op-mode(s): 32-bit, 64-bit
    3. Byte Order: Little Endian
    4. CPU(s): 28
    5. On-line CPU(s) list: 0-27
    6. Thread(s) per core: 1
    7. Core(s) per socket: 14
    8. Socket(s): 2
    9. NUMA node(s): 2
    10. Vendor ID: GenuineIntel
    11. CPU family: 6
    12. Model: 85
    13. Model name: Intel(R) Xeon(R) Gold 5120 CPU @ 2.20GHz
    14. Stepping: 4
    15. CPU MHz: 2200.000
    16. CPU max MHz: 3200.0000
    17. CPU min MHz: 1000.0000
    18. BogoMIPS: 4400.00
    19. Virtualization: VT-x
    20. L1d cache: 32K
    21. L1i cache: 32K
    22. L2 cache: 1024K
    23. L3 cache: 19712K
    24. NUMA node0 CPU(s): 0-13
    25. NUMA node1 CPU(s): 14-27
    26. Flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc art arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid dca sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch cpuid_fault epb cat_l3 cdp_l3 invpcid_single pti intel_ppin ssbd mba ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 hle avx2 smep bmi2 erms invpcid rtm cqm mpx rdt_a avx512f avx512dq rdseed adx smap clflushopt clwb intel_pt avx512cd avx512bw avx512vl xsaveopt xsavec xgetbv1 xsaves cqm_llc cqm_occup_llc cqm_mbm_total cqm_mbm_local dtherm ida arat pln pts pku ospke flush_l1d
    Alles anzeigen
    Leider habe ich keine Lösung über die Suche gefunden, die eine Änderung des Eintrages in der ini-File oder eine andere Anpassung vorschlägt.

    Gibt es jemanden mit einem ähnlichen Problem oder einer möglichen Hilfestellung?

    Beste Grüße

    Für den Inhalt des Beitrages 130187 haftet ausdrücklich der jeweilige Autor: phanlipo

  • Das Memlock limit konfigurierst du in /etc/security/limits.conf
    Lies dazu man 5 limits.conf
    Und die Zahl -1 steht für unlimited.

    Soll man mehr dazu sagen, solltest du schreiben, was ihr denn so über das MessagePassingInterface schaufeln wollt.
    Sokrates sagte, dass er nichts wisse.
    Ich bin viel, viel klüger als Sokrates.
    Ich weiß ganz genau, dass ich gar nichts weiß.

    Für den Inhalt des Beitrages 130190 haftet ausdrücklich der jeweilige Autor: Berichtigung

  • Vielen Dank für diesen Hinweis. Damit ist jetzt ein Teil der Fehlermeldung gelöst. Jedoch ist weiterhin ein Problem mit den nicht gesetzten Parametern.


    Shell-Script

    1. --------------------------------------------------------------------------
    2. WARNING: No preset parameters were found for the device that Open MPI
    3. detected:
    4. Local host: xxx
    5. Device name: i40iw0
    6. Device vendor ID: 0x8086
    7. Device vendor part ID: 14289
    8. Default device parameters will be used, which may result in lower
    9. performance. You can edit any of the files specified by the
    10. btl_openib_device_param_files MCA parameter to set values for your
    11. device.
    12. NOTE: You can turn off this warning by setting the MCA parameter
    13. btl_openib_warn_no_device_params_found to 0.
    14. --------------------------------------------------------------------------
    15. libi40iw-i40iw_vmapped_qp: failed to pin memory for SQ
    16. libi40iw-i40iw_ucreate_qp: failed to map QP
    Alles anzeigen
    MPI benutzen wir zur Simulation mit selbst geschriebenen Programmen auf einer eigens betreuten Serverinfrastruktur. (10 Knoten mit >100 Cores, >1TB RAM).
    Auf dem neuesten der 10 Knoten existiert dieses Problem.

    Für den Inhalt des Beitrages 130408 haftet ausdrücklich der jeweilige Autor: phanlipo

  • Wenn euer Zeuchs tut, dann schalte diese Warnung doch einfach ab.
    So, wie es in der Fehlermeldung selbst steht.
    Sokrates sagte, dass er nichts wisse.
    Ich bin viel, viel klüger als Sokrates.
    Ich weiß ganz genau, dass ich gar nichts weiß.

    Für den Inhalt des Beitrages 130411 haftet ausdrücklich der jeweilige Autor: Berichtigung

  • Mit

    Shell-Script

    1. mpiexec -n 42 -mca btl_openib_warn_no_device_params_found 0 ./a.out

    kann ich jetzt die Warnung ausschalten. Es gibt aber immer noch eine Fehlermeldung, die mehrmals angezeigt wird:


    Shell-Script

    1. libi40iw-i40iw_vmapped_qp: failed to pin memory for SQ
    2. libi40iw-i40iw_ucreate_qp: failed to map QP
    Muss man sich dort Sorgen machen?

    Für den Inhalt des Beitrages 130487 haftet ausdrücklich der jeweilige Autor: phanlipo

  • Das solltest du die Leute fragen, die über diese Queue kommunzieren (lassen).


    Wir können nicht wissen, was eure Programme da machen, was über diese MPIs laufen.
    Das mag harmlos sein, und lediglich auf schlampige Programmierung zeigen, es mag auch ein subtiler Bug sein, oder ein nicht so subtiler...
    Wir können das nicht wissen.
    Nicht ohne ausführliche Infos über alle beteiligte Softwareteile.
    (Und die wirst du wohl eher nicht hier posten (dürfen))
    Sokrates sagte, dass er nichts wisse.
    Ich bin viel, viel klüger als Sokrates.
    Ich weiß ganz genau, dass ich gar nichts weiß.

    Für den Inhalt des Beitrages 130491 haftet ausdrücklich der jeweilige Autor: Berichtigung

  • Mit einem Hello World Programm von hier lässt sich das Problem einfach reproduzieren.

    Shell-Script

    1. > mpiexec -n 1 -mca btl_openib_warn_no_device_params_found 0 ./MPI_Test
    2. --------------------------------------------------------------------------
    3. The OpenFabrics (openib) BTL failed to initialize while trying to
    4. create an internal queue. This typically indicates a failed
    5. OpenFabrics installation, faulty hardware, or that Open MPI is
    6. attempting to use a feature that is not supported on your hardware
    7. (i.e., is a shared receive queue specified in the
    8. btl_openib_receive_queues MCA parameter with a device that does not
    9. support it?). The failure occured here:
    10. Local host: n026
    11. OMPI source: btl_openib.c:324
    12. Function: ibv_create_srq()
    13. Error: Success (errno=0)
    14. Device: i40iw1
    15. You may need to consult with your system administrator to get this
    16. problem fixed.
    17. --------------------------------------------------------------------------
    18. Hello world from processor n026, rank 0 out of 1 processors
    Alles anzeigen
    So richtig schlau werde ich nicht, ob die Hardware oder das Betriebssystem Probleme macht.

    Für den Inhalt des Beitrages 130497 haftet ausdrücklich der jeweilige Autor: phanlipo