এসএসএইচ ত্রুটি: এমপিআই রান নেভিগেশন নাম রেজুলেশনে অস্থায়ী ব্যর্থতা


2

আমার কাছে স্ট্যাটিক আইপি সহ 6 টি কম্পিউটার (4 টি কোর এবং প্রতিটি হার্ডওয়্যারে অভিন্ন) রয়েছে এবং ওপেনএমপিআই ব্যবহার করে সমান্তরালে এনএএমডি কম্পিউটেশনাল কেমিস্ট্রি সফটওয়্যারটি চালানো দরকার। তাই আমি

  1. ইনস্টল করা এসএসএইচ এবং ওপেনএমপিআই (18 টাকশাল)
  2. সমস্ত কম্পিউটারে এক্স / এক্সের এক্সিকিউটেবল ফাইল রাখুন
  3. পাসওয়ার্ডহীন এসএসএইচ সেট আপ করুন (আমি মাস্টার মেশিনের পাসওয়ার্ড ছাড়াই 4 টি স্লেভ কম্পিউটার অ্যাক্সেস করতে পারি)

তবে এটি 3 কম্পিউটারে কাজ করে এবং অন্যদের জন্য এটি দেয়

 mpiuser@master ~/Desktop/apoa1-16 $ mpiexec -np 16 --hostfile mpi-hostfile namd2 apoa1.namd > apoa1.log  
 ssh: Could not resolve hostname slave32: Temporary failure in name resolution
 ssh: Could not resolve hostname slave27: Temporary failure in name resolution  
 [master:04223] 1 more process has sent help message help-errmgr-base.txt / failed-daemon-launch  
 [master:04223] Set MCA parameter "orte_base_help_aggregate" to 0 to see all help / error messages  

আমার / ইত্যাদি / মাস্টার কম্পিউটারের হোস্টগুলি দেখতে এটির মতো লাগে

127.0.0.1   localhost  
#127.0.1.1  master  
172.18.112.78 master  
#Cluster Host Names  
172.18.112.75 slave25  
172.18.112.76 slave26  
172.18.112.77 slave27  
172.18.112.82 slave32  
172.18.112.81 slave31  

ssh स्লেভক্সএক্স ভাল কাজ করে

আমার এমপিআই-হোস্টফায়ালটি দেখতে এমন দেখাচ্ছে

localhost slots=4  
slave25 slots=4  
slave26 slots=4  
slave27 slots=4  
slave31 slots=4  
slave32 slots=4  

স্লেভ 25 এবং স্লেভ 26 সূক্ষ্মভাবে কাজ করে (সর্বাধিক 12 প্রসেসর, এমপিেক্সেক-এনপি 16), তবে এর চেয়ে বেশি ssh: Could not resolve hostname slavexx: Temporary failure in name resolutionত্রুটি দেয়। এটি এতটাই ক্লান্ত যেহেতু আমি পিং করতে পারি, কোনও সমস্যা ছাড়াই সমস্ত 5 কম্পিউটারকে এসএসএস করুন।

এর সমাধান করার জন্য কারও ধারণা আছে?

এবং অন্য একটি জিনিস, এই মেশিনগুলি ক্লোন করা হয়েছে। তাই আমি ইদানীং কম্পিউটারের হোস্টনামটি পরিবর্তন করেছি এবং এসএসএইচ এবং ওপেনএমপিআই পুনরায় ইনস্টল করেছি।

আপডেট: ঠিক এখনই আমি বুঝতে পেরেছি যে mpi-hostfileএমপিআই রান জন্য ব্যবহৃত প্রথম তিনটি । অন্যদের উপরে ত্রুটি পপ!


আপনি যে সমস্যা নিয়ে সমস্যায় পড়েছেন অন্য হোস্টগুলিকে কি পিং দিতে পারবেন? আপনাকে নিশ্চিত হতে হবে যে তাদের হোস্টনামগুলি সমাধান করা যেতে পারে। আপনি কি আপনার /etc/resolv.conf ফাইলটি পরীক্ষা করতে পারেন সেখানে DNS সার্ভারটি অপসারণের চেষ্টা করুন যাতে কেবল আপনার হোস্ট
টিম কনার

হ্যাঁ, আমি অন্যকে পিং করতে পারি এবং সমাধানটি খুঁজে পেতে পারি! স্লেভ মেশিন সহ সমস্ত মেশিনে আমাকে পাসওয়ার্ডহীন এসএসএস সক্ষম করতে হবে। এটি সমস্যার সমাধান করে।
মধুরাঙ্গ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.