আমার কাছে স্ট্যাটিক আইপি সহ 6 টি কম্পিউটার (4 টি কোর এবং প্রতিটি হার্ডওয়্যারে অভিন্ন) রয়েছে এবং ওপেনএমপিআই ব্যবহার করে সমান্তরালে এনএএমডি কম্পিউটেশনাল কেমিস্ট্রি সফটওয়্যারটি চালানো দরকার। তাই আমি
- ইনস্টল করা এসএসএইচ এবং ওপেনএমপিআই (18 টাকশাল)
- সমস্ত কম্পিউটারে এক্স / এক্সের এক্সিকিউটেবল ফাইল রাখুন
- পাসওয়ার্ডহীন এসএসএইচ সেট আপ করুন (আমি মাস্টার মেশিনের পাসওয়ার্ড ছাড়াই 4 টি স্লেভ কম্পিউটার অ্যাক্সেস করতে পারি)
তবে এটি 3 কম্পিউটারে কাজ করে এবং অন্যদের জন্য এটি দেয়
mpiuser@master ~/Desktop/apoa1-16 $ mpiexec -np 16 --hostfile mpi-hostfile namd2 apoa1.namd > apoa1.log
ssh: Could not resolve hostname slave32: Temporary failure in name resolution
ssh: Could not resolve hostname slave27: Temporary failure in name resolution
[master:04223] 1 more process has sent help message help-errmgr-base.txt / failed-daemon-launch
[master:04223] Set MCA parameter "orte_base_help_aggregate" to 0 to see all help / error messages
আমার / ইত্যাদি / মাস্টার কম্পিউটারের হোস্টগুলি দেখতে এটির মতো লাগে
127.0.0.1 localhost
#127.0.1.1 master
172.18.112.78 master
#Cluster Host Names
172.18.112.75 slave25
172.18.112.76 slave26
172.18.112.77 slave27
172.18.112.82 slave32
172.18.112.81 slave31
ssh स्লেভক্সএক্স ভাল কাজ করে
আমার এমপিআই-হোস্টফায়ালটি দেখতে এমন দেখাচ্ছে
localhost slots=4
slave25 slots=4
slave26 slots=4
slave27 slots=4
slave31 slots=4
slave32 slots=4
স্লেভ 25 এবং স্লেভ 26 সূক্ষ্মভাবে কাজ করে (সর্বাধিক 12 প্রসেসর, এমপিেক্সেক-এনপি 16), তবে এর চেয়ে বেশি ssh: Could not resolve hostname slavexx: Temporary failure in name resolution
ত্রুটি দেয়। এটি এতটাই ক্লান্ত যেহেতু আমি পিং করতে পারি, কোনও সমস্যা ছাড়াই সমস্ত 5 কম্পিউটারকে এসএসএস করুন।
এর সমাধান করার জন্য কারও ধারণা আছে?
এবং অন্য একটি জিনিস, এই মেশিনগুলি ক্লোন করা হয়েছে। তাই আমি ইদানীং কম্পিউটারের হোস্টনামটি পরিবর্তন করেছি এবং এসএসএইচ এবং ওপেনএমপিআই পুনরায় ইনস্টল করেছি।
আপডেট: ঠিক এখনই আমি বুঝতে পেরেছি যে mpi-hostfile
এমপিআই রান জন্য ব্যবহৃত প্রথম তিনটি । অন্যদের উপরে ত্রুটি পপ!