সাইকিট-লার্ন সম্পর্কে বেশিরভাগ অনুমানকারীতে, সমান্তরাল কাজ ব্যবহার করে তৈরি করার জন্য / পদ্ধতিগুলির একটি n_jobs
পরামিতি রয়েছে । আমি লক্ষ্য করেছি যে এটি সেট করা মাত্র 1 পাইথন প্রক্রিয়া তৈরি করে এবং কোরগুলি সর্বাধিক করে তোলে, ফলে সিপিইউ ব্যবহার 2500% শীর্ষে পৌঁছে যায়। এটি কিছু ধনাত্মক পূর্ণসংখ্য> 1 এ সেট করা থেকে একেবারে পৃথক, যা 100 ডলার ব্যবহারে একাধিক পাইথন প্রক্রিয়া তৈরি করে।fit
predict
joblib
-1
এটি কীভাবে সেট করার ফলে মাল্টি-সিপিইউ লিনাক্স সার্ভারে সিপিইউ এবং মূল ব্যবহারকে প্রভাবিত করে? (উদাহরণস্বরূপ যদি n_jobs=8
8 টি সিপিইউ পুরোপুরি লকড থাকে বা সিপিইউগুলি এখনও অন্য কাজ / প্রক্রিয়াগুলির জন্য কিছু কোর সংরক্ষণ করে?)
অতিরিক্ত হিসাবে, বড় ডেটাসেটের জন্য MemoryError
সেট n_jobs=-1
করার সময় আমি মাঝে মাঝে পাই । তবে একক পাইথন প্রক্রিয়াটির জন্য মেমরির ব্যবহারটি প্রায় 30-40% অবধি থাকে। কীভাবে ডেটা ও মেমরির মান / মূল্যায়ন করা হয় তার উপর নির্ভর করে n_jobs
?