ফাস্ট ফুরিয়ার PDE solvers সাথে, অবিশেষে নমুনা ডেটা (FFT) ট্রান্সফর্ম যেমন ব্যবহার করার জন্য, এটা ভাল জানা যায় FFT একটি হল ) অ্যালগরিদম। এন → ∞ (যেমন খুব বড়) এর সমান্তরালভাবে প্রক্রিয়া করার সময় এফএফটি স্কেলটি কতটা ভাল হয় ?
ফাস্ট ফুরিয়ার PDE solvers সাথে, অবিশেষে নমুনা ডেটা (FFT) ট্রান্সফর্ম যেমন ব্যবহার করার জন্য, এটা ভাল জানা যায় FFT একটি হল ) অ্যালগরিদম। এন → ∞ (যেমন খুব বড়) এর সমান্তরালভাবে প্রক্রিয়া করার সময় এফএফটি স্কেলটি কতটা ভাল হয় ?
উত্তর:
এটি প্রমাণিত প্রমাণের চেয়ে আরও অজানা প্রমাণ, তবে দেখা যাচ্ছে যে এফএফটি-র জন্য যেমন বাস্তবায়নগুলি যেমন এফএফটিডাব্লু , তাদের স্কেলিংয়ের সীমাবদ্ধতার সীমাবদ্ধতা রয়েছে।
তবে এখানে গৃহ-বার্তাটি হ'ল এফএফটি স্কেল আপ করা উচিত; তবে, কখনও কখনও অপ্রত্যাশিত সীমাবদ্ধতা এবং মিথস্ক্রিয়াগুলি কার্যকর হয় যখন যখন কোনও অ্যালগোরিদমের কর্মতত্ত্বের তাত্ত্বিক বিবেচনা থেকে সত্যিকারের এইচপিসি প্ল্যাটফর্মে তার বাস্তবায়নের দিকে চলে যায়।
গুগল স্কলারে "সমান্তরাল এফএফটি" বা "সিউডোস্পেক্ট্রাল স্কেলাবিলিটি" অনুসন্ধান করা তথ্যের প্রচুর পরিমাণে উত্সাহ দেয় যা আমি মূল্যায়ন করতে অযোগ্য। তবে বাস্তবে কী সম্পাদন করা যায় তার একটি দুর্দান্ত সাম্প্রতিক উদাহরণ বলে মনে হচ্ছে:
সারাংশ:
বিতরণ করা মেমরি প্যারালালিজমের জন্য এমপিআই এবং শেয়ার্ড মেমরি সমান্তরালতার জন্য ওপেনএমপি ব্যবহার করে এমন একটি হাইব্রিড স্কিম উপস্থাপন করা হয়েছে। কাজটি উদীয়মান পেটাস্যাকেল, উচ্চ কোর-গণনা, ব্যাপকভাবে সমান্তরাল প্রক্রিয়াকরণ সিস্টেমের উপর তরল টার্বুলেন্সের সিউডোস্পেক্ট্রাল গণনাগুলিতে ব্যতিক্রমী উচ্চ রেনল্ডস সংখ্যা অর্জনের আকাঙ্ক্ষার দ্বারা অনুপ্রাণিত হয়। হাইব্রিড বাস্তবায়ন একটি ভাল-পরীক্ষিত স্কেলযোগ্য এমপিআই-সমান্তরাল সিউডোস্পেকট্রাল কোড থেকে প্রাপ্ত এবং বৃদ্ধি করে। হাইব্রিড দৃষ্টান্তটি সিউডোস্পেক্ট্রাল গ্রিডগুলির ডোমেন পচনের জন্য একটি নতুন ছবি বাড়ে, যা বোঝার ক্ষেত্রে সাহায্যকারী অন্যান্য বিষয়গুলির মধ্যে, সমান্তরাল দ্রুত ফুরিয়ার রূপান্তরগুলির জন্য প্রয়োজনীয় গ্লোবাল ডেটার 3 ডি ট্রান্সপোসগুলি যা এর কেন্দ্রীয় উপাদান। সংখ্যাগত বিচক্ষণতা। হাইব্রিড বাস্তবায়নের বিশদ সরবরাহ করা হয়েছে, এবং কর্মক্ষমতা পরীক্ষা পদ্ধতিটির কার্যকারিতা চিত্রিত করে। এটি প্রদর্শিত হয় যে হাইব্রিড স্কিমটি সর্বোচ্চ গড় দক্ষতা 83% এর সাথে 20000 ডলার গণনা কোর পর্যন্ত আদর্শ স্কেলাবিলিটি অর্জন করে। ডেটা উপস্থাপন করা হয় যে দুটি পৃথক প্ল্যাটফর্মের কোড পারফরম্যান্সকে অনুকূল করতে যাতে MPI প্রসেসের সর্বোত্তম সংখ্যা এবং ওপেনএমপি থ্রেডগুলি কীভাবে চয়ন করতে পারে তা প্রদর্শন করে।