আসুন নিম্নলিখিতগুলির জন্য ধরে নেওয়া যাক যে প্রতিটি পয়েন্টে সময়ে মাত্র একটি স্পার্ক কাজ চলছে।
আমি এখন পর্যন্ত কি পেতে
স্পার্কে কী ঘটে তা আমি এখানে বুঝতে পারি:
- যখন একটি
SparkContext
তৈরি করা হয়, প্রতিটি কর্মী নোড একটি নির্বাহক শুরু করে। এক্সিকিউটাররা পৃথক প্রক্রিয়া (জেভিএম), যা ড্রাইভার প্রোগ্রামের সাথে আবার সংযোগ স্থাপন করে। প্রতিটি নির্বাহকের ড্রাইভার প্রোগ্রামের জার থাকে। ড্রাইভার ছেড়ে যাওয়া, এক্সিকিউটরদের বন্ধ করে দেয়। প্রতিটি নির্বাহক কিছু পার্টিশন ধরে রাখতে পারেন। - যখন কোন কাজ কার্যকর করা হয়, বংশের গ্রাফ অনুসারে একটি কার্যকরকরণ পরিকল্পনা তৈরি করা হয়।
- মৃত্যুদন্ড কার্যকর করার কাজগুলি পর্যায়গুলিতে বিভক্ত হয়, যেখানে অনেকগুলি প্রতিবেশী (বংশের গ্রাফে) রূপান্তর এবং ক্রিয়াকলাপ অন্তর্ভুক্ত থাকে তবে কোনও পরিবর্তন হয় না। এইভাবে পর্যায়গুলি শফলেস দ্বারা পৃথক করা হয়।
আমি বুঝতে পারি যে
- একটি কাজ হ'ল ফাংশন অবজেক্টটি সিরিয়াল করে ড্রাইভারের কাছ থেকে এক্সিকিউটারের কাছে পাঠানো একটি কমান্ড।
- নির্বাহক কমান্ডটি (টাস্ক) ডিসায়ারাইজ করে (ড্রাইভার জারের সাথে) এবং এটি একটি পার্টিশনে চালিত করে।
কিন্তু
প্রশ্ন (গুলি)
এই কাজগুলিতে আমি কীভাবে মঞ্চটি বিভক্ত করব?
বিশেষ করে:
- রূপান্তর ও ক্রিয়া দ্বারা নির্ধারিত কার্যগুলি কি একাধিক রূপান্তর / ক্রিয়া কোনও কার্যক্রমে হতে পারে?
- পার্টিশন দ্বারা নির্ধারিত কাজগুলি (উদাহরণস্বরূপ পার্টিশন প্রতি স্টেজ প্রতি এক টাস্ক)।
- কাজগুলি নোডগুলি দ্বারা নির্ধারিত হয় (উদাহরণস্বরূপ নোডের প্রতিটি স্তরের প্রতি কাজ)?
আমি যা মনে করি (কেবলমাত্র আংশিক উত্তর, এমনকি সঠিক হলেও)
ইন https://0x0fff.com/spark-architecture-shuffle , এলোমেলো ইমেজের সাথে ব্যাখ্যা করা হয়
এবং আমি ধারণাটি পেয়েছি যে নিয়মটি
নোডের সংখ্যা বিবেচনা না করে প্রতিটি পর্যায় পার্টিশন কার্যের # সংখ্যাতে বিভক্ত
আমার প্রথম চিত্রের জন্য আমি বলব যে আমার কাছে 3 টি মানচিত্রের কাজ এবং 3 টি কার্য কমাতে হবে।
0x0fff থেকে চিত্রটির জন্য, আমি বলব 8 টি মানচিত্র এবং 3 টি কার্য কমানো আছে (ধরে নিবেন যে কেবল তিনটি কমলা এবং তিনটি গা green় সবুজ ফাইল রয়েছে)।
যে কোনও ক্ষেত্রে প্রশ্ন খুলুন
এটা কি ঠিক? তবে এটি সঠিক হলেও, আমার উপরের সমস্ত প্রশ্নের উত্তর দেওয়া হবে না, কারণ এটি এখনও খোলা রয়েছে, একাধিক ক্রিয়াকলাপ (যেমন একাধিক মানচিত্র) কোনও কাজের মধ্যেই রয়েছে বা প্রতিটি ক্রিয়াকলাপে একটি কার্যে পৃথক করা হয়েছে।
অন্যরা কী বলে
স্পার্ক একটি কাজ কি? স্পার্ক কর্মী কীভাবে জার ফাইলটি কার্যকর করে? এবং অ্যাপাচি স্পার্ক শিডিয়ুলার ফাইলগুলিকে কীভাবে বিভক্ত করে? অনুরূপ, তবে আমি মনে করি না যে আমার প্রশ্নের উত্তরটি সেখানে পরিষ্কারভাবে দেওয়া হয়েছিল।