অ্যাপাচি স্পার্ক ওয়েব ইউআইতে "পর্যায় এড়ানো" এর অর্থ কী?


উত্তর:


124

সাধারণত এর অর্থ হ'ল ডেটা ক্যাশে থেকে আনা হয়েছে এবং প্রদত্ত পর্যায়ে পুনরায় সম্পাদন করার প্রয়োজন ছিল না। এটি আপনার ডিএজি এর সাথে সামঞ্জস্যপূর্ণ যা দেখায় যে পরবর্তী পর্যায়ে বদলানো প্রয়োজন ( reduceByKey)। যখনই সেখানে জড়িত জড়িত থাকে স্পার্ক স্বয়ংক্রিয়ভাবে উত্পন্ন ডেটা ক্যাশে করে :

শিফেল ডিস্কে প্রচুর সংখ্যক ইন্টারমিডিয়েট ফাইল তৈরি করে। স্পার্ক ১.৩ হিসাবে, সম্পর্কিত আরডিডি আর ব্যবহার না করা এবং আবর্জনা সংগ্রহ না করা অবধি এই ফাইলগুলি সংরক্ষণ করা হয়। এটি সম্পন্ন করা হয়েছে যাতে বংশটি পুনরায় গণনা করা হয় তবে শাফল ফাইলগুলি পুনরায় তৈরি করার দরকার নেই।


23
দুর্দান্ত উত্তর। আপনি খুঁজে বের করতে চান তাহলে উপায় এর শব্দার্থবিদ্যা সম্পর্কে আরো "এড়ানো" এবং খুঁজে বার করো ওয়েব UI এ পর্যায়ে "মুলতুবি", github.com/apache/spark/pull/3009 , খিঁচ অনুরোধ যা প্রথম এই ধারণার পরিচয় করিয়ে দেন। চাকরি-স্তরের অগ্রগতি বারগুলির সাথে কীভাবে বাদ পড়ে / মুলতুবি পর্যায়গুলি ইন্টারঅ্যাক্ট হয় সে সম্পর্কে আপনি আগ্রহী যদি সেই পিআরও একটি আকর্ষণীয় পঠন।
জোশ রোসেন

4
আমি যদি সঠিকভাবে অনুসরণ করছি, স্পার্ক এড়িয়ে যাওয়া মানে কি তা ঘটে না এবং এগুলি সমস্ত একসাথে কোড থেকে সরানো যেতে পারে? বা কোড ক্যাশে খুব দক্ষ তাই এটি ছেড়ে? @ শূন্য ৩৩৩
স্পার্কলগোট

4
@ স্পার্কেলগোট নং এর অর্থ এই যে এই স্তরগুলি আগে মূল্যায়ন করা হয়েছিল এবং ফলাফল পুনরায় কার্যকর করা ছাড়াই উপলব্ধ।
10465355 বলছেন পুনরায় ইনস্টল করুন মনিকা

অন্য প্রশ্ন, ক্যাশে এবং এড়িয়ে যাওয়ার পর্যায়গুলি কি আউটপুট ডেটাটিকে আলাদা করতে পারে?
স্পার্কলগোট

4
@ স্পার্কলগোট, কোনও ক্যাশিং নেই (এবং এর কারণে এড়িয়ে যাওয়া) একটি অভ্যন্তরীণ স্পার্ক অপটিমাইজেশন এবং কোনওভাবে আউটপুট ডেটা পরিবর্তন করে না।
রবি সানওয়াল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.