টাস্ক সমাপ্তির সময়ে বৈকল্পিকতা কীভাবে মেক্যানকে প্রভাবিত করে?


16

আসুন বলে যে আমরা কর্ম বৃহৎ সংগ্রহ আছে τ1,τ2,...,τn ও অভিন্ন একটি সংগ্রহ প্রসেসর (কার্যকারিতা পদ) ρ1,ρ2,...,ρm যা সম্পূর্ণ সমান্তরালভাবে কাজ করে। আগ্রহের পরিস্থিতিগুলির জন্য, আমরা ধরে নিতে পারি mn। প্রতিটি τi একবার এটি একটি প্রসেসর নির্ধারিত হয় সম্পূর্ণ করার সময় / চক্র কিছু পরিমাণ সময় লাগে ρj, এবং একবার এটি নির্ধারিত হয়ে গেলে, শেষ না হওয়া পর্যন্ত এটি পুনরায় নিয়োগ দেওয়া যাবে না (প্রসেসর সর্বদা নির্ধারিত কাজগুলি শেষ করে)। আসুন ধরে নেওয়া যাক যে প্রতিটি τi কিছুটা সময় / চক্র গ্রহণ করি Xi , আগে থেকে জানা যায় না, কিছু বিচ্ছিন্ন এলোমেলো বিতরণ থেকে নেওয়া। : এই প্রশ্নের জন্য, এমনকি আমরা একটি সহজ বন্টন অনুমান করতে পারেন P(Xi=1)=P(Xi=5)=1/2 , এবং সমস্ত Xi হয় pairwise স্বাধীন। অতএব μi=3 এবং σ2=4

ধরুন, স্থিতিস্থাপকভাবে, সময় / চক্র 0 এ, সমস্ত কার্য সমস্ত প্রসেসরের জন্য যথাসম্ভব সমানভাবে নির্ধারিত, একসাথে এলোমেলোভাবে; তাই প্রতিটি প্রসেসর ρj নির্ধারিত হয় n/m (আমরা ঠিক যেমন ভাল অনুমান করতে পারেন কাজগুলো m|n প্রশ্ন উদ্দেশ্যে)। আমরা makespan সময় / চক্র যা গত প্রসেসর কল ρ তার নির্ধারিত কাজ শেষ করতে কাজ এটা কার্যভার প্রদান করা হয়েছিল শেষ। প্রথম প্রশ্ন:

m , n , এবং এর একটি ফাংশন হিসাবে , Xiম্যাপপ্যান M কি? বিশেষত, E[M] কী? Var[M] ?

দ্বিতীয় প্রশ্ন:

ধরুন P(Xi=2)=P(Xi=4)=1/2 , এবং সমস্ত Xi pairwise স্বাধীন, তাই μi=3 এবং σ2=1 । এর কার্যকারিতা হিসেবে m , n , এবং এই নতুন Xi এর, makespan কি? আরও মজার বিষয় হল, এটি প্রথম অংশের উত্তরের সাথে কীভাবে তুলনা করে?

কিছু সাধারণ চিন্তার পরীক্ষা-নিরীক্ষার উত্তরগুলির উত্তরটি প্রমাণ করে যে মেকপ্যানসটি দীর্ঘ। তবে এটি কীভাবে মাপানো যায়? যদি এটি (ক) বিতর্কিত বা (খ) অস্পষ্ট হয় তবে আমি উদাহরণ পোস্ট করে খুশি হব। এইটির সাথে সাফল্যের উপর নির্ভর করে, আমি এই একই অনুমানগুলির অধীনে একটি গতিশীল অ্যাসাইনমেন্ট স্কিম সম্পর্কে একটি ফলোআপ প্রশ্ন পোস্ট করব। আগাম ধন্যবাদ!

একটি সহজ ক্ষেত্রে বিশ্লেষণ: m=1

যদি , তবে সমস্ত এন কার্য একই প্রসেসরের সাথে নির্ধারিত। মেকস্প্যান এম একটি সম্পূর্ণ অনুক্রমিক ফ্যাশনে এন কার্য শেষ করার সময় মাত্র । সুতরাং, [ এম ]m=1nMn এবং ভি আর [ এম ]

E[M]=E[X1+X2+...+Xn]=E[X1]+E[X2]+...+E[Xn]=μ+μ+...+μ=nμ
Var[M]=Var[X1+X2+...+Xn]=Var[X1]+Var[X2]+...+Var[Xn]=σ2+σ2+...+σ2=nσ2

মনে হচ্ছে এর প্রশ্নের উত্তর দেওয়ার জন্য এই ফলাফলটি ব্যবহার করা সম্ভব হতে পারে ; আমরা কেবল একটি অভিব্যক্তি (অথবা কাছাকাছি পড়তা) বের করতে হবে সর্বোচ্চ ( ওয়াই 1 , ওয়াই 2 , ,m>1 যেখানে ওয়াই আমি = এক্স আমি এনmax(Y1,Y2,...,Ym) ,μY=nসহ একটি এলোমেলো পরিবর্তনশীলYi=Xinm+1+Xinm+2+...+Xinm+nmএবংσ 2 Y =nμY=nmμX । এটি কি সঠিক দিকে যাচ্ছে?σY2=nmσX2


দুর্দান্ত প্রশ্ন। যদি কেবল আজই কোনও সময়সীমা না
ডেভ ক্লার্ক

উত্তর:


8

হিসাবে , আমরা পরিপ্রেক্ষিতে এই তাকান পারেন এবং এন পরিবর্তে এন এবং মি । ধরা যাক, টি- সময় হ'ল i -th প্রসেসরের কাজ শেষ করতে সময় লাগে ।m=k×nknnmTii

হিসাবে বৃদ্ধি, সম্ভাব্যতা যে টি আমি = 5 (প্রসেসর শুধুমাত্র নির্ধারিত হয়েছিল টি = 5 কর্ম) কিছু আমি পন্থা 1 , তাই makespan হিসেবে সংজ্ঞায়িত মি একটি এক্স ( টি আই ) , [ এম ] পন্থা 5 nTi5kT=5i1max(Ti)E[M]5k

দ্বিতীয় দৃশ্যের জন্য এটি তাই প্রসেসরের সংখ্যা বৃদ্ধি 4-2 বিভক্তিকে আরও ভাল করে তোলে।4k

কী - প্রসেসর প্রতি কর্ম সংখ্যা বাড়িয়ে? ক্রমবর্ধমান কে এর বিপরীত প্রভাব ফেলেছে, এটির কাজগুলির একটি দুর্ভাগ্য সেট সহ প্রসেসর হওয়ার সম্ভাবনা কম। আমি এখন বাড়িতে যাচ্ছি তবে আমি এই পরে ফিরে আসব। আমার "কুঁচক" হ'ল কে বাড়ার সাথে সাথে [ এম ] এর মধ্যে 4-2 বিভাজন এবং 5-1 বিভক্তির পার্থক্য অদৃশ্য হয়ে যায়, [ এম ] উভয়ের জন্য একই হয়ে যায়। সুতরাং আমি ধরে নেব যে কিছু বিশেষ ক্ষেত্রে ( কে এবং এন এর খুব ছোট নির্দিষ্ট মান ) বাদে 4-2 সর্বদা ভাল ।kkkE[M]E[M]kn

সুতরাং সংক্ষেপে:

  • নিম্নতর বৈকল্পিকতা আরও ভাল, সমস্ত কিছু সমান।
  • As the number of processors grows, lower variance becomes more important.
  • As the number of tasks per processor grows, lower variance becomes less important.

+1 Excellent intuition, and this helps to clarify my thinking as well. So increasing processor counts tends to increase makespan under a weak scaling assumption; and increasing task counts tends to decrease makespan under a strong scaling assumption (of course it takes longer; I mean the work/makespan ratio improves). These are interesting observations, and they seem true;
Patrick87

the first is justified by the fact that 1(1P(X=5)k)n tends to 1 for fixed k and increasing n; the latter by the fact that Var[X+X]=Var[X]+Var[X]=2σ24σ2=4Var[X]=Var[2X]... so the variance doesn't increase linearly as a function of k. Is that compatible with your thinking (that's how I'm interpreting what you have so far)?
Patrick87

I don't know where the "hunch" came from; it is not consistent with the rest of the heuristic reasoning.
András Salamon

2

I find that heuristic arguments are often quite misleading when considering task scheduling (and closely related problems like bin packing). Things can happen that are counter-intuitive. For such a simple case, it is worthwhile actually doing the probability theory.

Let n=km with k a positive integer. Suppose Tij is the time taken to complete the j-th task given to processor i. This is a random variable with mean μ and variance σ2. The expected makespan in the first case is

E[M]=E[max{j=1kTiji=1,2,,m}].
The sums are all iid with mean kμ and variance kσ2, assuming that Tij are all iid (this is stronger than pairwise independence).

Now to obtain the expectation of a maximum, one either needs more information about the distribution, or one has to settle for distribution-free bounds, such as:

  • Peter J. Downey, Distribution-free bounds on the expectation of the maximum with scheduling applications, Operations Research Letters 9, 189–201, 1990. doi:10.1016/0167-6377(90)90018-Z

which can be applied if the processor-wise sums are iid. This would not necessarily be the case if the underlying times were just pairwise independent. In particular, by Theorem 1 the expected makespan is bounded above by

E[M]kμ+σkn12n1.
Downey also gives a particular distribution achieving this bound, although the distribution changes as n does, and is not exactly natural.

Note that the bound says that the expected makespan can increase as any of the parameters increase: the variance σ2, the number of processors n, or the number of tasks per processor k.

For your second question, the low-variance scenario resulting in a larger makespan seems to be an unlikely outcome of a thought experiment. Let X=maxi=1mXi denote the makespan for the first distribution, and Y=maxi=1mYi for the second (with all other parameters the same). Here Xi and Yi denote the sums of k task durations corresponding to processor i under the two distributions. For all xkμ, independence yields

Pr[Xx]=i=1mPr[Xix]i=1mPr[Yix]=Pr[Yx].
Since most of the mass of the probability distribution of the maximum will be above its mean, E[X] will therefore tend to be larger than E[Y]. This is not a completely rigorous answer, but in short, the second case seems preferable.
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.