শাসন ​​ব্যবস্থায় বল এবং বিনের বিশ্লেষণ : ফাঁক


23

ধরুন আমরা নিক্ষেপ করা হয় মধ্যে বাজে কথা বিন, যেখানে । যাক বিন আপ শেষ বল সংখ্যা হতে , গুরুতম বিন, হতে X_ \ মিনিট হালকা বিন কর এবং এক্স: _ {\ mathrm {সেকেন্ড-MAX}} দ্বিতীয় গুরুতম বিন হও। মোটামুটিভাবে বলতে, X_i - X_j \ সিম এন (0,2 মি / এন) , এবং তাই আমরা আশা করি | X_i - X_j | = Any থিতা (\ sqrt {m / n}) যেকোনো দুটি স্থির i, j এর জন্য । আবদ্ধ ইউনিয়ন ব্যবহার করে, আমরা এক্স _ {\ সর্বোচ্চ} - এক্স _ {\ মিনিট O = হে (O স্কয়ার্ট {এম {লগ এন / এন}) আশা করি ; সম্ভবত, আমরা এন / 2 বিবেচনা করে একটি মিল কম লোনে পেতে পারিmnmnXiiXmaxXminXsecmaxXiXjN(0,2m/n)|XiXj|=Θ(m/n) i,jXmaxXmin=O(mlogn/n)n/2বিরক্তি বিন এর জোড়া। এই (সম্পূর্ণরূপে আনুষ্ঠানিক নয়) যুক্তি বিশালাকার আমাদের আশা যে মধ্যে ফাঁক Xmax এবং Xmin হয় Θ(mlogn/n) উচ্চ সম্ভাবনা থাকে।

আমি মধ্যে ফাঁক আগ্রহী Xmax এবং Xsecmax। উপরে বর্ণিত আর্গুমেন্টটি দেখায় যে XmaxXsecmax=O(mlogn/n) উচ্চ সম্ভাবনা সহ, তবে logn ফ্যাক্টরটি বহিরাগত বলে মনে হচ্ছে । X_ \ সর্বাধিক - এক্স _ \ \ গণিত {সেকেন্ড-ম্যাক্স}} বিতরণ সম্পর্কে কিছু জানা যায় XmaxXsecmax?

আরও সাধারণভাবে, ধরুন যে প্রতিটি বল প্রতিটি বিনের জন্য একটি নেতিবাচক স্কোরের সাথে সম্পর্কিত , এবং আমরা m বল ছুঁড়ে দেওয়ার পরে প্রতিটি বিনের মোট স্কোরে আগ্রহী । স্বাভাবিক পরিস্থিতি ফর্মের স্কোরের সাথে (0,,0,1,0,,0) । ধরুন যে স্কোরগুলির সম্ভাব্যতা বন্টন বিনের অনুক্রমের অধীনে অবিচ্ছিন্ন (সাধারণ দৃশ্যে, এটি সমস্ত আবশ্যকীয় বিষয়টি এই বিষয়টির সাথে মিলে যায়)। স্কোর বিতরণের দেওয়া, আমরা একটি ভাল উপর আবদ্ধ পেতে প্রথম অনুচ্ছেদ পদ্ধতি ব্যবহার করতে পারেন XmaxXminআবদ্ধটিতে \ sqrt a \ লগ এন of এর একটি উপাদান থাকবেlognএটি ইউনিয়নের সাথে আবদ্ধ (একটি সাধারণ ভেরিয়েবলের লেজের সম্ভাব্যতার মাধ্যমে) আসে। যদি আমরা এক্স _ {\ সর্বাধিক _ - এক্স _ {\ গণিত m সেকেন্ড-সর্বাধিক} ing করতে বাধ্য হন তবে এই ফ্যাক্টরটি হ্রাস করা যাবে XmaxXsecmax?


প্রতিটি স্কোর [0,1] এ আছে?
নিল ইয়ং

এটি আসলে কোনও ব্যাপার নয়, আপনি সর্বদা এটি স্কেল করতে পারেন যাতে এটি । [0,1]
যুবাল ফিল্মাস

উত্তর:


21

উত্তর:Θ(mnlogn)

কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যের একটি বহুমাত্রিক সংস্করণ প্রয়োগ করে, আমরা পেয়েছি যে ভেক্টর এর গায়ে গাওসিয়ান বিতরণ এবং আমরা নিচের অনুমান করবে হয় একটি গসিয়ান ভেক্টর (এবং না শুধুমাত্র প্রায় একটি গসিয়ান ভেক্টর)। আসুন আমরা সমস্ত ( সমস্ত থেকে স্বতন্ত্র ) এর সাথে বৈকল্পিক সহ একটি গাউসিয়ান এলোমেলো পরিবর্তনশীল যুক্ত করি । যে, যাক ভি আর [ এক্স আই ] = মি ( 1)(X1,,Xn)সিভি(এক্সআই,এক্সজে)=-মি/এন2এক্সজেডএম/এন2এক্সআইজেডএক্সআই( ওয়াই 1 ওয়াই 2 ওয়াই এন )=( এক্স 1 +জেড এক্স 2 +জেড এক্স এন +জেড)(ওয়াই1

Var[Xi]=m(1n1n2),
Cov(Xi,Xj)=m/n2.
X Zm/n2XiZXi
(Y1Y2Yn)=(X1+ZX2+ZXn+Z).
আমরা একটি গাউসিয়ান ভেক্টর । এখন প্রতিটি এর ভেরিয়েন্স : এবং সমস্ত স্বতন্ত্র: Y i m / n V a r [ Y i ] = V a r [ X i ] + 2 C o v ( X i , Z ) =(Y1,,Yn)Yim/nওয়াইআইসিভি(ওয়াইআই,ওয়াইজে)=সিভি(এক্সআই,এক্সজে)+ সি ভি ( এক্স আই , জেড ) + সি ভি ( এক্স জে , জেড ) =
Var[Yi]=Var[Xi]+2Cov(Xi,Z)=0+Var[Z]=m/n,
Yi
Cov(Yi,Yj)=Cov(Xi,Xj)+Cov(Xi,Z)+Cov(Xj,Z)=0+Cov(Z,Z)=0.

নোট করুন যে । এভাবে আমাদের মূল সমস্যা খুঁজে বের করার সমস্যা সমতূল্য। সরলতার জন্য প্রথমে কেস বিশ্লেষণ করা যাক যখন সমস্ত বৈকল্পিক ।Y m a x - Y s e c - m a x Y i 1YiYj=XiXjYmaxYsecmaxYi1

সমস্যা। আমাদের সাথে স্বতন্ত্র গাউসিয়ান করা হয়েছে mean এবং বৈকল্পিক । প্রত্যাশা আনুমানিক।γ 1 , , γ n μ 1 γ m একটি x - γ s সি - মি একটি এক্সnγ1,,γnμ1γmaxγsecmax

উত্তর:Θ(1logn)

অনানুষ্ঠানিক প্রুফ এই সমস্যার একটি অনানুষ্ঠানিক সমাধান এখানে দেওয়া হয়েছে (এটি আনুষ্ঠানিক করা কঠিন নয়)। উত্তরটি যেহেতু গড়ের উপর নির্ভর করে না তাই আমরা ধরে নিই যে । আসুন , যেখানে । আমাদের কাছে (মাঝারি পরিমাণে বড় ), μ=0Φ¯(t)=Pr[γ>t]γN(0,1)t

Φ¯(t)12πte12t2.

মনে রাখবেন যে

  • Φ(γi) অভিন্ন এবং স্বতন্ত্রভাবে বিতরণ করা হয় ,[0,1]

  • Φ(γmax) মধ্যে সবচেয়ে ছোট ,Φ(γi)

  • Φ(γsecmax) among মধ্যে দ্বিতীয়তম ।Φ(γi)

সুতরাং নিকটবর্তী এবং নিকটবর্তী (কোনও ঘনত্ব নেই তবে আমরা যদি ডন করি না ') এই অনুমানগুলি সম্পর্কে ধ্রুবকদের যত্ন নেওয়ার পক্ষে যথেষ্ট ভাল; প্রকৃতপক্ষে, আমরা যদি ধ্রুবকগুলির যত্ন নিই তবে সেগুলি আরও বেশ ভাল - তবে এটির ন্যায়সঙ্গততা প্রয়োজন। জন্য সূত্রটি ব্যবহার করে আমরা পাই যে Φ(γmax)1/nΦ(γmax)2/nΦ¯(t)

2Φ¯(γsecmax)/Φ¯(γmax)e12(γmax2γsecmax2).

সুতরাং ma th ম্যাথর্ম হ'ল WHP নোট করুন যে am th ম্যাথরম । আমাদের কাছে γmax2γsecmax2Θ(1)γmaxγsecmax=Θ(logn)

γmaxγsecmaxΘ(1)γmax+γsecmaxΘ(1)logn.

Qed

আমরা

E[XmaxXsecmax]=E[YmaxYsecmax]=Var[Yi]×E[γmaxγsecmax]=Θ(mnlogn).

আমাদের যখন নির্বিচারে স্কোর থাকে তখন একই যুক্তিটি ঘটে। এটি দেখায় যে

E[XmaxXsecmax]=cE[XmaxXmin]/logn.

2
ধন্যবাদ! আমি মনে করব পরের বার মাল্টিভারিয়েট গাউসির আনুমানিকতা চেষ্টা করে দেখতে।
যুবাল ফিল্মাস

5
ইউরি, আপনি লিখেছিলেন, "আমাদের একটি গসিয়ান ভেক্টর যোগ করুন ভ্যারিয়েন্স সঙ্গে সকলের জন্য । আমরা একটি গসিয়ান ভেক্টর পেতে । এখন প্রতিটি ভ্যারিয়েন্স হয়েছে এবং সব নয় পারস্পরিক সম্পর্কযুক্ত ... নোট করুন যে "। আপনি এই অংশে প্রসারিত করতে পারেন? কি ? তাহলে এর নির্ভরশীল, এবং এর স্বাধীন (অথবা অবিশেষে একই) হয়, কিভাবে করতে এর স্বাধীন হতে? (একটি ঝরঝরে কৌতুক বলে মনে হচ্ছে তবে আমি তা বুঝতে পারি না)) ধন্যবাদ। Zm/n2Xi(Y1,,Yn)Yim/nYiYiYj=XiXjZi=ZjXiZiYi
নিল ইয়াং

1
@NealYoung, হ্যাঁ, আমরা ভেরিয়েবল আছে যদি নেতিবাচক pairwise পারস্পরিক সম্পর্ক সঙ্গে এবং সব covariances হয় সমান , তাহলে আমরা একটি যোগ করতে পারেন একক নতুন দৈব চলক সব থেকে যেমন যে অঙ্কগুলি স্বতন্ত্র। এছাড়াও, যদি ভেরিয়েবলগুলির ইতিবাচক পারস্পরিক সম্পর্ক থাকে এবং আবার সমস্ত covariances সমান হয় তবে আমরা থেকে একক আরভি বিয়োগ করতে পারি যাতে সমস্ত পার্থক্য স্বাধীন হয়; তবে এখন থেকে স্বতন্ত্র নয় বরংX1,,XnCov(Xi,Xj)ZXiCov(Xi,Xj)ZZXiZ=α(X1++Xn)কিছু স্কেলিং পরামিতি । α
ইয়ুরি

1
আহ আমি দেখি. কমপক্ষে বীজগণিতভাবে, এর উপর নির্ভর করে সমস্ত হ'ল জেড এবং প্রতিটি স্বাধীনতা । খুব ঠান্ডা. Xi
সুরেশ ভেঙ্কট

1
এই যুক্তিটি এখন একটি ইসি 14 পেপারে (অ্যাট্রিবিউশন সহ) প্রদর্শিত হবে: dl.acm.org/citation.cfm?id=2602829
যুবাল ফিল্মাস

13

আপনার প্রথম প্রশ্নের জন্য, আমি মনে করি আপনি যে whp দেখাতে পারেন যে হয় দ্রষ্টব্য যে এটি ।XmaxXsec-max

(মিএনলগ2লগএনলগএন)
(মি/এন)

আপনার এলোমেলো পরীক্ষাকে নীচের বিকল্পের সাথে তুলনা করুন: কে প্রথম বালতিগুলির যে সর্বাধিক লোড হতে দিন । যাক গত কোন সর্বোচ্চ লোড হতে বাকেট।এক্স1এন/2এক্স2এন/2

বিবেচনাধীন,একটি ঊর্ধ্ব উপর আবদ্ধ হয়। এছাড়াও, কমপক্ষে অর্ধেক সম্ভাবনা সহ,। সুতরাং, মোটামুটিভাবে বলতে গেলে, একইভাবে বিতরণ করা হয়েছে।|এক্স1-এক্স2|এক্সসর্বোচ্চ-এক্সগুলি-মিএকটিএক্স|এক্স1-এক্স2|=এক্সসর্বোচ্চ-এক্সগুলি-মিএকটিএক্সএক্সসর্বোচ্চ-এক্সগুলি-মিএকটিএক্স|এক্স1-এক্স2|

অধ্যয়ন করতে, নোট করুন যে উচ্চ সম্ভাব্যতার সাথে বলগুলি প্রথম টির মধ্যে ফেলে দেওয়া হয় এবং একইভাবে শেষ বিনের জন্য। সুতরাং এবং প্রতিটি বলগুলিকে টিনে ফেলে দেওয়ার সময় সর্বাধিক লোডের মতো মূলত বিতরণ করা হয় ।|এক্স1-এক্স2|মি/2±হে(মি)এন/2এন/2এক্স1এক্স2মি'=মি/2±(মি)এন'=এন/2

এই বিতরণটি ভালভাবে অধ্যয়ন করা হয়েছে এবং ভাগ্যক্রমে এই যুক্তিটির জন্য, এর গড়টি প্রায় দৃ tight়ভাবে কেন্দ্রীভূত হয়। উদাহরণস্বরূপ, যদি , তারপর উচ্চ সম্ভাবনা সঙ্গে তার প্রত্যাশা থেকে পৃথক দ্বারা সর্বাধিক পরিমাণ এই উত্তরটি [উপরের প্রদর্শিত Thm। 1 ]। (দ্রষ্টব্য: এই উপরের সীমাটি, আমি মনে করি, looseিলে, ইউরির উত্তর দেওয়া হয়েছে)) সুতরাং, উচ্চ সম্ভাবনার সাথে এবং বেশিরভাগের চেয়ে পৃথক হয়ে যায়, এবং তাই এবং দ্বারা সর্বাধিক এই অনেক পার্থক্য।মি'»এনলগ3এনএক্স1এক্স1এক্স2এক্সসর্বোচ্চএক্সমিএকটিএক্স-গুলি

বিপরীতভাবে, একটি (কিছুটা দুর্বল) নিম্নতর বাউন্ড, যদি, কোন , বলো, , তারপরে কমপক্ষে যা ( ইউনিয়ন দ্বারা আবদ্ধ) কমপক্ষে আমি মনে করি এটি আপনাকে একটি কনটেন্ট ফ্যাক্টরের মধ্যে the এর প্রত্যাশা দেওয়া উচিত ।টিpr[|এক্স1-এক্স2|টি]3/4pr[এক্সসর্বোচ্চ-এক্সসেকেন্ড-MAXটি]

pr[|এক্স1-এক্স2|টি  এক্সসর্বোচ্চ-এক্সসেকেন্ড-MAX=|এক্স1-এক্স2|]
এক্স সর্বোচ্চ - এক্স সেকেন্ড-MAX1-(1/4)-(1/2)=1/4।এক্সসর্বোচ্চ-এক্সসেকেন্ড-MAX

থমকে দেখছি। 1, প্রত্যাশা থেকে পার্থক্যটি হ'ল , , এবং আপনি যা লিখেছেন তা নয়। এটি এখনও চেয়ে অনেক ভাল । হে((মি/এন)লগলগএন)হে((মি/এন)লগএন)
যুবাল ফিল্মাস

থম দ্বারা 1 (এটির তৃতীয় ক্ষেত্রে), সম্ভাব্যতা সহ যে কোনও জন্য, কোনও (এন বিনে এম বল সর্বাধিক হ'ল আমার গণিত দ্বারা ( ), শব্দটি একটি অ্যাডিটিভ পরম টার্মে প্রসারিতআমি কি ভুল করছি? ε>01-(1)
মিএন+ +2মিলগএনএন1-(1±ε)লগলগএন2লগএন
1-δ=1-হে(δ)±ε
হে(ε)মিলগএনএন লগলগএনলগএন = হে(ε)মিএন লগ2লগএনলগএন
নিল ইয়ং

আহ - আমার ধারণা আপনি ঠিক বলেছেন আমি বর্গমূলের ভিতরে বিয়োগ করেছি এবং এটিই আমার চিত্রটি পেয়ে গেল।
ইয়ুভাল ফিল্মাস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.