স্টকেস্টিক প্রক্রিয়া মত হিমসাগর


16

নিম্নলিখিত প্রক্রিয়াটি বিবেচনা করুন:

আছে বিন থেকে নিচ পর্যন্ত ব্যবস্থা। প্রাথমিকভাবে, প্রতিটি বিন একটি বল থাকে। প্রতিটি পদক্ষেপে, আমরাn

  1. একটি বাছাই বল এলোমেলোভাবে অবিশেষে এবংb
  2. ধারণকারী বিন থেকে সব বাজে কথা সরাতে নীচের বিন করতে। যদি এটি ইতিমধ্যে সর্বনিম্ন বিন ছিল, আমরা প্রক্রিয়াটি থেকে বলগুলি সরিয়ে ফেলি।b

প্রক্রিয়াটি সমাপ্ত না হওয়া পর্যন্ত, অর্থাৎ সমস্ত বল প্রক্রিয়াটি অপসারণ না হওয়া পর্যন্ত প্রত্যাশায় এটি কতটি পদক্ষেপ নেয় ? এটি আগে পড়াশোনা করা হয়েছে? উত্তরটি কি কৌশলগুলি থেকে সহজে অনুসরণ করা যায়?n

সর্বোত্তম ক্ষেত্রে, প্রক্রিয়াটি পদক্ষেপের পরে শেষ করতে পারে । সবচেয়ে খারাপ ক্ষেত্রে এটি পদক্ষেপ নিতে পারে। যদিও উভয় ক্ষেত্রেই খুব সম্ভাবনা থাকা উচিত। আমার অনুমান যে এটি পদক্ষেপ নেয় এবং আমি কিছু পরীক্ষা-নিরীক্ষা করেছি যা দেখে মনে হয় এটি নিশ্চিত হয়ে গেছে।nΘ(n2)Θ(nlogn)

(নোট করুন যে এলোমেলোভাবে একটি বিন বাছাই করা খুব আলাদা প্রক্রিয়া যা স্পষ্টতই পদক্ষেপ গ্রহণ করবে।)Θ(n2)


প্রশ্নটি আকর্ষণীয় দেখাচ্ছে (যদিও আমি উত্তরটি জানি না)। একঘেয়েমিবিহীনতার কারণে এটি কঠিন বলে মনে হয়; সমস্ত এন বল যদি শীর্ষ বিনের মধ্যে থাকে তবে প্রক্রিয়াটি স্পষ্টভাবে ঠিক এন পদক্ষেপে শেষ হবে।
Tsuyoshi Ito

উত্তর:


11

আসলেই কোনও উত্তর নয়, তবে আন্দ্রেসের উত্তর সম্পর্কে বর্ধিত মন্তব্য।

আন্দ্রেসের উত্তরে একটি দুর্দান্ত স্বজ্ঞাততা রয়েছে, যদিও আমি বিশ্বাস করি না যে এটি প্রত্যাশিত পদক্ষেপের কঠোর গণনা। আমি মনে করি এটি একটি উত্তরের পক্ষে সম্ভবত একটি ভাল আনুমানিকতা, তবে উপরের বিনটি নিচের দিকে খালি করার আগে সর্বোচ্চ দখল করা বিনের নীচে বিনটি খালি হয়ে যাওয়ার ক্ষেত্রে এটি সঠিকভাবে মোকাবেলা করবে বলে মনে হয় না। তবুও, এটি করার পক্ষে যুক্তিসঙ্গত অনুমান হতে পারে (আমি নিশ্চিত নই)।

তার গণনায় একটি ত্রুটি রয়েছে যা স্কেলিংকে প্রভাবিত করে। আমি ঠিক একই সূচনা পয়েন্ট নিতে যাচ্ছি, এবং পুনরায় এবং গণনা প্রসারিত।

এটি সঙ্কলনের ভিতরে পি এর একটি উপাদানকে মিস করে, কারণ এলোমেলোভাবে সঠিক বিন নির্বাচন করার সম্ভাবনা চেয়ে1pn । ফলস্বরূপ আমাদের রয়েছে1n

n+p=1nk=0(k+1)pn(npn)k=n+p=1npnk=0(k+1)(npn)k=n+p=1npnn2p2=n+np=1n1/p=n(1+Hn)

যেখানে n তম হয় হারমনিক সংখ্যা । আনুমানিক এইচ এন আমরা সমষ্টিটি কেবল একটি অবিচ্ছেদ্য সাথে প্রতিস্থাপন করতে পারি: এইচ এনn + 1 1 1Hn=p=1n1/pHn। সুতরাং স্কেলিংটি হলএন(1+লগ(এন+1))বা আনুমানিকএনলগ(এন+1)। যদিও এই স্কেলিংটি সমস্যার স্কেলিংয়ের সাথে ঠিক মেলে না (নীচের সিমুলেশনটি দেখুন) এটি প্রায় ঠিকলগ(2) এরএকটি ফ্যাক্টর দ্বারা আউট।Hn1n+11xdx=log(n+1)n(1+log(n+1))nlog(n+1)log(2)

Simulation vs theory

লাল চেনাশোনা: প্রক্রিয়া সিমুলেশন থেকে ডেটা পয়েন্টগুলি গড়ে 10k রানের চেয়ে বেশি রান করে। সবুজ: । নীল: এন লগ ( এন + 1 )nlog2(n+1)nlog(n+1)


@ জো: দুর্দান্ত কাজ! ফাঁক তৈরি থেকে ফ্যাক্টর কীভাবে আসে তা এখন কঠোরতার সাথে দেখানো আকর্ষণীয় হবে । ln2
আন্দ্রেস সালামন

@ অ্যান্ড্রেস: এটি যদি ঠিক করা বা না করানোর মতো একটি সান্নিধ্য হয় তবে আমি সত্যিই খুব ভাল অনুভব করি না। @ পিটারের গুচ্ছ গঠনের ধারণাটি যা নীচে নেমে গেছে, মনে হচ্ছে এটি সঠিক ধারণা দেওয়া উচিত বলে ধরে নেওয়া যে এগুলি কোনও বিনের মধ্যে সমানভাবে তৈরি হওয়ার সম্ভাবনা রয়েছে।
জো ফিটজসিমনস

@ জো: শীর্ষস্থানীয় বেশিরভাগ বল প্রায় 1/3 ক্ষেত্রে বিচ্ছিন্ন থাকবে। শীর্ষ 3 বল বিবেচনা করুন। মধ্যমটিকে যদি প্রথম বাছাই করা হয় (সেই 3 টির মধ্যে) এটি তৃতীয়টিতে যোগ দেবে। এই দুটি, তারপরে, শীর্ষ বলের চেয়ে দ্বিগুণ দ্রুত সরে যাবে। তাদের এবং শীর্ষ বলের মধ্যকার দূরত্বটি একটি ভারী পক্ষপাতযুক্ত এলোমেলো পদক্ষেপ এবং শীর্ষ বলটি ধরার সম্ভাবনাটি একটি ছোট (ইশ) ধ্রুবক দ্বারা আবদ্ধ হয় (মোটামুটি অনুমান 15%)। তবে সুসংবাদটি হ'ল উপরের লগ এন বলগুলিতে কোনও বিষয় হওয়া উচিত নয়। যদি সমস্ত কিছু n \ লগ এন পদক্ষেপে সাফ হয়ে যায় তবে তারা কেবলমাত্র অতিরিক্ত n \ লগ এন পদক্ষেপ যুক্ত করবে।
ম্যাথিয়াস

এখানে দুটি প্লট দেওয়া আছে। উভয়ই দ্বারা বিভক্ত পদক্ষেপের সংখ্যা দেখায় , যতক্ষণ না লগ এন বলগুলি সাফ হয়ে যায়। প্রথমটির জন্য, সিস্টেমটি বাদ দেওয়া বলগুলি এখনও বাছাই করা যায় (যেমন আন্দ্রে প্রস্তাবিত এটি): tinyurl.com/2wg7a9y । দ্বিতীয়টির জন্য, সিস্টেমগুলি বাদ দেওয়া বলগুলি আর নেওয়া হয় না: tinyurl.com/33b63pq । আপনি দেখতে পাচ্ছেন যে প্রথম প্রক্রিয়াটি যে প্রান্তটি দিতে পারে তা সম্ভবত খুব দুর্বল। হতে পারে পর্যায়ক্রমে (পিটারের মতো কোথাও লিখেছেন) বিবেচনা করে এটি টিউন করা যেতে পারে যেখানে আমরা সবসময় সিস্টেমে বলের সংখ্যা অর্ধেক রেখেছি? nlogn
ম্যাথিয়াস

@ মাথিয়াস: পিটারের স্বজ্ঞাততাটি সঠিক বলে ধরে নিয়ে প্রত্যাশিত সময়ের বিশ্লেষণ করা কোনও সড়ক ব্লক নয় (অন্তত আমার দৃষ্টিকোণ থেকে)। আমার কাছে প্রমাণ করার জন্য যে এই অন্তর্দৃষ্টিটি বাস্তবে যা ঘটে তার একটি সুস্পষ্ট প্রতিচ্ছবি এটি প্রথমে প্রয়োজনীয়, যদিও আমি সন্দেহ করি এটি একটি ভাল আনুমানিকতা is
জো ফিটজসিমনস

9

সম্পাদনা করুন: আমি এই উত্তরটি এখনই (ততক্ষণে) উপপাদাগুলি প্রমাণ করার অগোছালো প্রক্রিয়াটি প্রকাশের জন্য প্রকাশ করছি, যা প্রকাশিত কাগজপত্রের বাইরে রয়েছে। এখানে মূল স্বীকৃতিটি হ'ল এটি উপরের বলের দিকে মনোনিবেশ করার জন্য যথেষ্ট, কারণ এটি নীচে সমস্তটি সরিয়ে ফেলে। দয়া করে মন্তব্যগুলি দেখুন (বিশেষত @ মিশেল নির্দেশ করছেন যে ফাঁকগুলি দেখা দিতে পারে) এবং @ জো এর পরবর্তী উত্তর কীভাবে ত্রুটিগুলি চিহ্নিত করা হয়েছে এবং সংশোধন করা হয়েছিল। আমি বিশেষত জো সূত্রগুলি বোধগম্য ছিল কিনা ডাবল-পরীক্ষা করতে পরীক্ষার জন্য ব্যবহার পছন্দ করি।


n(1+π2/6)n

b1b2bnb1=nb2n1bini+1b1b2bn1,2,,n)। এগুলি একের পর এক পৃথক ইভেন্ট হিসাবে দেখা যেতে পারে। পদক্ষেপের প্রত্যাশিত সংখ্যাটি তখন

n+p=1nk=0k+1n(npn)k=n+p=1n11npk=1k(npn)k=n+p=1n11npn(np)/p2=n+np=1n11/p2(1+π2/6)n.


3
@Andras @Joe: Holy schmoley. If all the people asking the questions on this site took their questions as seriously as you take answering them, this would be the badassest url on the internet.
Aaron Sterling

1
@András: I'm trying to understand your statement "a sequence of balls will clear all the bins precisely if it contains a subsequence...". Maybe I've misunderstood something, but say we have four balls. If the sequence is 3,4,3,2,4 then it seems to satisfy your subsequence requirement, yet not all the bins have been cleared.
Michael

1
@András: If you want to show a reasonable upper bound, you have to use the fact that balls disappear from the process and are no longer picked. Otherwise, the top most ball is always only picked with probability 1/n and there is a good chance (maybe slightly less than 1/2) that this ball will stay isolated the whole time. For this ball, you will need n^2 steps.
Matthias

1
@Michael: I think you have identified the mistake. I'm assuming falsely that the top ball will move down even if there is a gap.
András Salamon

2
Here's my intuition. After a few steps, some clump of balls is going to be larger than any other clump of balls. At this point, the clump moves faster than everything else, clears everything below it and falls out of the system. This whole process should take O(n) or maybe O(nlogn) steps. This first clump is uniformly distributed in the line, so on average it takes half the balls with it. Now, we're left with a system of around n/2 balls, and another clump forms. So after around logn clumps, we're done.
Peter Shor
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.