নির্লিপ্ত ঘোলাফেরা কতটা দূষিত?


33

এটি সুপরিচিত যে, এলোমেলোভাবে বেছে নেওয়া অন্য একটির সাথে প্রতিটি আইটেম অদলবদল করে অ্যারে পরিবর্তন করার জন্য এই 'নিষ্পাপ' অ্যালগরিদমটি সঠিকভাবে কাজ করে না:

for (i=0..n-1)
  swap(A[i], A[random(n)]);

বিশেষত, যেহেতু প্রতিটি পুনরাবৃত্তির সময় পছন্দ করা হয় (অভিন্ন সম্ভাবনার সাথে), সেখানে গণনার মাধ্যমে possible সম্ভাব্য 'পাথ' রয়েছে; কারণ সম্ভাব্য ক্রম সংখ্যাপাথের সংখ্যায় সমানভাবে বিভক্ত হয় না , এই অ্যালগরিদমের পক্ষে প্রতিটি তৈরি করা অসম্ভবসমান সম্ভাবনা সহ ক্রম। (পরিবর্তে, একজনকে তথাকথিত ফিশার-ইয়েটস শ্যাফেল ব্যবহার করা উচিত , যা [i..n) থেকে এলোমেলো নম্বর বেছে নেওয়ার জন্য কল দিয়ে [0..n) থেকে একটি র্যান্ডম নম্বর চয়ন করার জন্য কলটি পরিবর্তন করে; এটা আমার প্রশ্নের মূল বিষয়, যদিও।)nnnnn!nnn!

আমি যা ভাবছি তা হল, নিষ্পাপ বদলানো কীভাবে 'খারাপ' হতে পারে? আরও সুনির্দিষ্টভাবে, কে সমস্ত অনুক্রমের সেট হতে দেওয়া এবং নামক অ্যালগরিদমের মাধ্যমে যে পথগুলি এর ফলস্বরূপ ক্রমান্বন produce produce উত্পাদন করে তার সংখ্যা সংখ্যা হতে দেয় , এর asyptotic আচরণ কী? ক্রিয়াকলাপP(n)C(ρ)ρP(n)

M(n)=n!nnmaxρP(n)C(ρ)

এবং

m(n)=n!nnminρP(n)C(ρ) ?

নেতৃস্থানীয় কারণটি হ'ল এই মানগুলিকে 'স্বাভাবিককরণ': যদি ভঙ্গুর বদল যদি 'অ্যাসেম্পোটোটিক্যালি ভাল' হয় তবে

limnM(n)=limnm(n)=1

আমি সন্দেহ যে প্রকৃত মান 1 থেকে দূরে বেষ্টিত করা হয় (কিছু কম্পিউটার সিমিউলেশন আমি দেখেছি উপর ভিত্তি করে), কিন্তু এটা এমনকি পরিচিত হয় যদি limM(n) সসীম থাকে বা যদি limm(n) থেকে দূরে বেষ্টিত 0? এই পরিমাণের আচরণ সম্পর্কে কী জানা যায়?


8
দুর্দান্ত প্রশ্ন। আমি জানি না এই প্রশ্নের সেরা জায়গাটি কোথায়? এটির জন্য অন্য ফোরামটি আরও ভাল বলে মনে হচ্ছে না, আপনি আমার মনে হয় আপনার এটি এখানে এক সপ্তাহ বা আরও বেশি সময়ের জন্য ছেড়ে দেওয়া উচিত এবং যদি আপনি সন্তোষজনক উত্তর না পান তবে অন্য ফোরামে যেকোন একটিতে এটি জিজ্ঞাসা করুন (এবং উভয় প্রশ্নের লিঙ্ক রেখে দিন) )।
পিটার শর

4
@vzn "জ্ঞাত ত্রুটিযুক্ত অ্যালগরিদম সম্পর্কে কেন কঠোর বিশ্লেষণ করা যায়?" কারণ গণিত হয় আকর্ষণীয়, এবং আপনি কোথায় অন্যান্য অ্যাপ্লিকেশনের দেখা দিতে পারে না - Knuth এর উদাহরণস্বরূপ সাজান বাবল বিশ্লেষণ, দেখুন। অ্যাটউডের চার্টগুলি সংশ্লেষের একটি মোটামুটি গুণগত বিশ্লেষণ দেয়, তবে এটি গাণিতিক পরিমাণগত বিশ্লেষণের থেকে অনেক দূরে cry (এবং ফিশার-ইয়েটস
বদলের

4
রেকর্ডের জন্য, OEIS ক্রম A192053 সর্বাধিক ho এবং একটি বদ্ধ ফর্মটি তালিকাভুক্ত করে না। এছাড়াও, এই প্রবেশের নোটগুলি সূচিত করে যে ন্যূনতম be হতে পারে , যা বোঝায় । সি ( ρ ) 2 এন - 1 মি ( এন ) 0C(ρ)C(ρ)2n1m(n)0
mhum

2
@vzn খোলামেলা প্রশ্নে সমস্যা কি?
যুবাল ফিল্মাস

1
আপনার শেষ বাক্যটিতে @vzn দ্বিমত পোষণ করুন, "অপূর্ণ" রদবদলের বিশ্লেষণ অনেক আছে। উদাহরণের জন্য, যদি আমরা র্যান্ডম transpositions করতে, এটা জানা যায় যদৃচ্ছতা প্রারম্ভিক মান মোটামুটিভাবে হয় । বর্তমান প্রশ্নটি কঠিন হতে পারে, তবে এটি একটি "খুব কঠিন" কিনা তা বলা শক্ত। মুহমের মতো উত্তর ইতিমধ্যে অত্যন্ত সন্তোষজনক, এটি দেখায় যে প্রশ্নটি ফোরামের জন্য উপযুক্ত ছিল এবং কোনও দুর্গম বাধা উপস্থাপন করেনি (আনুষ্ঠানিক প্রমাণগুলি আলাদা করে দেওয়া হয়েছে)। (1/2)nlogn
যুবাল ফিল্মাস

উত্তর:


13

আমরা আনয়ন দ্বারা দেখাব যে বিন্যাস সঙ্গে একটি উদাহরণ । এই সবচেয়ে খারাপ ক্ষেত্রে হয়, তাহলে যেমন প্রথম কয়েক জন্য (জন্য নোট দেখতে OEIS ক্রম A192053 , তারপর) । সুতরাং নর্মালাইজড মিনিট, নরমালাইজড ম্যাক্সের মতো 'এক্সপেনশনালি খারাপ'।সি ( ρ n ) = 2 এন - 1 এনρn=(2,3,4,,n,1)C(ρn)=2n1nm(n)(2/e)n

বেস কেস সহজ। আনয়ন পদক্ষেপের জন্য, আমাদের একটি লেমা দরকার:

থিম: থেকে কোন পথে থেকে , হয় প্রথম পদক্ষেপ অদলবদল অবস্থানের এবং , অথবা শেষ পদক্ষেপ অদলবদল অবস্থানের এবং ।( 1 , 2 , 3 ,(2,3,4,,n,1)1 এন 1 এন(1,2,3,,n)1n1n

প্রুফ স্কেচ: ধরুন না। প্রথম পদক্ষেপটি বিবেচনা করুন যাতে 'র অবস্থানটি জড়িত । ধরে নিন যে এটি 'পদক্ষেপ', এবং । এই পদক্ষেপটি আইটেমটি স্থান আবশ্যক মধ্যে 'ম স্থান। এবার আইটেম স্পর্শ করা পরবর্তী পদক্ষেপটি বিবেচনা করুন । এই পরিবর্তনের ধরে হয় 'ম পদক্ষেপ। এই পদক্ষেপটি অদলবদল আবশ্যক এবং আইটেম সরালে, মধ্যে , 'ম স্থান । অনুরূপ যুক্তি বলছে যে আইটেম পরে কেবলমাত্র ডান দিকে সরানো যেতে পারে। তবে আইটেমi i 1 i n 1 i 1 j i j 1 j i < j 1 1 nii1in1i1jij1ji<j11প্রথম স্থানে শেষ হওয়া দরকার, একটি দ্বন্দ্ব।

এখন, যদি প্রথম পদক্ষেপ অদলবদল অবস্থানের এবং , অবশিষ্ট প্যাচসমূহ বিন্যাস নিতে হবে থেকে । যদি বাকী পদক্ষেপগুলি প্রথম অবস্থানে স্পর্শ না করে, তবে এটি পজিশনে , এবং আমরা আনয়ন দ্বারা জানি যে সেখানে পাথগুলি এটি করে। লেমার প্রমাণের অনুরূপ একটি যুক্তি বলছে যে প্রথম অবস্থানের স্পর্শ করার মতো কোনও পথ নেই, কারণ আইটেম পরে অবশ্যই ভুল অবস্থানে শেষ হওয়া উচিত।এন ( 1 , 3 , 4 , 5 , , এন , 2 ) ( 1 , 2 , 3 , 4 , , এন ) ρ n - 1 2 n1n(1,3,4,5,,n,2)(1,2,3,4,,n)ρn12n 1C(ρn1)=2n21

যদি শেষ পদক্ষেপটি এবং এর অবস্থানগুলি অদলবদল করে , প্রথম পদক্ষেপগুলি অবশ্যই ক্রমান্বয়ে । আবার, যদি এই পদক্ষেপগুলি সর্বশেষ অবস্থানে স্পর্শ না করে, তবে এটি হ'ল , এবং প্রবর্তনের মাধ্যমে পাথ রয়েছে এটা এটা। এবং আবারও, যদি এখানে প্রথম এর মধ্যে একটি চূড়ান্ত অবস্থানটি স্পর্শ করে তবে আইটেম কখনই সঠিক জায়গায় শেষ হতে পারে না।এন এন - 1 ( 2 , 3 , 4 , , এন , 1 ) ( এন , 2 , 3 , 4 , , এন - 1 , 1 ) ρ n - 1 সে ( ρ n -1nn1(2,3,4,,n,1)(n,2,3,4,,n1,1)ρn1 এন-11C(ρn1)=2n2n11

সুতরাং, ।C(ρn)=2C(ρn1)=2n1


নিখুঁত - লেমার পিছনে যুক্তিটি দেখতে অনেকটা দেখতে যেমন আমার কাছে জড়িত থাকার কারণে সনাক্তকরণের একমাত্র উপায় হ'ল এটির মতো দেখায়, তবে আমি স্পষ্টত অদলবদলে পুনরাবৃত্ত কাঠামোটি মিস করেছি। ধন্যবাদ!
স্টিভেন স্টাডনিকি

10

ওয়েস-এর কাছে মুহমের নির্দেশককে কিছুটা আবিষ্কার করার পরে, আমি অবশেষে একটি দুর্দান্ত বিশ্লেষণ এবং একটি সুন্দর (অপেক্ষাকৃত) প্রাথমিক যুক্তি খুঁজে পেয়েছি (কারণ, যতদূর আমি বলতে পারি, গোল্ডস্টেইন এবং মিউস [১]) এর কাছে দ্রুতগতিতে দ্রুত বৃদ্ধি পায় :এনM(n)n

কোন উদ্ঘাতন এর 'সরল' অদলবদল অ্যালগরিদম যে তার ফলে পরিচয় বিন্যাস উৎপন্ন একটি রান অনুরূপ, যেহেতু অ্যালগরিদম অদলবদল হবে সঙ্গে এবং পরবর্তীকালে swap 'র সঙ্গে উভয় অপরিবর্তিত রেখে। এর অর্থ হল যে অ্যালগোরিদমের রানের সংখ্যা যা সনাক্তকরণের অনুমতি দেয় কমপক্ষে অন্তর্ভুক্তির সংখ্যা (আসলে, একটি সামান্য চিন্তাভাব দেখায় যে চিঠিপত্রটি 1-1 এবং তাই এটি ঠিক ) , এবং তাই এ সর্বাধিক দ্বারা নীচে থেকে আবদ্ধ হয় ।{ 1 n } k ι ( কে ) ι ( কে ) কে কিউ ( এন ) প্রশ্ন ( এন ) এম ( এন ) প্রশ্ন ( এন )ι{1n}kι(k)ι(k)kQ(n)Q(n)M(n)Q(n)

প্রশ্ন ( এন ) সি ( এন )Q(n) দৃশ্যত সহ নামের একটি নম্বর, দ্বারা যায় টেলিফোন নম্বর : দেখুন http://oeis.org/A000085 এবং http://en.wikipedia.org/wiki/Telephone_number_%28mathematics%29 । অ্যাসিম্পটিকগুলি সুপরিচিত, এবং এটি প্রমাণিত হয়েছে যে ; পুনরাবৃত্ত সম্পর্ক এটি inductively দেখানো যেতে পারে যে অনুপাত সন্তুষ্ট এবং সেখান থেকে মৌলিক বিশ্লেষণ অ্যাসিপটিক্সে অগ্রণী পদ পায়, যদিও অন্যটি শর্তাদির জন্য আরও সতর্ক প্রচেষ্টা প্রয়োজন। যেহেতু 'স্কেল ফ্যাক্টর' Q(n)=Q(n-1)+(n-1)Q(n-2)R(n)=Q(n)Q(n)C(ne)n/2enQ(n)=Q(n1)+(n1)Q(n2)R(n)=Q(n)Q(n1) এন এন / 2 এন !n<R(n)<n+1nn/2 এম(এন)সিn!nn এর সংজ্ঞা অনুসারে কেবল , শীর্ষস্থানীয় শব্দটি প্রাধান্য দেয় এবং ফলন দেয় (asyptotically)।M(n) কিউ(এন)এম(এন)সিএন ( এন + 1 ) / 2 - 3 এন / 2 + CnenQ(n)M(n)Cn(n+1)/2e3n/2+n

উপর গোল্ডস্টাইন এবং Moews আসলে বারেই [1] সম্ভবত বৃহৎ যে পরিচয় বিন্যাস করা হয় দেখানোর জন্য , তাই আসলে একটি হয় এবং আচরণকে সম্পূর্ণরূপে বসতি স্থাপন করা হয়। এটি এখনও এর আচরণের প্রশ্নটি উন্মুক্ত করে; এটি যদি তাদের গবেষণাপত্রের বিশ্লেষণেও আসে তবে আমি খুব আশ্চর্য হব না, তবে তাদের পদ্ধতিগুলিতে সত্যই আঁকড়ে ধরার পক্ষে এখনও এটিকে ঘনিষ্ঠভাবে পড়ার সুযোগ আমি পাইনি, কেবলমাত্র প্রাথমিক ফলাফলটি ছাঁটাই করার পক্ষে যথেষ্ট।এম ( এন ) এম ( এন )nM(n)m(n)

[১] গোল্ডস্টেইন, ডি এবং মিউস, ডি: "পরিচিতিটি সম্ভবত বৃহত্তর এনগুলির জন্য বিনিময় রদবদল ", http://arxiv.org/abs/math/0010066


1
এটা তোলে দেখাতে হবে যে বিন্যাস খুব কঠিন না সঙ্গে একটি উদাহরণ । যদি এটি সবচেয়ে খারাপ ক্ষেত্রে হয় যেমন এটি প্রথম কয়েকটি জন্য হয় তবে । সি ( ρ ) = 2 এন - 1 এন মি ( এন ) ( 2 /) এন(2,3,4,,n,1)C(ρ)=2n1nm(n)(2/e)n
পিটার শোর

@ পিটারশোর আপনি কি প্রাথমিক যুক্তি দিতে পারবেন? আমার মনে হচ্ছে আমি জড়িত যুক্তিগুলির কিছু সহজ সংস্করণ অনুপস্থিত যা কাজ করবে তবে আমি এটি বেশিরভাগেই পাচ্ছি না। আমি মনে করি এমনকি যদি এটি ন্যূনতম না হয় তবে এটি যথেষ্ট ভাল হবে; ন্যূনতম গণনাটি মধ্যে সাফল্যজনক হওয়ার সম্ভাবনা কম বলে মনে হচ্ছে এবং সাধারণ জেনে রাখা সর্বোচ্চ এবং ন্যূনতম উভয়ই 'তাত্পর্যপূর্ণভাবে খারাপ' খুব সুন্দর সন্তোষজনক উত্তর। n
স্টিভেন স্টাডনিকি

আমি যুক্তি সহ একটি উত্তর যুক্ত করেছি ... একটি মন্তব্যের জন্য এটি অনেক দীর্ঘ।
পিটার শর
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.