প্রত্যাখ্যান কি এলোমেলো সংখ্যার সত্যই অভিন্ন বিতরণ পাওয়ার একমাত্র উপায় নমুনা?


21

মনে করুন আমাদের কাছে একটি এলোমেলো জেনারেটর রয়েছে যা ইউনিফর্ম বিতরণ সহ এর পরিসরে সংখ্যাগুলি বের করে দেয় এবং অভিন্ন বিতরণ সহ আমাদের পরিসরে এলোমেলো সংখ্যা উত্পন্ন করতে হবে ।[0..R1][0..N1]

মনে করুন যে আর সমানভাবে ভাগ করে না ; সত্যিকারের অভিন্ন বিতরণ পেতে আমরা প্রত্যাখ্যানের নমুনা পদ্ধতিটি ব্যবহার করতে পারি :N<RNR

  • যদি সবচেয়ে বড় পূর্ণসংখ্য যেমনkkN<R
  • একটি র্যান্ডম সংখ্যা বাছাই মধ্যেr[0..R1]
  • যদি তবে আউটপুট আর \ মোড এন , অন্যথায় অন্য এলোমেলো সংখ্যার সাথে চেষ্টা করুন r ', আর ", ... শর্তটি পূরণ না হওয়া অবধিr<kNrmodN
প্রত্যাখ্যান কি সত্যিকারের অভিন্ন বিলি বিতরণ পাওয়ার একমাত্র উপায় নমুনা?

উত্তর যদি হ্যাঁ হয় তবে কেন?

নোট: যদি N>R ধারণা একই হল: একটি র্যান্ডম সংখ্যা উৎপন্ন r মধ্যে [0..Rm1],Rm>=N , উদাহরণস্বরূপ r=R(...R(Rr1+r2)...)+rm যেখানে ri একটি সীমার মধ্যে একটি এলোমেলো সংখ্যা [0..R1]


উত্তর:


13

হ্যাঁ এবং না, "একমাত্র উপায়" দ্বারা আপনি কী বোঝাতে চান তার উপর নির্ভর করে। হ্যাঁ, এতে কোনও পদ্ধতি নেই যা বন্ধ করার গ্যারান্টিযুক্ত, আপনি সবচেয়ে ভাল করতে পারেন ( এবং এর জেনেরিক মানগুলির জন্য ) একটি অ্যালগরিদম যা সম্ভাবনার সাথে সমাপ্ত হয় 1. না, আপনি "বর্জ্য" কে ছোট হিসাবে তৈরি করতে পারেন আপনার ইচ্ছা.আরNR

গ্যারান্টিযুক্ত সমাপ্তি কেন সাধারণভাবে অসম্ভব

মনে করুন যে আপনার কাছে একটি ডিটারমিনিস্টিক কম্পিউটেশন ইঞ্জিন (একটি ট্যুরিং মেশিন বা আপনার নৌকা যা ভাসিয়ে দেয়), এবং এমন একটি ওরাকল যা এলিমেন্ট সেটের র্যান্ডম উপাদান তৈরি করে । আপনার লক্ষ্যটি হ'ল এলিমেন্ট সেট একটি উপাদান তৈরি করা । আপনার ইঞ্জিনের আউটপুট কেবল ওরাকল দ্বারা ফিরে আসা মানগুলির ক্রমের উপর নির্ভর করে; এটা একটি ফাংশন যা সম্ভাব্য অসীম ক্রম ।[ 0 .. আর - 1 ] এন [ 0 , এন - 1 ] ( 0 , আর 1 , আর 2 , )R[0..R1]N[0,N1]f(r0,r1,r2,)

মনে করুন যে আপনার ইঞ্জিন বেশিরভাগ সময়ে ওরাকলকে কল করে । এমন ট্রেস থাকতে পারে যার জন্য ওরাকলকে চেয়েও কম বার বলা হয় ; যদি তাই হয় তবে ওরাকলকে অতিরিক্ত বার কল করা যাতে একেবারে ঠিক টাইম বলা হয় আউটপুট পরিবর্তন হয় না। সুতরাং সাধারণতার ক্ষতি ছাড়াই, আমরা ধরে নিই যে ওরাকলকে ঠিক টাইম বলা হয় । তারপরে ফলাফল এর সম্ভাবনা হ'ল ক্রমের সংখ্যা যেমন । যেহেতু ওরাকলটি অভিন্ন র্যান্ডম জেনারেটর, তাই প্রতিটি অনুক্রমটি সমৃদ্ধযোগ্য এবং সম্ভাব্যতা । সুতরাং প্রতিটি ফলাফলের সম্ভাবনা রূপে formএম এম এম এক্স ( আরবি 0 , mmmmx( 0 , ... , মি - 1 ) = এক্স 1 / আর মি একটি / আর মি একজন 0 আর মি(r0,,rm1)f(r0,,rm1)=x1/RmA/Rmযেখানে হল এবং মধ্যে পূর্ণসংখ্যা ।A0Rm

তাহলে ভাগ কিছু , তারপর তোমাদের উপর একটি অভিন্ন বন্টন তৈরি করতে পারেন র্যান্ডম জেনারেটর কল করে উপাদানের বার (এই পাঠক একটি ব্যায়াম যেমন ছেড়ে দেওয়া হয়)। অন্যথায়, এটি অসম্ভব: সম্ভাব্যতা সহ ফলাফল পাওয়ার কোনও উপায় নেই । উল্লেখ্য যে শর্তটি এর সমস্ত প্রধান কারণগুলিও কারণ হিসাবে সমান (এটি আপনার প্রশ্নে যা লিখেছিল তার চেয়ে এটি আরও অনুমোদিত; উদাহরণস্বরূপ আপনি 6 টি পক্ষের মেলা দিয়ে 4 এর মধ্যে একটি এলোমেলো উপাদান বেছে নিতে পারেন মর, যদিও 4 ভাগ করে না 6)।আর এম এম এন এম 1 / এন এন আরNRmmNm1/NNR

বর্জ্য হ্রাস

আপনার কৌশলে, যখন , তখন আপনাকে তত্ক্ষণাত পুনরায় আঁকতে হবে না। স্বজ্ঞাতভাবে, কিছুটা এনট্রপি বাকি আছে যা আপনি মিশ্রণটিতে রাখতে পারেন।[ কেrkN[kN..R1]

একটি মুহূর্ত যে আপনার আসলে নিচের র্যান্ডম সংখ্যা উৎপাদিত হবে জন্য অনুমান চিরকাল, এবং আপনি জেনারেট করে একটি সময়ে তাদের স্বপক্ষে। আপনি এই দলবদ্ধ প্রজন্ম একটি সহজবোধ্য প্রত্যাখ্যান স্যাম্পলিং করেন তাহলে, ওভার বর্জ্য স্বপক্ষে হয় অর্থাৎ বাকি অঙ্কনের সংখ্যা দ্বারা বিভক্ত। এটি কম হতে পারে । যখন এবং কপিরাইম হয় তখন আপনি যথেষ্ট পরিমাণে বড় মান বাছাই করে বর্জ্যটিকে নির্বিচারে ছোট করতে পারেন । ও এর সাধারণ মানগুলির জন্যইউ ডি ডি আর ডি - কেNudd আরডিএমডিRdkNud GCD ( আর , এন ) আর এন আর এন GCD ( আর , এন ) এন / GCD ( আর , এন )RdmodNugcd(R,N)RNdRN, গণনাটি আরও জটিল কারণ আপনার আলাদাভাবে এবং প্রজন্মকে বিবেচনায় নেওয়া দরকার তবে আবার আপনি যথেষ্ট পরিমাণে বৃহত গোষ্ঠীগুলির সাথে বর্জ্যটিকে নির্বিচারে ছোট করতে পারেন।gcd(R,N)N/gcd(R,N)

অনুশীলনে, এমনকি তুলনামূলকভাবে অক্ষম এলোমেলো সংখ্যার (যেমন ক্রিপ্টোগ্রাফিতে), এটি চেয়ে ছোট না হলে সাধারণ প্রত্যাখ্যানের নমুনা ব্যতীত খুব কমই করা উপযুক্ত । উদাহরণস্বরূপ, ক্রিপ্টোগ্রাফিতে, যেখানে 2 সাধারণত 2 এবং শক্তি হয় শত শত বা হাজার হাজার বিট, অভিন্ন র্যান্ডম সংখ্যার উত্পাদন সাধারণত পছন্দসই পরিসরে সরাসরি প্রত্যাখ্যানের নমুনা দ্বারা এগিয়ে যায়।আরNRN


প্রথম প্রমাণটি ত্রুটিযুক্ত: অস্তিত্ব খুব শক্তিশালী। আমাদের কাছে এমন একটি মেশিন থাকতে পারে যা নির্বিচারে অনেকগুলি উপাদান খায় তবে সর্বদা শেষ হয়। মূলত, আমরা একটি ক্রম বাদ দিতে চাই (কখনই শেষ নয়) তবে আপনি চূড়ান্তভাবে অনেকগুলি বাদ দেন। m
রাফেল

@ রাফেল আমি নিশ্চিত না যে আপনি কী বলতে চাইছেন তা আমি বুঝতে পেরেছি। আপনি যেমন একটি মেশিন একটি উদাহরণ দিতে পারেন?
গিলস 9'17 এ '

আহ, আমার উদ্বেগ খুব সাধারণ ছিল। এখানে - ইনপুটটির অনুপস্থিতিতে দেওয়া - আপনি ঠিক বলেছেন। সমস্ত গণনা বন্ধ হয়ে গেলে, চূড়ান্তভাবে অনেকগুলি থাকে (কোনও পদক্ষেপ অনুসারে কোনও ইনপুট, সীমাবদ্ধ সংখ্যার সিদ্ধান্ত নেই, একটি সসীম গাছের অস্তিত্ব থাকে), তাই এখানে দীর্ঘতম যা আপনাকে । m
রাফেল

@ রাফেল আপনার মন্তব্য আমাকে টিসিএস দর্শকদের জন্য আরও ভাল উপস্থাপনা সম্পর্কে ভাবতে বাধ্য করেছে: আরএনজিটিকে ওরাকেলের পরিবর্তে টিএম এর ইনপুট করুন। আমরা ধরে নিই যে টিএম সমাপ্ত হয় (অন্যথায় অ্যালগোরিদম ভুল হয়)। যদি কোনও যেমন থাকে যে ইনপুটটি যাই হোক না কেন, টিএম বেশিরভাগ ইনপুট কোষগুলিকে দেখেন , তবে <ব্লাহ ব্লাহ বিভাজ্যভাবে ব্লাহ দ্বারা সম্যক ফলাফল হতে পারে না >। তা না হলে, সব জন্য , অন্তত প্রয়োজন সম্ভাব্যতা স্বপক্ষে অন্তত হয় । মি আর মি এন এম এমmmRmNmmRm
গিলস 'এস-অশুভ হওয়া বন্ধ করুন'

1
@ রাফেল: কনিগের লেমা দেখায় যে মেশিনটি সর্বদা বন্ধ হয়ে যায়, তবে বাস্তবে এটি চলমান সময় উপরের দিকে আবদ্ধ থাকে। এটি যতক্ষণ না আরএনজির আউটপুট সেট সীমাবদ্ধ (এবং অন্যথায় এটি তুচ্ছ মিথ্যা) কাজ করে।
যুবাল ফিল্মাস

6

শ্যাননের উত্স কোডিং উপপাদ্যটি দেখায় যে, কিছুটা সঠিক অর্থে, টাইপের একটি এলোমেলো সংখ্যা তৈরি করতে আপনার টাইপের average নমুনাগুলি প্রয়োজন ( । আরও সঠিকভাবে, শ্যানন একটি (অদক্ষ) আলগোরিদিম দেয় যা প্রথম ধরণের নমুনা দেয় , উচ্চতর সম্ভাবনা সহ দ্বিতীয় প্রকারের নমুনা দেয়। তিনি আরও দেখান যে উচ্চ সম্ভাবনার সাথে নমুনাগুলি অসম্ভব।[ 0 , ... , আর - 1 ] [ 0 , ... , এন - 1 ] মি মি ( লগ ইন করুন এন / লগ ইন করুন আর - ε ) মি ( লগ ইন করুন এন / লগ ইন করুন আর + + ε )logN/logR[0,,R1][0,,N1]mm(logN/logRϵ)m(logN/logR+ϵ)

শ্যাননের উপপাদ্যটি স্কিউড ইনপুট বিতরণের আরও সাধারণ ক্ষেত্রেও কাজ করে (এবং সম্ভবত আউটপুট বিতরণও বদ্ধ হয়)। সেক্ষেত্রে আপনাকে এন্ট্রপি দিয়ে লগারিদম প্রতিস্থাপন করতে হবে। যদিও উপপাদ্য দ্বারা প্রদত্ত অ্যালগরিদম এলোমেলোভাবে সংজ্ঞায়িত করা হয়েছে, কিছু ক্ষেত্রে এটির কিছুটা খারাপ করা (কিছুটা খারাপ পারফরম্যান্সের বিনিময়ে) ড্যারানডমাইজ করা সম্ভব।


5

আসলে, না, প্রত্যাখ্যানের নমুনা এগিয়ে যাওয়ার একমাত্র উপায় থেকে দূরে। দুর্ভাগ্যবশত, বিবেচনা করা যা কম্পিউটারের বিট হিসাবে সব তথ্য সংরক্ষণ, এবং এইভাবে শুধুমাত্র তথ্য র্যান্ডম বিট নিপূণভাবে করতে পারেন পরিসীমা একটি অভিন্ন দৈব চলক আঁকা কোনো অ্যালগরিদম , অসীম হতে হবে যদি এর বাইনারি বেস গঠন অসীম।এনNN

এই উপপাদ্যটি নুথ এবং ইয়াও (১৯ 1976) এর একটি শাস্ত্রীয় ফলাফল, যিনি ডিডিজি-ট্রিগুলির কাঠামো তৈরি করেছেন (গাছ বিতরণকারী গাছগুলি) the

গিলস দ্বারা উদ্ঘাটিিত পদ্ধতিগুলি হ'ল সাধারণ ধরণের জিনিস যা প্রত্যাখ্যানের ফলে সৃষ্ট বর্জ্য প্রশমনের জন্য করা হয়েছে, তবে অবশ্যই যদি নূথ এবং ইয়াওর গাছগুলি নিম্নলিখিত উত্পন্ন করতে পারে তবে এটি অনেক বেশি কার্যকর - গড় on৯% এলোমেলো বিট of সংরক্ষিত হয়

আমি নিম্নলিখিত CStheory পোস্টে এই সম্পর্কে আরও তথ্য দিয়েছি

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.