নকল ইউনিফর্ম এলোমেলো সংখ্যা: সত্য ইউনিফর্ম ডেটার চেয়ে আরও সমানভাবে বিতরণ


43

আমি এলোমেলো সংখ্যার উত্পন্ন করার জন্য একটি উপায় খুঁজছি যা ইউনিফর্ম বিতরণ হিসাবে প্রদর্শিত হবে - এবং প্রতিটি পরীক্ষা তাদের অভিন্ন হিসাবে দেখায় - এগুলি সত্য ইউনিফর্ম ডেটার চেয়ে আরও সমানভাবে বিতরণ করা হয়

"সত্য" ইউনিফর্ম র্যান্ডমগুলির সাথে আমার যে সমস্যাটি হ'ল তা হ'ল তারা মাঝে মধ্যে ক্লাস্টার করবে। এই প্রভাবটি কম নমুনা আকারে আরও শক্তিশালী। মোটামুটি বলেছিলেন: আমি যখন ইউ [0; 1] এ দুটি ইউনিফর্ম র্যান্ডম আঁকাম তখন সম্ভাবনা 10% হয় যে সেগুলি 0.1 এর পরিসরের মধ্যে থাকে এবং 1% যে তারা 0.01 এর মধ্যে থাকে।

সুতরাং আমি এলোমেলো সংখ্যাগুলি উত্পন্ন করার জন্য একটি ভাল উপায় খুঁজছি যা ইউনিফর্ম র্যান্ডমগুলির চেয়ে বেশি সমানভাবে বিতরণ করা হয়

কেস উদাহরণ ব্যবহার করুন: বলুন আমি একটি কম্পিউটার গেম করছি, এবং আমি কোনও মানচিত্রে এলোমেলোভাবে ধনটি রাখতে চাই (অন্য কোনও জিনিসের প্রতি যত্নশীল নয়)। আমি চাই না যে ধনটি সমস্ত এক জায়গায় থাকে, এটি সমস্ত মানচিত্রে হওয়া উচিত। অভিন্ন র্যান্ডম সহ, যদি আমি বলি, 10 টি বস্তু, তবে সম্ভাবনাগুলি এতটা কম নয় যে সেখানে 5 বা তাই একে অপরের খুব কাছেই রয়েছে। এটি একজন খেলোয়াড়কে অন্যের চেয়ে বেশি সুবিধা দিতে পারে। মাইনসুইপারের কথা চিন্তা করুন, সম্ভাবনাগুলি (যদিও কম খনিজ থাকলেও) আপনি সত্যিই ভাগ্যবান এবং একক ক্লিক দিয়ে জয়ী হন।

আমার সমস্যার জন্য খুব নির্দোষ পন্থা হ'ল গ্রিডে ডেটা বিভক্ত করা। যতক্ষণ না সংখ্যাটি যথেষ্ট বড় (এবং কারণগুলি রয়েছে), কেউ এইভাবে অতিরিক্ত অভিন্নতা প্রয়োগ করতে পারে। সুতরাং ইউ [0; 1] থেকে 12 টি এলোমেলো ভেরিয়েবলগুলি আঁকার পরিবর্তে আমি ইউ [0; .5] থেকে 6 এবং ইউ [0.5; 1] থেকে 6 বা ইউ [0; 1/3] + 4 আঁকতে পারি ইউ থেকে [1/3; 2/3] + 4 ইউ [2/3; 1]।

এই অতিরিক্ত সমতাটি ইউনিফর্মের মধ্যে পাওয়ার আরও ভাল কোনও উপায় আছে কি? এটি সম্ভবত ব্যাচের র্যান্ডমগুলির জন্য কাজ করে (যখন কোনও একক এলোমেলো আঁকানোর সময় অবশ্যই আমার পুরো ব্যাপ্তি বিবেচনা করতে হবে)। বিশেষত, আমি পরে রেকর্ডগুলি আবার বদলাতে পারি (সুতরাং এটি প্রথম তৃতীয় থেকে প্রথম চার নয়)।

এটি কীভাবে বাড়বে? প্রথমটি ইউ-তে রয়েছে [0; 1], তারপরে প্রতিটি অর্ধেক থেকে দুটি, তৃতীয় থেকে এক, চতুর্থ থেকে এক? এটি কি তদন্ত করা হয়েছে, এবং এটি কতটা ভাল? X এবং y এর জন্য আলাদা জেনারেটর ব্যবহার করে তাদের পারস্পরিক সম্পর্ক না রাখার জন্য আমাকে সতর্ক থাকতে হবে (প্রথম এক্সআই সর্বদা নীচের অর্ধেক হবে, দ্বিতীয় বাম অর্ধেক এবং তৃতীয় তৃতীয় অংশে, তৃতীয়টি তৃতীয় এবং শীর্ষে তৃতীয় হবে)। .. সুতরাং কমপক্ষে কিছু এলোমেলোভাবে বিন প্রমিটেশনও প্রয়োজন, এবং দীর্ঘকালীন সময়ে, এটি খুব বেশি হবে, আমার ধারণা।

পার্শ্ব নোড হিসাবে, কিছু বিতরণ সত্যই অভিন্ন হওয়ার জন্য খুব সমানভাবে বিতরণ করা হয়েছে কিনা তা কি একটি সুপরিচিত পরীক্ষা আছে ? সুতরাং "সত্য ইউনিফর্ম" বনাম "পরীক্ষা করে কেউ ডেটা নিয়ে গোলমাল করে এবং আইটেমগুলিকে আরও সমানভাবে বিতরণ করে"। আমি যদি সঠিকভাবে স্মরণ করি তবে হপকিনস স্ট্যাটিস্টিক এটি পরিমাপ করতে পারে তবে এটি কী পরীক্ষার জন্যও ব্যবহার করা যেতে পারে? এছাড়াও কিছুটা বিপরীত কেএস-টেস্ট: বৃহত্তম বিচ্যুতি যদি একটি নির্দিষ্ট প্রত্যাশিত প্রান্তিকের নীচে থাকে তবে ডেটা খুব সমানভাবে বিতরণ করা হয়?


7
আপনি কি হ্যাল্টন ক্রমগুলি শুনেছেন ? "খুব সমানভাবে" লোকেরা (মেন্ডেলের মটর পরীক্ষার ফলাফলের ফিশারের তদন্ত শুরু করে) (সাধারণ) চি-স্কোয়ার পরিসংখ্যানকে চি-স্কোয়ার ডিস্ট্রিবিউশনের নীচের লেজের দিকে উল্লেখ করেছেন।
হোবার

এটিকে আনুষ্ঠানিক করার এক উপায় একটি ডিস্ট্রিবিউশন যেমন (1) প্রান্তিককরণকে ওভার থেকে , (2) ) প্রতিসাম্যযুক্ত, অর্থাৎ এক্সচেঞ্জযোগ্য এবং (3) বড় হয় যখন বিচ্ছুরিত হয়। আমার মনে হয় (2) এবং (3) যেহেতু অসীম বিনিময়যোগ্য সিকোয়েন্স সাথে একটি বাস্তব সমস্যা নেতিবাচকভাবে সম্পর্কিত করা যাবে না, তাই বৃহত্তর আমরা কম বিকর্ষণ আমরা জোরদার করতে ব্যবহার করতে চান; অন্যদিকে, বৃহত্তর , আমাদের যাইহোক ভালভাবে ছড়িয়ে দেওয়া উচিত।( ) 1 এক্স 1 , , X এন - 1এক্স 1 , , এক্স এন জি ( এক্স 1 , , এক্স এন ) x 1 , , এক্স এন আর এনn)g(x1,...,xn)g()1x1,...,xn1gX1,...,Xng(x1,...,xn)x1,...,xnRnn
লোক

আমি যে পদ্ধতির কথা ভাবছিলাম তার খুব কাছে হ্যালটন সিকোয়েন্সগুলি। পারস্পরিক সম্পর্কের ঝুঁকি হ্রাস করতে প্রথম কয়েকটি এন্ট্রি এড়িয়ে যাওয়া সহ। আমি প্রতিটি স্তরের জন্য একটি এলোমেলো পারমুয়েশন ব্যবহার করার কথা ভাবছিলাম। এই পয়েন্টারের জন্য আপনাকে ধন্যবাদ, কারণ এটি আমাকে সম্পর্কিত পদ্ধতিগুলির অনুসন্ধানের জন্য একটি ভাল পয়েন্ট দেয়!
অ্যানি-মৌসে

wrt। হ্যাল্টন ক্রম আবার। কমপক্ষে প্রাথমিক বীজ ব্যতীত আমার তাদের অ-নিরস্ত করা দরকার। আমি এখানে দুটি উপায় দেখতে পাচ্ছি। আমি এলোমেলো অফসেট + একটি এলোমেলো স্টার্ট অফসেট + পদক্ষেপের আকার দ্বারা একটি চক্রীয় শিফট করতে পারি। সমস্যাটি হ'ল অবশ্যই গেমের উদাহরণে থাকা "ধন" প্রতিবার একে অপরের তুলনায় একই পদে থাকা উচিত নয়। অথবা আমি এই প্রশ্নটিকে "এলোমেলো মোচড়" যোগ করার জন্য আমার প্রশ্নে থাকা এই ইউনিফর্ম-থেকে-subinterval পদ্ধতির ব্যবহার করতে পারি। তাই বলে: আমার ব্যবহারের জন্য হ্যালটন আবার খুব অনুমানযোগ্য এবং নিয়মিত বলে মনে হচ্ছে।
অ্যানি-মৌসে

3
en.wikipedia.org/wiki/Low-discrepancy_sequence বা mathworld.wolfram.com/QuasirandomSequence.html । অভিন্ন আরএনজিগুলির বেশ কয়েকটি সাধারণ পরীক্ষাগুলি (যেমন টেস্টগুলির ডাইহার্ড / ডাইহার্ডার ব্যাটারিগুলির মধ্যে রয়েছে) এই জাতীয় জিনিসগুলির প্রতি সংবেদনশীল; উদাহরণস্বরূপ, পয়েন্টগুলির মধ্যে খুব কম 'ছোট দূরত্ব' রয়েছে।
Glen_b

উত্তর:


60

হ্যাঁ , সংখ্যার ক্রম উত্পাদন করার অনেকগুলি উপায় রয়েছে যা এলোমেলো ইউনিফর্মের চেয়ে সমানভাবে বিতরণ করা হয়। আসলে, এই প্রশ্নের জন্য নিবেদিত একটি পুরো ক্ষেত্র রয়েছে ; এটি অর্ধ-মন্টে কার্লো (কিউএমসি) এর মেরুদণ্ড । নীচে পরম বেসিকগুলির একটি সংক্ষিপ্ত ভ্রমণ রয়েছে।

অভিন্নতা পরিমাপ

এটি করার অনেকগুলি উপায় রয়েছে তবে সর্বাধিক সাধারণ উপায়ে একটি শক্তিশালী, স্বজ্ঞাত, জ্যামিতিক স্বাদ থাকে। ধরুন আমরা উৎপাদিত সঙ্গে সংশ্লিষ্ট পয়েন্ট মধ্যে কিছু ধনাত্মক পূর্ণসংখ্যা জন্য । নির্ধারণ করুন যেখানে একটি আয়তক্ষেত্র হয় মধ্যে যেমন যে এবংএক্স 1 , এক্স 2 , , এক্স এন [ 0 , 1 ] ডি ডিnx1,x2,,xn[0,1]ddআর [ একটি 1 , 1 ] × × [ একটি , ] [ 0 , 1 ] 0 একটি আমিb আমি1 আর আর আর V ( আর ) = Π আমি ( আমি - একটি আমি )

Dn:=supRR|1ni=1n1(xiR)vol(R)|,
R[a1,b1]××[ad,bd][0,1]d0aibi1Rএই জাতীয় সমস্ত আয়তক্ষেত্রের সেট। মডুলাস ভিতরে প্রথম শব্দ "পালন" ভিতরে পয়েন্ট অনুপাত হয় এবং দ্বিতীয় মেয়াদের ভলিউম হয় , ।RRvol(R)=i(biai)

পরিমাণ প্রায়ই বলা হয় অমিল বা চরম অমিল পয়েন্ট সেট । Intuitively, আমরা "খারাপ" আয়তক্ষেত্র এটি যেখানে পয়েন্ট অনুপাত আমরা নিখুঁত একরূপতা অধীনে আশা কি থেকে সবচেয়ে বিচ্যুত। ( এক্স i ) আরDn(xi)R

এটি অনুশীলনে অযৌক্তিক এবং গণনা করা কঠিন। বেশিরভাগ অংশে, তারা তারার নিয়ে কাজ করতে পছন্দ করে , পার্থক্যটি হ'ল সেট- , যার উপরে সুপ্রিমাম নেওয়া হয়। এটি নোঙ্গর করা আয়তক্ষেত্রের সমষ্টি ( ), যেখানে, ।একটি 1 = একটি 2 = = একটি d = 0

Dn=supRA|1ni=1n1(xiR)vol(R)|.
Aa1=a2==ad=0

থিম : সবার জন্য , । প্রুফ । বাঁ হাত বেঁধে সুস্পষ্ট যেহেতু । ডান হাতের আবদ্ধটি অনুসরণ করে কারণ প্রতিটি ইউনিয়ন, ছেদ এবং অ্যাঙ্কার্ড আয়তক্ষেত্রের (যেমন, ) এর । এন ডি আর আর আর 2 ডি DnDn2dDnnd
ARRR2dA

সুতরাং, আমরা দেখতে পাচ্ছি যে এবং এই অর্থে সমান যে একটি সাথে ছোট হলে হবে। এখানে একটি (কার্টুন) ছবি রয়েছে প্রতিটি পার্থক্যের জন্য প্রার্থীদের আয়তক্ষেত্র দেখাচ্ছে।ডি এন এনDnDnn

অতিরিক্ত এবং তারার পার্থক্য

"ভাল" অনুক্রমের উদাহরণ

যাচাইযোগ্যভাবে তারার সিকোয়েন্সগুলি প্রায়শই বলা হয়, আশ্চর্যজনকভাবে, কম ক্রমDn

ভ্যান ডের কর্পুট । এটি সম্ভবত সবচেয়ে সহজ উদাহরণ। জন্য , Corput সিকোয়েন্স ডের ভ্যান পূর্ণসংখ্যা সম্প্রসারিত করে গঠিত হয় বাইনারি মধ্যে এবং তারপর দশমিক বিন্দুর চারিদিকে "সংখ্যার অনুধ্যায়ী"। আরও আনুষ্ঠানিকভাবে, এটি বেস , in এ র‌্যাডিকাল ইনভার্স ফাংশন দিয়ে সম্পন্ন হয় যেখানে এবং এর বেস প্রসারণের অঙ্ক । এই ফাংশনটি অন্যান্য অনেকগুলি ক্রমের জন্যও ভিত্তি তৈরি করে। উদাহরণস্বরূপ, বাইনারিতে হল এবংi বি ϕ বি ( i ) = কে = 0কে বি - কে - 1d=1ibআমি = Σ = 0 একটি k একটি আমি 41 101001 একটি 0 = 1 একটি 1 = 0 একটি 2 = 0 একটি 3 = 1 একটি 4 = 0 একটি 5 = 1 x এর 41 = φ 2 ( 41 ) = 0.100101

ϕb(i)=k=0akbk1,
i=k=0akbkakbi41101001a0=1 , , , , এবং । সুতরাং, ভ্যান ডের করপুট ক্রমের 41 তম বিন্দু হল ।a1=0a2=0a3=1a4=0a5=1x41=ϕ2(41)=0.100101(base 2)=37/64

নোট অন্তত গুরুত্বপূর্ণ বিট কারণ যে মধ্যে oscillates এবং , পয়েন্ট বিজোড় জন্য হয় , পয়েন্ট যেহেতু এমনকি রয়েছি ।i01xii[1/2,1)xii(0,1/2)

হ্যাল্টন ক্রম । শাস্ত্রীয় নিম্ন-তাত্পর্যপূর্ণ ক্রমের সর্বাধিক জনপ্রিয়গুলির মধ্যে এগুলি হ'ল ভ্যান ডার করপুট ক্রমের একাধিক মাত্রায় বর্ধিত। যাক হতে তম ক্ষুদ্রতম মৌলিক। তারপর, তম বিন্দু এর -dimensional Halton স্বাগতম ক্রম কম জন্য এই কাজ বেশ ভাল, কিন্তু উচ্চতর মাত্রার মধ্যে সমস্যাpjjixid

xi=(ϕp1(i),ϕp2(i),,ϕpd(i)).
d

সিকোয়েন্সগুলি । তারা কারণ তারা এছাড়াও সুন্দর প্রসার্য যে পয়েন্ট নির্মাণ একটি উপর নির্ভর করে না অবরোহমার্গী ক্রম দৈর্ঘ্য পছন্দমত ।Dn=O(n1(logn)d)n

হামারসলে ক্রম । এটি হ্যাল্টন ক্রমের একটি খুব সাধারণ পরিবর্তন। পরিবর্তে আমরা সম্ভবত , সুবিধাটি হ'ল তারা আরও ভাল তারার ।

xi=(i/n,ϕp1(i),ϕp2(i),,ϕpd1(i)).
Dn=O(n1(logn)d1)

এখানে দুটি মাত্রায় হাল্টন এবং হ্যামারসলে সিকোয়েন্সের উদাহরণ রয়েছে।

হ্যালটন এবং হ্যামারসলে

ফিউর-অনুমোদিত হ্যাল্টন ক্রম । একটি বিশেষ একাধিক বিন্যাসন সেট (এর কার্যকারিতা হিসেবে স্থির ) অঙ্ক সম্প্রসারণ প্রয়োগ করা যেতে পারে প্রত্যেকের জন্য যখন Halton স্বাগতম ক্রম উত্পাদক। এটি উচ্চ মাত্রায় সংকেতযুক্ত সমস্যাগুলি প্রতিকার করতে (কিছুটা ডিগ্রিতে) সহায়তা করে। প্রতিটি ক্রমের মধ্যে এবং নির্দিষ্ট পয়েন্ট হিসাবে রাখার আকর্ষণীয় সম্পত্তি রয়েছে ।iaki0b1

জাল বিধি । যাক পূর্ণসংখ্যার হও। নিন যেখানে the এর ভগ্নাংশের অংশকে বোঝায় । মানগুলির ন্যায়বিচারের পছন্দটি ভাল অভিন্নতার বৈশিষ্ট্য দেয়। দরিদ্র পছন্দগুলি খারাপ ক্রমের দিকে নিয়ে যেতে পারে। এগুলি এক্সটেনসিবলও নয়। এখানে দুটি উদাহরণ দেওয়া হল।β1,,βd1

xi=(i/n,{iβ1/n},,{iβd1/n}),
{y}yβ

ভাল এবং খারাপ lattices

(t,m,s) জাল । বেস মধ্যে জাল পয়েন্ট টি সেট রয়েছে ভলিউম প্রতিটি আয়তক্ষেত্র যে মধ্যে ধারণ করে পয়েন্ট। এটি অভিন্নতার একটি শক্তিশালী রূপ। ছোট এই ক্ষেত্রে আপনার বন্ধু। হ্যালটন, সোবোল 'এবং ফিউয়ার সিকোয়েন্সগুলি জালের উদাহরণ । এগুলি স্ক্র্যাম্বলিংয়ের মাধ্যমে এলোমেলোভাবে সুন্দরভাবে ndণ দেয়। এ নেট এলোমেলো স্ক্র্যাম্বলিং (ডান ঠিক করা) থেকে আরেকটি নেট পাওয়া যায়। টাকশাল প্রকল্পের যেমন সিকোয়েন্স একটি সংগ্রহ রাখে।(t,m,s)bbtm[0,1]sbtt(t,m,s)(t,m,s)(t,m,s)

সাধারণ র্যান্ডমাইজেশন: ক্র্যানলি-প্যাটারসন আবর্তন । যাক পয়েন্ট একটি ক্রম হও। আসুন । তারপরে the পয়েন্টগুলি সমানভাবে বিতরণ করা হবে ।xi[0,1]dUU(0,1)x^i={xi+U}[0,1]d

এখানে নীল বিন্দুগুলির মূল পয়েন্টগুলি এবং লাল বিন্দুগুলি ঘোরানো লাইনের সাথে তাদের সংযোগকারী লাইনগুলি রয়েছে (এবং চারপাশে জড়িয়ে দেওয়া দেখানো হয়েছে যেখানে উপযুক্ত) an

ক্র্যানলি প্যাটারসন

সম্পূর্ণ অভিন্ন বিতরণ ক্রম । এটি একত্রীকরণের আরও দৃ not় ধারণা যা কখনও কখনও কার্যকর হয়। যাক পয়েন্ট ক্রম হতে এবং এখন আকারের ওভারল্যাপিং ব্লক গঠন ক্রম পেতে । সুতরাং, যদি , আমরা তারপর ইত্যাদি গ্রহণ করি, যদি প্রতিটি , , তারপরে সম্পূর্ণ অভিন্ন বিতরণ করা হবে বলে জানা গেছে । অন্য কথায়, ক্রমটি যে কোনও একটি পয়েন্টের একটি সেট দেয়(ui)[0,1]d(xi)s=3x1=(u1,u2,u3)x2=(u2,u3,u4) s1Dn(x1,,xn)0(ui)পছন্দসই বৈশিষ্ট্যযুক্ত মাত্রা ।Dn

উদাহরণস্বরূপ, ভ্যান ডের করপুট ক্রমটি সম্পূর্ণরূপে সমানভাবে বিতরণ করা হয়নি যেহেতু , the পয়েন্টগুলি স্কোয়ারে এবং পয়েন্ট হয় । অত: পর সেখানে বর্গ কোন পয়েন্ট যা বোঝা যে জন্য , সবার জন্য ।s=2x2i(0,1/2)×[1/2,1)x2i1[1/2,1)×(0,1/2)(0,1/2)×(0,1/2)s=2Dn1/4n

মানক রেফারেন্স

Niederreiter (1992) প্রকরণগ্রন্থ এবং ফাং এবং ওয়াং (1994) গ্রন্থে আরও অন্বেষণ করার জন্য যেতে স্থান।


4
এই উত্তরটি দুর্দান্ত and ধন্যবাদ!
অ্যানি-মৌসে

1
একটি ছোট ফলোআপ প্রশ্ন। হ্যাল্টন সিকোয়েন্সগুলি দেখতে দুর্দান্ত, কারণ এগুলিও খুব বেশি নিয়মিত হয় না বলে মনে হয়। জাল জাতীয় জিনিসগুলি আমার পক্ষে নিয়মিত অনেক কিছু, এবং হ্যামারসলে ক্রমটিও মনে হয় যে উত্সের মধ্য দিয়ে অনেকগুলি অবজেক্ট রয়েছে। সত্য ইউনিফর্ম এবং নকল ইউনিফর্মের মধ্যে ভারসাম্য নিয়ন্ত্রণের একটি ভাল উপায় কী? হালটোন থেকে 20% ইউনিফর্ম এলোমেলোভাবে 80% অবদান নেবেন?
অ্যানি-মৌসে

1
+ 10 কে এবং স্পষ্টভাবে একটি রেকর্ড কম (87 !!!!) উত্তর সহ! ওহ, এবং আমি এই পোস্টটি খুব পছন্দ করি। আমি আসলে কারণটির কারণে প্রশ্নটি বুকমার্ক করেছি। ভাল হয়েছে, @ কার্ডিনাল।
ম্যাক্রো

@ ম্যাক্রো: এত সুন্দর মন্তব্যের জন্য আপনাকে ধন্যবাদ! আপনি খুব দয়ালু। আমি মনে করি এই 10 কে জিনিসটি আমার জন্য অস্থায়ী হতে পারে। আমি সন্দেহ করি যে প্রিলিনেটরের ভোটগুলি প্রত্যাবর্তনের সাথে সাথেই আমি 10K এর নীচে নেমে যেতে পারি। আমি আশ্চর্য হয়েছি যে এটি এখনও ঘটেনি, আসলেও। আমি বিশ্বাস করি তারা এই সাইটে প্রায় 3000 ভোট দিয়েছে। এখানে পোস্ট করার জন্য ধন্যবাদ; কোনওভাবে আমি কখনও অ্যানি-মুউসের ফলো-আপ প্রশ্নগুলি দেখিনি!
কার্ডিনাল

@ অ্যানি-মউস: প্রতিক্রিয়া জানাতে ভয়ানক দেরির জন্য ক্ষমা প্রার্থনা করছি। আমি অবশ্যই এই মন্তব্য উপেক্ষা করা উচিত। আমি মনে করি একটি ভারসাম্য তৈরি করা আপনার লক্ষ্যগুলির উপর নির্ভর করবে। তাত্ত্বিকভাবে বলতে গেলে, যেকোন র্যান্ডম ইউনিফর্ম পয়েন্টগুলি প্রবর্তন করা উদাহরণস্বরূপ, অনুকূল বৈশিষ্ট্যগুলি ধ্বংস করতে বাধ্য । বাস্তবসম্মত ব্যাপার, এটা QMC পয়েন্ট যেখানে নার্ভাসভাবে উপর ভিত্তি করে নির্বাচিত খুব ছোট নার্ভাসভাবে ব্যবহার করতে ভাল হতে পারে ক্রম বৈশিষ্ট্য। আপনি সমস্ত পয়েন্টগুলিতে এলোমেলো অনমনীয়-বডি ট্রান্সফর্মেশনগুলিও পরিচয় করিয়ে দিতে পারেন, যেমন, শিফট এবং সমন্বয় ঘূর্ণন। ডি DD
কার্ডিনাল

3

এটি করার একটি উপায় হ'ল অভিন্ন এলোমেলো সংখ্যা তৈরি করা, তারপরে আপনার পছন্দ মতো যে কোনও পদ্ধতি ব্যবহার করে "ঘনিষ্ঠতা" পরীক্ষা করুন এবং তারপরে অন্যের সাথে খুব কাছাকাছি থাকা এলোমেলো আইটেমগুলি মুছুন এবং তাদের জন্য তৈরি করার জন্য এলোমেলো ইউনিফর্মগুলির আরও একটি সেট বেছে নিন।

এই জাতীয় বিতরণ কি ইউনিফর্মের প্রতিটি পরীক্ষায় উত্তীর্ণ হবে? আমি নিশ্চিত আশা করি না! এটি আর অভিন্ন বিতরণ করা হয়নি, এটি এখন অন্য কিছু বিতরণ।

সম্ভাবনার একটি অবিস্মরণীয় দিক হ'ল সুযোগটি অসুবিধা। লোকেরা মনে করবে যে এগুলি হবে তার চেয়ে এলোমেলো ডেটাতে বেশি রান রয়েছে। আমার মতে টারওয়ারস্কি এ নিয়ে কিছু গবেষণা করেছিলেন (তিনি এত গবেষণা করেছেন, তবে এটি মনে রাখা মুশকিল)।


2
এই পদ্ধতির সাথে অন্যতম (অনেকগুলি) সমস্যা হ'ল ফলস্বরূপ বিতরণটি চিহ্নিত করা খুব কঠিন।
whuber

ছোট্ট নমুনা আকারের সাথে ওপি সবচেয়ে বেশি উদ্বিগ্ন বলে মনে হচ্ছে। এটি সুপারিশ করবে যে পুরো বিতরণ সম্পর্কে তার কোনও যত্ন করার দরকার নেই। ধরুন আপনার কাছে স্থানাঙ্কের একটি সেট রয়েছে, আপনি অন্যটি তৈরি করেন এবং তারপরে অন্য সকলের সাথে সম্মানের সাথে ইউক্লিডিয়ান দূরত্ব গণনা করুন। ক্ষুদ্রতম দূরত্ব যদি কিছু প্রান্তিকের নীচে থাকে তবে সংখ্যাটি ফেলে দিন এবং একটি নতুন তৈরি করুন। আমি মনে করি পিটারের সমাধানটি ভাল কাজ করে।
জন

@ হুবুহু তিনি এতে আগ্রহী বলে মনে হচ্ছে না, যদিও আমি ভুল হতে পারি।
পিটার ফ্লুম - মনিকা পুনরায়

2
আমার আপত্তি একটু বেশি পরিষ্কারভাবে রাষ্ট্র, পিটার করা যাক: যখন আপনি মুছে ফেলুন এবং / অথবা একটি ইন সিউডোরান্ডম মান সমন্বয় তদর্থক অর্ডার যেমন ক্লাস্টারিং অভাব যেমন, কিছু পছন্দসই সম্পত্তি আনুমানিক করার জন্য ভাবে, এটা কঠিন যে আশ্বাস ফলে সিকোয়েন্স আছে যে কোনও পছন্দসই বৈশিষ্ট্য। উদাহরণস্বরূপ, আপনার পদ্ধতির সাহায্যে আপনি কি আমাদের বলতে পারবেন যে ফলস্বরূপ প্রক্রিয়াটির প্রথম মুহূর্তটি কী হবে? (এটি, আপনি কী আমাদের তাত্পর্যটি অভিন্ন বলে আশ্বাস দিতে পারেন?) দ্বিতীয় মুহুর্তের কী হবে? সাধারণত এই অনুক্রমগুলি কার্যকরভাবে অনুক্রমের জন্য ব্যবহারের জন্য প্রয়োজনীয় ন্যূনতম তথ্য গঠন করে।
শুক্র

2
ঠিক আছে, তবে, প্রশ্নের উদাহরণে, তিনি কোনও খেলায় কোনও মানচিত্রে ধন রাখতে চান। এটি অনুমান বা মুহুর্ত বা বাছাইয়ের কিছু জড়িত না। আমি স্বীকার করি যে আমার পদ্ধতিটি অনেক উদ্দেশ্যে ভাল হবে না তবে আমি মনে করি এটি উদাহরণের সাথে মিলে যায়। অবশ্যই, উদাহরণটি সম্ভবত তিনি যা চান তা নয় .... সম্ভবত তিনি আরও কিছু আনুষ্ঠানিকতা চান, এই ক্ষেত্রে অন্যান্য সমস্ত উত্তরগুলির দিকে নজর দেওয়া উচিত।
পিটার ফ্লুম - মনিকা পুনরায়

3

এটি একটি "হার্ড-কোর" পোয়েসন পয়েন্ট প্রক্রিয়া হিসাবে পরিচিত - এটি 1970 এর দশকে ব্রায়ান রিপ্লি নামকরণ করেছিলেন; যেমন আপনি এটি এলোমেলো হতে চান তবে আপনি চান না যে কোনও পয়েন্ট একসাথে খুব কাছের হয়। "হার্ড-কোর" এমন একটি বাফার অঞ্চল হিসাবে কল্পনা করা যেতে পারে যার চারপাশে অন্যান্য পয়েন্টগুলি অনুপ্রবেশ করতে পারে না।

কল্পনা করুন যে আপনি কোনও শহরে কয়েকটি গাড়ির অবস্থান রেকর্ড করছেন - তবে আপনি কেবল গাড়ির নামমাত্র কেন্দ্রের পয়েন্টটি রেকর্ড করছেন। তারা রাস্তায় থাকাকালীন কোনও দুটি পয়েন্ট জোড় একসাথে আসতে পারে না কারণ পয়েন্টগুলি দেহকর্মের "হার্ড-কোর" দ্বারা সুরক্ষিত রয়েছে - আমরা বহুতল গাড়ি পার্কগুলির সম্ভাব্য সুপার-অবস্থান উপেক্ষা করব :-)

এ জাতীয় পয়েন্ট প্রক্রিয়া উত্পন্ন করার পদ্ধতি রয়েছে - একটি উপায় হ'ল একরকম পয়েন্ট উত্পন্ন করা এবং তারপরে খুব নিকটে থাকা যেকোন একটি অপসারণ!

যেমন প্রক্রিয়ার উপর কিছু বিস্তারিত জন্য, এখানে উদাহরণস্বরূপ পড়ুন এই


2

আগাম ব্যাচ প্রজন্মের প্রতি শ্রদ্ধা রেখে আমি প্রচুর সিউডোরান্ডম বৈচিত্রের সেট তৈরি করতে পারতাম এবং তারপরে কোলমোগোরভ-স্মারনভ পরীক্ষার মতো একটি পরীক্ষা দিয়ে তাদের পরীক্ষা করতাম। আপনি সেই সেটটি নির্বাচন করতে চাইবেন যার সর্বাধিক পি-মান রয়েছে (যেমন, আদর্শ)। মনে রাখবেন যে এটি ধীর হবে, তবে বড় হওয়ার সাথে সাথে এটি সম্ভবত কম প্রয়োজনীয় হবে। p1N

বর্ধিত প্রজন্মের প্রতি শ্রদ্ধা রেখে আপনি মূলত একটি মাঝারি ধরণের নেতিবাচক স্বতঃসংশোধন সহ একটি সিরিজ খুঁজছেন। এটি করার সর্বোত্তম উপায়টি কী তা আমি নিশ্চিত নই, যেহেতু সময়-সিরিজের সাথে আমার খুব সীমাবদ্ধ অভিজ্ঞতা রয়েছে তবে আমি সন্দেহ করি যে এটির জন্য বিদ্যমান অ্যালগোরিদম রয়েছে।

"খুব এমনকি" জন্য একটি পরীক্ষা থেকে সম্মান, কিনা একটি নমুনা একটি নির্দিষ্ট বন্টন (যেমন এস উপরে উল্লিখিত) অনুসরণ করে কোনো পরীক্ষা কি করতে হবে এর সাহায্যে, শুধুমাত্র যদি চেক করতে চান বদলে মানক পদ্ধতির আমি এই বিকল্প পদ্ধতির উদাহরণ সম্পর্কে এখানে লিখেছি: চি-স্কোয়ার সর্বদা একতরফা পরীক্ষাp>(1α)


1

আমি আপনার সমস্যাটিকে এইভাবে আনুষ্ঠানিক করব: আপনি উপরে একটি বিতরণ চান such যেমন ঘনত্ব কিছু পয়েন্টগুলির বিকর্ষণ জন্য ।( এক্স ) ( 1 )[0,1]nf(x)e(1kij|xixj|k)1kk<0

এই জাতীয় ভেক্টর জেনারেট করার একটি সহজ উপায় হ'ল গীবস স্যাম্পলিং।


আপনি এই সম্পর্কে বিস্তারিত বলতে পারেন? শর্তসাপেক্ষ বিতরণ = প্রান্তিক বিতরণ = ইউনিফর্ম হিসাবে গিবস স্যাম্পলিং এখানে সহায়তা করবে বলে মনে হয় না? অথবা পূর্ববর্তী নমুনাগুলি থেকে নমুনা বিতরণে "গর্ত" তৈরি করতে আপনার পরামর্শটি কি?
অ্যানি-মৌসে

একটি অভিন্ন র্যান্ডম ভেক্টর চয়ন করুন এবং তারপরে বারবার অভিন্নভাবে একটি সূচক এবং পুনরায় নমুনা বেছে নিন । অনুপাত গণনা এর আগে ও রিস্যাম্পলিং পর এবং আপনার রিস্যাম্পলিং প্রত্যাখ্যান মতভেদ সঙ্গে । আপনার যখন খুব দীর্ঘ ভেক্টর রয়েছে তখন আপনি যে উত্তরগুলি পেয়েছেন সেগুলির চেয়ে এটি দ্রুততর কারণ আপনি বিশ্বব্যাপী প্রত্যাখ্যানের পরিবর্তে স্থানীয় সম্পাদন করছেন। x i r f ( x ) rixirf(x)r
নিল জি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.