ল্যাটিন হাইপারকিউব নমুনা সংশ্লেষ


11

আমি যে সমস্যার উপরে কাজ করছি তার একটি প্রমাণ তৈরি করার চেষ্টা করছি এবং আমি যে অনুমানগুলি তৈরি করছি তার একটি হ'ল আমি যে পয়েন্টগুলি থেকে নমুনা দিচ্ছি সেটি পুরো স্থানের চেয়ে ঘন। ব্যবহারিকভাবে, আমি সম্পূর্ণ নমুনার জায়গার উপরে আমার পয়েন্টগুলি পেতে ল্যাটিন হাইপারকিউব স্যাম্পলিং ব্যবহার করছি। আমি কী জানতে চাই যে ল্যাটিন হাইপারকিউব নমুনাগুলি যদি পুরো জায়গার চেয়ে বেশি ঘন হয় তবে যদি আপনি আপনার নমুনার আকারটি ? যদি তা হয় তবে এই সত্যটির প্রশংসা প্রশংসিত হবে।


4
হ্যাঁ, একটি অবিচ্ছিন্ন বিতরণ অনুমান করে, কারণ যে কোনও আপনি বিভাগের সংখ্যাটি এমনটি সেট করতে পারেন যে প্রতি প্রতি পরিবর্তনশীল অন্তরগুলির প্রস্থ । সুতরাং কমপক্ষে একটি হাইপারআইন্টারওয়াল (অর্থাত্ নমুনার ভলিউম) আপনি যে কোনও বিন্দুর কাছাকাছি বেছে নিতে প্রস্থ হাইপারকিউবারের সাথে কঠোরভাবে ধারণ করেছেন । (মন্তব্য, উত্তর নয়, যেমনটি এলএইচএস সম্পর্কে আমি জানি দশ মিনিট আগে উইকিপিডিয়া থেকে এসেছে ...)ϵ>0<ϵ/2ϵ
ক্রিওসোট

এটি সত্য, তবে আমি মনে করি না এটি বড় ল্যাটিন হাইপারকিউব নমুনার ঘনত্ব প্রদর্শন করতে সহজেই ব্যবহার করা যেতে পারে। এর কারণ হ'ল এলএইচএসে নমুনাযুক্ত পয়েন্টগুলি স্বাধীন নয়: একটি নির্দিষ্ট হাইপারইন্টারভাল এর অভ্যন্তরে একটি নমুনা বিন্দুর অস্তিত্ব অন্য স্যাম্পল পয়েন্টগুলিকে একই সারি / কলামে উপস্থিত হওয়া থেকে বিরত রাখে (বা বহুমাত্রিক শব্দটি এর জন্য যাই হোক না কেন) ।
এস ক্যাটারলর পুনরায় স্থাপন করুন মনিকা

@ ক্রাইসোট আপনি কি মনে করেন যে আপনি নিজের উত্তরটি আরও আনুষ্ঠানিক করতে পারেন?

@ রুস্টি স্ট্যাটিস্টিশিয়ান, অনুগ্রহ করে আপনার প্রুফ অনুসারে প্রয়োজনীয়ভাবে আনুষ্ঠানিকভাবে ব্যাখ্যা করার জন্য আপনার উদ্বোধন পোস্টটি প্রসারিত করুন, "আমি যে পয়েন্টগুলির মধ্য থেকে নমুনা দিচ্ছি তার সেটটি পুরো জায়গার চেয়ে ঘন" বলে আপনি কী বোঝাতে চেয়েছেন। ধন্যবাদ।
ক্রেওসোট

যদি আমি প্রাথমিক ল্যাটিন হাইপারকিউব নমুনা নিয়ে থাকি যেখানে এত বড় হয় তবে আমরা এটিকে স্বতন্ত্র হিসাবে বিবেচনা করি, সে নমুনা কি ঘন? n

উত্তর:


6

সংক্ষিপ্ত উত্তর: হ্যাঁ, সম্ভাব্য উপায়ে। এটি দেখানো সম্ভব যে কোনও দূরত্ব distance দেওয়া থাকলে নমুনা স্থানের কোনও সীমাবদ্ধ সাবসেট and এবং কোনও নির্ধারিত 'সহনশীলতা' , যথাযথ বৃহত নমুনার আকারের জন্য আমরা হতে পারি নিশ্চিত করুন যে সম্ভাবনা একটি দূরত্ব মধ্যে একটি নমুনা বিন্দু নেই এর হয় সবার জন্য ।{ x 1 , , এক্স এম } δ > 0 ϵ x i > 1 - δ i = 1 , , মিϵ>0{x1,,xm}δ>0ϵxi>1δi=1,,m

দীর্ঘ উত্তর: আমি সরাসরি কোনও প্রাসঙ্গিক উদ্ধৃতি সম্পর্কে অবগত নই (তবে নীচে দেখুন)। লাতিন হাইপারকিউব স্যাম্পলিং (এলএইচএস) এর বেশিরভাগ সাহিত্য তার বৈচিত্র্য হ্রাস বৈশিষ্ট্যের সাথে সম্পর্কিত। অন্য ইস্যুটি হ'ল, নমুনার আকারটি বোঝায় এর অর্থ কী ? সহজ IID র্যান্ডম স্যাম্পলিং জন্য, আকার একটি নমুনা আকারের একটি নমুনা থেকে প্রাপ্ত করা যাবে আরও স্বাধীন নমুনা সংযোজন করে। এলএইচএসের জন্য আমি মনে করি না যে প্রক্রিয়ার অংশ হিসাবে আগাম নমুনার সংখ্যা নির্দিষ্ট করা হয়েছে বলে আপনি এটি করতে পারেন। সুতরাং এটি প্রদর্শিত হবে আপনার একটি উত্তরাধিকার গ্রহণ করতে হবে যে স্বাধীন আকারের LHS নমুনা ।এন এন - 1 1 , 2 , 3 , nn11,2,3,...

সীমাতে 'ঘন' ব্যাখ্যার কিছু কারণ নমুনা আকারটি । ঘনত্বটি এলএইচএসের জন্য নির্ধারিত পদ্ধতিতে ধরা পড়ে না বলে মনে হয় যেমন দুটি মাত্রায় আপনি আকারের এলএইচএস নমুনার ক্রমটি বেছে নিতে পারেন যেমন তারা সমস্ত এর তির্যকটি । । সুতরাং এক ধরণের সম্ভাব্য সংজ্ঞাটি প্রয়োজনীয় বলে মনে হচ্ছে। যাক, যে জন্য , আকারের একটি নমুনা হতে কিছু সম্ভাব্যতার সূত্রাবলি প্রক্রিয়া অনুযায়ী উত্পন্ন। ধরুন, বিভিন্ন জন্য এই নমুনাগুলি স্বাধীন are তারপরে অ্যাসিপটোটিক ঘনত্ব সংজ্ঞায়িত করতে আমাদের প্রতি এবং প্রত্যেকের জন্য প্রয়োজন হতে পারে1,2,3,...[0,1)2nXn=(Xn1,Xn2,...,Xnn)nnϵ>0xনমুনা স্পেসে (ধরে নেওয়া ), আমাদের কাছে ( যেমন )।[0,1)dP(min1knXnkxϵ)0n

যদি নমুনা ডিস্ট্রিবিউশন ('আইআইডি র‌্যান্ডম স্যাম্পলিং') থেকে স্বতন্ত্র নমুনা গ্রহণ করে প্রাপ্ত হয় তবে যেখানে ভলিউম হয় ব্যাসার্ধ্যের -dimensional বল । সুতরাং অবশ্যই আইআইডি এলোমেলো নমুনা অসম্পূর্ণভাবে ঘন।XnnU([0,1)d)

P(min1knXnkxϵ)=k=1nP(Xnkxϵ)(1vϵ2d)n0
vϵdϵ

এখন বিবেচনা করুন যে নমুনাগুলি এলএইচএস দ্বারা প্রাপ্ত। এই নোটগুলিতে উপপাদ্য 10.1 বলেছে যে নমুনা সদস্যরা সমস্ত as হিসাবে বিতরণ করা হয়েছে । তবে, এলএইচএসের সংজ্ঞাতে ব্যবহৃত বিভাজনগুলি (যদিও বিভিন্ন মাত্রার জন্য স্বতন্ত্র) নমুনার সদস্যদের মধ্যে কিছুটা নির্ভরশীলতা প্ররোচিত করে ( ), তাই এ্যাসিপটোটিক ঘনত্বের সম্পত্তিটি কম রয়েছে বলে এটি কম স্পষ্ট।XnXnU([0,1)d)Xnk,kn

এবং Fix ঠিক করুন ।নির্ধারণ । আমরা । এটি করার জন্য, আমরা সেই নোটগুলিতে প্রস্তাবনা 10.3 ব্যবহার করতে পারি , যা লাতিন হাইপারকিউব স্যাম্পলিংয়ের জন্য একধরণের কেন্দ্রীয় সীমাবদ্ধ তত্ত্ব। নির্ধারণ করুন দ্বারা যদি ব্যাসার্ধ বলের হয় প্রায় , অন্যথায়। তারপরে প্রস্তাব 10.3 আমাদের জানায় যে যেখানে এবংϵ>0x[0,1)dPn=P(min1knXnkxϵ)Pn0f:[0,1]dRf(z)=1zϵxf(z)=0Yn:=n(μ^LHSμ)dN(0,Σ)μ=[0,1]df(z)dzμ^LHS=1ni=1nf(Xni)

নিন । অবশেষে, যথেষ্ট পরিমাণে , আমাদের থাকবে । সুতরাং শেষ পর্যন্ত আমাদের কাছে । অতএব , যেখানে আদর্শ স্বাভাবিক সিডিএফ হয়। যেহেতু নির্বিচারে ছিল, এটি পর্যন্ত প্রয়োজনীয় হিসাবে অনুসরণ করে ।L>0nnμ<LPn=P(Yn=nμ)P(Yn<L)lim supPnlim supP(Yn<L)=Φ(LΣ)ΦLPn0

এটি আইআইডি এলোমেলো নমুনা এবং এলএইচএস উভয়ের জন্য অ্যাসেম্পটোটিক ঘনত্ব (উপরে সংজ্ঞায়িত) প্রমাণ করে। অনানুষ্ঠানিকভাবে, এর অর্থ হ'ল যে নমুনা স্পেসে কোনও এবং যে কোনও হয়েছে, নমুনাটি এর মধ্যে চলে আসার সম্ভাবনাটি যতটা সম্ভব আপনার পছন্দ মতো নমুনার আকার পছন্দ করে ১ এর কাছাকাছি তৈরি করা যেতে পারে। সীমাবদ্ধ স্থানের সীমাবদ্ধ সাবসেটগুলিতে প্রয়োগ করার জন্য - সীমাবদ্ধ সাবসেটের প্রতিটি পয়েন্টে আমরা ইতিমধ্যে কী জানি তা প্রয়োগ করে অ্যাসিপটোটিক ঘনত্বের ধারণাটি প্রসারিত করা সহজ। আরও আনুষ্ঠানিকভাবে এর অর্থ এই যে আমরা প্রদর্শন করতে পারি: যে কোনও এবং যে কোনও সীমাবদ্ধ উপসেট sample নমুনা স্পেসের জন্য,ϵxϵxϵ>0{x1,...,xm}min1jmP(min1knXnkxj<ϵ)1 (হিসাবে )।n


আমি দুটি প্রশ্ন আছে: 1) আপনি শুধু আকারের নমুনা থাকে তাহলে যেখানে বড়, যে পরিবর্তন যুক্তি করে? এবং 2) ল্যাটিন হাইপারকিউবসের নমুনাগুলি কোনও মানের পরিসরে থাকতে পারে (অগত্যা কেবল (0,1) নয়) তাই তেহ উত্তরটিও পরিবর্তন করে? nn

এছাড়াও, আপনি কী ব্যাখ্যা করতে ইচ্ছুক হবেন যে কেন যথেষ্ট পরিমাণে , আমাদের থাকবে ? আমি ধরে নিলাম এর অর্থ হ'ল বড় , zero শূন্যে চলে যায়, কারণ বিতরণে এটি একটি ? nnμnμ^LHSN(0,Σ)

@ রাস্টিস্ট্যাটাস্টিকিয়ান সবকিছু সীমাবদ্ধ নমুনার ক্ষেত্রে যেমন এলটি তবে বড় large আমি কী ঘটছে তা ব্যাখ্যা করার জন্য শেষে কিছু অতিরিক্ত ব্যাখ্যা যুক্ত করেছি। যতক্ষণ নমুনা জায়গার পরিমাণ সীমাবদ্ধ থাকে ততক্ষণ মানগুলির অন্যান্য ব্যাপ্তিগুলি সহজেই সমন্বিত করা যায় ((0,1) বিশেষ নয়)। n<
এস ক্যাটালরুল পুনরায় ইনস্টল করুন মনিকা

আপনি কি আপনার সংক্ষিপ্ত উত্তরটি বিস্তারিতভাবে বলতে পারেন?

@ রুস্টি স্ট্যাটিস্টিশিয়ান সংক্ষিপ্ত উত্তরটি আমার দীর্ঘ উত্তরের একটি অনানুষ্ঠানিক সংক্ষিপ্তসার, যা আমি মনে করি আপনি সম্মত হবেন, ইতিমধ্যে বেশ বিস্তৃত! সুতরাং, উপরে প্রস্তাবিত হিসাবে, আপনি যদি আপনার প্রশ্নটি আরও আনুষ্ঠানিক পদে আবারও লিখতে পারেন তবে ভাল হবে যাতে আমি জানতে পারি যে আমার চেষ্টা করা উত্তরটি সঠিক পথে রয়েছে (আপনার উদ্দেশ্যযুক্ত প্রশ্নের উত্তর দেওয়ার ক্ষেত্রে) বা না)
এস ক্যাটারলাল মনিকা

3

আপনারা যা চান এটি ঠিক কিনা তা আমি নিশ্চিত নই, তবে এখানে রয়েছে।

আপনি থেকে এলএইচএস-নমুনা পয়েন্ট , বলুন। আমরা কোনো জন্য, খুব অনাড়ম্বরভাবে যে তর্ক করব , আকার খালি (অধি) cuboids প্রত্যাশিত সংখ্যা প্রতিটি আয়তনের শূন্য হিসেবে যায় ।n[0,1)dϵ>0ϵn

যাক যাতে যদি আমরা বিভক্ত অবিশেষে মধ্যে - অতি ক্ষুদ্র cuboids microcuboids বলে - প্রস্থ তারপর প্রতি width- কিউবইড রয়েছে কমপক্ষে একটি মাইক্রোকুবয়েড সুতরাং আমরা যদি দেখাতে পারি যে স্যাম্পল মাইক্রোকুবয়েডগুলির প্রত্যাশিত সংখ্যাটি শূন্য, ইনফটি হিসাবে সীমাতে , তবে আমরা সম্পন্ন করেছি। (মনে রাখবেন যে আমাদের মাইক্রোকোবয়েডগুলি একটি নিয়মিত গ্রিডে সাজানো থাকে তবে এপসিলন-কিউবিডগুলি যে কোনও অবস্থাতেই থাকতে পারে))m=2/ϵ[0,1)dmd1/mϵnϵ

সম্পূর্ণরূপে প্রথম নমুনা বিন্দু দিয়ে একটি প্রদত্ত microcuboid নিখোঁজ সুযোগ , স্বাধীন যেমন প্রথম সেট, নমুনা স্থানাঙ্ক (প্রথম নমুনা পয়েন্ট) অবাধে নির্বাচন করা যেতে পারে। প্রদত্ত যে প্রথম কয়েকটি নমুনা পয়েন্টগুলি সমস্ত সেই মাইক্রোকুবয়েডকে মিস করেছে, পরবর্তী নমুনা পয়েন্টগুলি (গড় হিসাবে) মিস করা আরও কঠিন হবে, সুতরাং এটি সমস্ত পয়েন্টের অনুপস্থিত হওয়ার সম্ভাবনা চেয়ে কম ।1mdndn(1md)n

আছে মধ্যে microcuboids , তাই আশা করা সংখ্যা মিস করছেন যে করে উপরের বেষ্টিত - কারণ প্রত্যাশা যুক্ত করুন - যা হিসাবে সীমাতে শূন্য ।md[0,1)dmd(1md)nn


আপডেটগুলি ...

(1) এখানে কতটা দেওয়া একটি ছবি , আপনি বাছাই করতে পারেন বৃহৎ যথেষ্ট যাতে কোনো "microcuboids" (এই 2-মাত্রিক দৃষ্টান্তে স্কোয়ার) এর গ্রিড মধ্যে অন্তত একটি microcuboid আছে নিশ্চিত করা হয় যে কোনও মাপের অঞ্চল। আমি দুটি "এলোমেলোভাবে" -চোসেন-এপসিলন এপসিলোন অঞ্চলগুলি দেখিয়েছি এবং তাদের মধ্যে থাকা দুটি মাইক্রোকোবাইডগুলিকে বেগুনি রঙিন করেছি।ϵmm×m ϵ×ϵϵ×ϵ

এখানে চিত্র বর্ণনা লিখুন

(২) বিশেষ কোনও মাইক্রোকোবয়েড বিবেচনা করুন। এটিতে ভলিউম , সম্পূর্ণ স্থানের একটি ভগ্নাংশ । রয়েছে। সুতরাং প্রথম LHS নমুনা - যা শুধুমাত্র একটি সম্পূর্ণরূপে অবাধে নির্বাচিত হয় - সম্ভাব্যতা সঙ্গে এটি মিস করবেন না । একমাত্র গুরুত্বপূর্ণ সত্যটি হ'ল এটি একটি স্থির মান (আমরা দেব , তবে ধ্রুবক বজায় রাখব ) যা এর চেয়ে কম ।(1/m)dmd1mdnm1

(3) এখন নমুনা পয়েন্ট সংখ্যা সম্পর্কে ভাবেন । আমি ছবিতে চিত্রিত করেছি । এলএইচএস এই অতি ক্ষুদ্র ক্ষুদ্র একটি in মাপের "ন্যানোকুবয়েডস" (যদি আপনি চান) না, তবে বড় সূক্ষ্ম জালটিতে কাজ করে "আকারের" মাইক্রোকুবয়েডস ", তবে প্রকৃত পক্ষে এটি গুরুত্বপূর্ণ নয়। প্রমাণটির জন্য কেবল সামান্য হাতে-তরঙ্গাকারী বিবৃতি দরকার যা আপনি আরও পয়েন্টগুলি নীচে ফেলে দেওয়ার সাথে সাথে একটি প্রদত্ত মাইক্রোকুবয়েড অনুপস্থিত রাখার জন্য ধীরে ধীরে শক্ত হয়ে যায়। সুতরাং এটি ছিল একটি সম্ভাব্যতা প্রথম LHS নিখোঁজ পয়েন্ট, কিন্তু কম তুলনায় জন্য সব তাদের অনুপস্থিত: যে যেমন সীমা শূন্য এরn>mn=6mn1×n1m1×m11md(1md)n nn

(4) এই সমস্ত অ্যাপসিলন একটি প্রমাণের জন্য ভাল তবে আপনার অন্তর্দৃষ্টির জন্য দুর্দান্ত নয়। সুতরাং এখানে বেশ কয়েকটি ছবি এবং নমুনা পয়েন্ট চিত্রিত করছে, বৃহত্তম খালি আয়তক্ষেত্রাকার অঞ্চলটি হাইলাইট করা হয়েছে। (গ্রিড গ্রিড স্যাম্পলিং LHS আছে - "nanocuboids" তার আগে উল্লেখ করা।) এটি হবে "সুস্পষ্ট" (কিছু অস্পষ্ট স্বজ্ঞাত অর্থে) যে বৃহত্তম খালি এলাকায় নমুনা বিন্দুর সংখ্যা হিসাবে ইচ্ছামত ছোট আকার সঙ্কুচিত হওয়া উচিত ।n=10n=50n

এখানে চিত্র বর্ণনা লিখুন


এই যুক্তিটি কোনও সাধারণ বিরতি ধরে রাখে? পরিবর্তে ? [0,1)

হ্যাঁ, কোনও সীমাবদ্ধ মাত্রার জন্য। এখনই স্পষ্ট হওয়া উচিত যে আমি প্রমাণটি ঠিক করেছি।
ক্রেওসোট

এই প্রমাণের কোনও 1-ডি বা এমনকি 2-ডি ছবি দেওয়া সম্ভব? আমি এতে বেশ হারিয়ে গেছি।

সম্পন্ন. প্রয়োজনে আরও প্রশ্ন নিতে পেরে খুশি।
ক্রেওসোট 23

অান্তরিক ধন্যবাদ! এটি অবশ্যই অন্তর্দৃষ্টি দিয়ে এখন সাহায্য করে।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.