আদর্শে ঘনিষ্ঠতা পরীক্ষা করার জন্য কম আবদ্ধ ?


11

আমি ভাবছিলাম যে নীচের সমস্যার জন্য পরিচিত কোনও নিম্ন সীমাবদ্ধ (নমুনা জটিলতার ক্ষেত্রে) ছিল:

, পরীক্ষা (whp) তে দুটি অজানা বিতরণ , তে নমুনা ওরাকল অ্যাক্সেস দেওয়া হয়েছেD1D2{1,,n}

  • D1=D2
  • বাd2(D1,D2)=D1D22=i=1n(D1(i)D2(i))2ϵ

বাতু ইত্যাদি। [বিএফআর +00] দেখিয়েছেন যে O(1ϵ4) নমুনাগুলি যথেষ্ট ছিল, তবে আমি নীচের গণ্ডির কোনও উল্লেখ পাইনি?

আমি গণনা করি যে কোনও ব্যক্তি সর্বদা একটি "ওমেগা (\ frac {1} {ps psপিসিলন 2 2}) দেখিয়ে দেখতে পারেন এই সমস্যাটির Ω(1ϵ2)তুলনায় ন্যায্য বনাম ϵ এপসিলন- ভিত্তিক কয়েনটি আলাদা করার কাজটি (কেবলমাত্র দুটিতে সমর্থিত একটি বিতরণ সিমুলেট করে) আইড কয়েন টসস অনুসারে পরীক্ষকের প্রশ্নের উত্তরগুলি দেওয়া, এবং এটি এখনও একটি চতুর্ভুজ ফাঁক ছেড়ে দেয় ...

(অন্য বিন্দু আমি আগ্রহী হতে চাই একটি নিম্ন বাঁধা আনুমানিক হিসাব একটি যুত (আপ ϵ ) এই L2 দূরত্ব - আবার, আমি সাহিত্যে যেমন ফলাফলের কোন রেফারেন্স পাওয়া যায়)

আপনার সাহায্যের জন্য ধন্যবাদ,


এই প্রতিশ্রুতি সমস্যাটি সহাই এবং বধনের দ্বারা পরিসংখ্যানগত পার্থক্য বলা একটির সাথে খুব মিল বলে মনে হচ্ছে , যা এসজেডকে (পরিসংখ্যান শূন্য জ্ঞান) শ্রেণির জন্য সম্পূর্ণ সমস্যা; তবে, তারা দূরত্ব ব্যবহার করে । cs.ucla.edu/~sahai/work/web/2003%20 প্রজাতন্ত্র / জেএএসিএম2003 . pdf । (সম্পাদনা: এছাড়াও আমি মনে করি তারা আপনি একটি বর্তনী কম্পিউটিং ডিস্ট্রিবিউশন, না ওরাকল এক্সেস আছে অভিমানী হয়।)L1
উসূল

হাই, যেমন অন্য মন্তব্যে উল্লেখ করা হয়েছে, এর মধ্যে পার্থক্য এবং আদর্শ আসলে এখানে অত্যন্ত গুরুত্বপূর্ণ - আরও থার কাগজে, তারা একটি সুনির্দিষ্ট (এবং নির্বিচারে নয়) থ্রেশহোল্ড সেট আপ , মন্তব্য এক ( তারা ব্যাখ্যা করে যে এই প্রান্তিকের কিছু নির্দিষ্ট বাধা মেটাতে হবে); এবং বনাম (যা "স্বাভাবিক টেস্টিং" এর তুলনায় সহনশীল পরীক্ষা / দূরত্বের অনুমানের একরকম কাছাকাছি, যেখানে আপনি বনাম পরীক্ষা করতে চান) (তবে কোনও স্থির ))। এল 1 τ = 1 / 3 1τ 21 - τ 2 = 0 2ε εL2L1τ=1/3d1τd21τd2=0d2ϵϵ
ক্লিমেন্ট সি

উত্তর:


6

এটি প্রদর্শিত হয় যে নমুনাগুলি - যেমন usul নীচে দেখিয়েছেন - পরীক্ষার জন্য যথেষ্ট, যাতে নমুনা জটিলতা হ'ল ; আসলে এটি জন্য নমুনা আমাদের যথেষ্ট এমনকি এই নম্বরে সক্রিয় আউট শেখার একটি যুত পর্যন্ত wrt আদর্শ।Θ ( 1 / ϵ 2 ) ডি ϵ এল 2O(1/ϵ2)Θ(1/ϵ2) DϵL2


যাক গবেষণামূলক ঘনত্ব অঙ্কন দ্বারা প্রাপ্ত ফাংশন হবে IID নমুনা এবং সেটিং তারপরে যেখানে । এমগুলি1,...,গুলিমি~ডি ডি ()D^ms1,,smDডি - ডি2 2

D^(k)=def1m=1m1{s=k},k[n]
এক্সকে
DD^22=k=1n(1m=1m1{s=k}D(k))2=1m2k=1n(=1m1{s=k}mD(k))2=1m2k=1n(XkEXk)2
এক্স[এন]ডি - ডি2 2Xk=def=1m1{s=k}Bin(m,D(k))Xkএর ( ) স্বতন্ত্র নয়, তবে আমরা লিখতে পারি যাতে , এবং মার্কভের অসমতার প্রয়োগ k[n] মি3
EDD^22=1m2k=1nE[(XkEXk)2]=1m2k=1nVarXk=1m2k=1nmD(k)(1D(k))1mk=1nD(k)=1m
ডি - ডি 2 2ε2m3ϵ2 পি{ডি - ডি2ε}1
EDD^22ϵ23
P{DD^2ϵ}13.

(আমি উসুলের উত্তরের সাথে উল্লেখ করে বলছিলাম "আমি বিপরীত কিছু [[]]" দেখিয়ে আমার পূর্ববর্তী ত্রুটির জন্য প্রায়শ্চিত্ত করার চেষ্টা করব - যা আসলে এটির থেকে উপরে I আমি এটি আশা করি নি :)) শেখার ক্ষেত্রে উপরের আবদ্ধ, এটি দেখানো যেতে পারে যে সর্বাধিক নিষ্পাপ অ্যালগরিদম (যা নমুনাগুলি আঁকেন এবং এই সংজ্ঞায়িত বৌদ্ধিক ঘনত্বকে আউটপুট দেয়) একটি বিতরণ যা ধ্রুব সম্ভাব্যতা সঙ্গে, হয়, -close করার মধ্যে দূরত্ব। ডি ε ডি এল 2m=O(1/ϵ2)D^ϵDL2
ক্লিমেন্ট সি

@ ডিডাব্লু আমি কেবল আমার উত্তরটি সম্পাদনা করেছি।
ক্লিমেন্ট সি

3

আমি বিপরীত কিছু দেখিয়ে আমার পূর্ববর্তী ত্রুটির জন্য প্রায়শ্চিত্ত করার চেষ্টা করব - যে নমুনাগুলি যথেষ্ট ( of এর নীচের সীমানা) প্রায় টাইট)! আপনি কি মনে করেন দেখুন ...1/ϵ2Θ~(1ϵ2)1/ϵ2

মূল স্বজ্ঞাত দুটি পর্যবেক্ষণ থেকে শুরু হয়। প্রথমত, ডিস্ট্রিবিউশন অর্ডারে একটি আছে যাতে দূরত্ব , সেখানে উচ্চ সম্ভাবনা সঙ্গে পয়েন্ট হতে হবে ( )। উদাহরণস্বরূপ, যদি আমাদের সম্ভাবনার পয়েন্ট থাকে , আমাদের । ε Ω ( ε 2 ) 1 / ε 3 ε 3ডি 1 - ডি 2 2L2ϵΩ(ϵ2)1/ϵ3ϵ3D1D221ϵ3(ϵ3)2=ϵ3/2<ϵ

দ্বিতীয়ত, একটি সঙ্গে অভিন্ন ডিস্ট্রিবিউশন বিবেচনা দূরত্ব । আমাদের যদি সম্ভাব্যতা এর পয়েন্ট থাকে তবে সেগুলি প্রতিটি দ্বারা পৃথক হবে এবং নমুনা যথেষ্ট would অন্যদিকে, যদি আমাদের পয়েন্ট থাকে তবে তাদের প্রত্যেকের এবং আবার নমুনাগুলি (প্রতি স্থির সংখ্যা হিসাবে পৃথক হওয়া প্রয়োজন পয়েন্ট) যথেষ্ট। সুতরাং আমরা আশা করতে পারি যে, পূর্বে উল্লিখিত উচ্চ-সম্ভাবনা পয়েন্টগুলির মধ্যে সর্বদা কিছুটা পয়েন্ট "যথেষ্ট" যা আঁকেন তা আলাদা করে রাখে। ϵ ( 1 ) ( 1 ) ( ϵ ) 1 / ϵ 2( 1 / ϵ 2 ) ( ϵ 2 ) ( 1 / ϵ 2 ) ( 1 / ϵ 2 )L2ϵO(1)O(1)O(ϵ)1/ϵ2O(1/ϵ2)O(ϵ2)O(1/ϵ2)O(1/ϵ2)

অ্যালগরিদম। প্রদত্ত এবং পরামিতি একটি কনফিডেন্স যাক । প্রতিটি বিতরণ থেকে নমুনা আঁকুন । যাক নিজ নিজ উচ্চতর, পয়েন্টের জন্য নমুনা নিচের সংখ্যা হতে । যদি কোনো বিন্দু , যার জন্য এবং , ঘোষণা বিতরণ ভিন্ন। অন্যথায়, তাদের একই ঘোষণা করুন।এম এক্স = এম লগ ( 1 / ε 2 ) এক্সϵMX=Mlog(1/ϵ2) ai,biii[n]aiXXϵ2ai,biii[n] একটিআমি-আমিaiX8aibiaiX4

নির্ভুলতা এবং আত্মবিশ্বাসের সীমা ( ) নিম্নলিখিত লিমাটির উপর নির্ভর করে যা বলে যে দুরত্বের সমস্ত বিচ্যুতি এমন পয়েন্ট থেকে আসে যার সম্ভাবনাগুলি দ্বারা পৃথক হয় । এল 2 Ω ( ϵ 2 )1eΩ(M)L2Ω(ϵ2)

দাবি করুন। ধরুন । আসুন। যাক । তারপরে δ i = | | ডি 1 ( i ) - ডি 2 ( i ) | এস কে = { আই : δ আই > ϵ 2D1D22ϵδi=|D1(i)D2(i)|আই এস কে δ 2 আইϵ2(1-2Sk={i:δi>ϵ2k}

iSkδi2ϵ2(12k).

প্রুফ । আমরা আশা করি আপনি আসুন দ্বিতীয় যোগফলটি আবদ্ধ করি; আমরা সাপেক্ষে । ফাংশন যেহেতু কঠোরভাবে উত্তল এবং ক্রমবর্ধমান, আমরা কোনো গ্রহণ করে উদ্দেশ্য বৃদ্ধি করতে পারেন এবং বৃদ্ধি দ্বারা যখন কমছে দ্বারা । সুতরাং, উদ্দেশ্যটি তাদের সর্বোচ্চ মানগুলিতে যতগুলি সম্ভব শর্তাবলীর সাথে সর্বাধিক করা হবে এবং বাকীটিΣ আমি এস δ 2 আমি Σ আমি এস δআমি2এক্সএক্স2δআমিδδআমিγδγ0 ε 2

iSkδi2 + iSkδi2ϵ2.
iSkδi2iSkδi2xx2δiδjδiγδjγ0। প্রতিটি পদটির সর্বাধিক মান হ'ল , এবং এই মানটির সর্বাধিক পদ রয়েছে (যেহেতু তারা সর্বাধিক সমষ্টি )। সুতরাং 2কেϵ2k 2iএসকেδ 2 আই2কে2kϵ22
iSkδi22kϵ2(ϵ2k)2=2ϵ2k.    

দাবি । যাক । যদি থাকে তবে কমপক্ষে একটি পয়েন্ট থাকতে পারে এবং ।ডি 1 - ডি 2 2ϵ আই [ n ] পি i > ϵ 2pi=max{D1(i),D2(i)}D1D22ϵi[n] δআমিϵpi>ϵ24δiϵpi2

প্রুফ । প্রথমত, এ সব পয়েন্ট আছে সংজ্ঞা দ্বারা (এবং না করার জন্য খালি হতে পারে পূর্ববর্তী দাবি দ্বারা)।পি iδ i > ϵ 2Sk এসকেকে>2piδi>ϵ2kSkk>2

দ্বিতীয়ত, কারণ , আমাদের বা, পুনরায় সাজানো, সুতরাং অসমতা কমপক্ষে একটি পয়েন্ট ধরে রাখে । এখন বাছাই করুন । i এস কে δ 2 আইϵ 2 ( 1ipi2আইএসকে(δ 2 আই -পিআইϵ2(1

iSkδi2ϵ2(121k)iSkpi,
δ2আমিপিআইϵ2(1
iSk(δi2piϵ2(121k))0,
এসকেকে=4
δi2piϵ2(121k)
Skk=4

দাবি (মিথ্যা ধনাত্মক) । তাহলে , আমাদের এলগরিদম তাদের সর্বাধিক সম্ভাবনা সঙ্গে বিভিন্ন ঘোষণা ।- Ω ( এম )D1=D2eΩ(M)

স্কেচ । দুটি ক্ষেত্রে বিবেচনা করুন: এবং । প্রথম ক্ষেত্রে, এর নমুনার সংখ্যা উভয়ই বিতরণ থেকে ছাড়িয়ে যাবে না : নমুনাগুলির গড় সংখ্যা এবং একটি লেজ আবদ্ধ বলে যে সম্ভাবনার সাথে , নমুনাগুলি একটি অ্যাডেটিভ দ্বারা তাদের গড়ের অতিক্রম করে না ; যদি আমরা মানটি বজায় রাখতে সাবধান হন , তবে আমরা এ জাতীয় কয়েকটি পয়েন্ট নির্ধারণ না করেই তাদের উপর বেঁধে রাখতে পারি (স্বজ্ঞাতভাবে, সম্ভাব্য পয়েন্টগুলির সংখ্যায় সীমাটি তাত্পর্যপূর্ণভাবে হ্রাস পায়)।পি আমিε 2 / 16 আমি এক্স / 8 < এক্স / 16 - Ω ( এক্স / পি আমি ) = ε 2 - Ω ( এম / পি আমি ) আমি এক্স / 16 পি আমিpi<ϵ2/16piϵ2/16iX/8<X/16eΩ(X/pi)=ϵ2eΩ(M/pi)iX/16pi

ক্ষেত্রে , আমরা একটি চেরনফ বাউন্ড ব্যবহার করতে পারি: এটি বলে যে, যখন আমরা নমুনা নিই এবং সম্ভাব্য দিয়ে একটি বিন্দু হয় তখন দ্বারা তার গড় থেকে আলাদা হওয়ার সম্ভাবনা থাকে সর্বাধিক হয় । এখানে, দিন তাই সম্ভাব্যতা দ্বারা বেষ্টিত, ।মি পি পি এম সি piϵ2/16mppm - Ω ( ( সি √)cpmসি= √ √eΩ((cpm)2/pm)=eΩ(c2)-Ω(এক্স)=ϵ2-Ω(এম)c=X16eΩ(X)=ϵ2eΩ(M)

সুতরাং সম্ভাবনা সঙ্গে , (উভয় ডিস্ট্রিবিউশন) নমুনা সংখ্যা মধ্যে তার গড় । সুতরাং, আমাদের পরীক্ষা এই পয়েন্টগুলি ধরবে না (এগুলি একে অপরের খুব কাছাকাছি), এবং আমরা সেগুলির মধ্যে সমস্ত over আবদ্ধ করতে পারি। আই 1ϵ2eΩ(M)i পিআইএক্সpiXϵ2X16 16/ε2piXϵ216/ϵ2

দাবি (মিথ্যা নেতিবাচক) । তাহলে , আমাদের এলগরিদম তাদের সর্বাধিক সম্ভাবনা সঙ্গে অভিন্ন ঘোষণা ।ϵ 2 - Ω ( এম )D1D22ϵϵ2eΩ(M)

স্কেচ । এবং সাথে কিছু পয়েন্ট রয়েছে । আগের দাবির মতো আবদ্ধ একই চেরনোফ বলে যে সম্ভাবনার সাথে with , নমুনার সংখ্যাটি তার গড় থেকে সর্বাধিক । এটি (ডাব্লুএলজি) বিতরণ যা ; তবে ডিস্ট্রিবিউশন থেকে এর নমুনার সংখ্যার আরও কম সম্ভাবনা রয়েছেপি আমি > ε 2 / 4 δ আমিε ipi>ϵ2/41-ϵ2-Ω(এম)আমিপিiএমδiϵpi/21ϵ2eΩ(M)ipim 1পিi=ডি1(আই)=ডি2(আই)+δiআমি2pimX161pi=D1(i)=D2(i)+δii2 এই অ্যাডিটিভ পরিমাণের দ্বারা এর গড় থেকে পৃথক হওয়া (হিসাবে গড় এবং ভিন্নতা কম)।

সুতরাং উচ্চ সম্ভাবনার সাথে প্রতিটি বন্টন থেকে এর নমুনার সংখ্যাটি তার গড়ের মধ্যে রয়েছে; তবে তাদের সম্ভাবনাগুলি দ্বারা পৃথক , সুতরাং তাদের উপায়গুলি i δiএক্সpiXϵ2X16δi

Xϵ2δiXpi2ϵ=piXϵ2X2.

তাই উচ্চ সম্ভাবনা সঙ্গে, পয়েন্টের জন্য , অন্তত দ্বারা নমুনার পৃথক সংখ্যা । i#samples(1)X4

স্কেচ সম্পূর্ণ করার জন্য, আমরা আরো অক্ষরে অক্ষরে যে দেখানোর জন্য প্রয়োজন হবে, জন্য বড় যথেষ্ট, নমুনা সংখ্যা তার গড় পাসে যথেষ্ট যে, যখন আলগোরিদিম ব্যবহার করে বদলে , এটি কিছু পরিবর্তন করে না (যা ধ্রুবকগুলিতে কিছু উইগল রুম রেখে সোজা হওয়া উচিত)।আমি Mi#samplesmean


হাই, এর জন্য ধন্যবাদ - আমার কাছে অ্যালগরিদম এবং বিশ্লেষণ সম্পর্কে কয়েকটি প্রশ্ন রয়েছে (কয়েকটি বিষয় সম্পর্কে আমি নিশ্চিত হওয়ার বিষয়ে নিশ্চিত নই): ধরে নিচ্ছি যে আমি কেবল শেষের সাফল্যের একটি স্থির সম্ভাবনা , তার মানে এই ধ্রুবক, আমি যদি সঠিকভাবে বুঝতে পারি (যদি না কী না পাই তবে )? সুতরাং এক্ষেত্রে পরিণত হওয়া : অ্যালগরিদম অনুসারে, এটি - এটি কি সঠিক? এম এম এক্স Θ ( লগ 12/3MMXΘ(log1ϵ)
ক্লিমেন্ট সি

@ClementC। দুঃখিত আমি খুব পরিষ্কার ছিল না! দাবিটি হ'ল আমরা যদি নমুনাগুলি , তবে ভুল হওয়ার সম্ভাবনা হ'ল , সুতরাং ভুল হওয়ার স্থির সম্ভাবনা, এর নমুনা। হে(-এম)হে(11ϵ2Mlog(1/ϵ2)O(eM)O(1ϵ2log(1/ϵ2))
usul

ঠিক আছে, আমি একত্রিত এটি। আমি এই বিষয়টি মনে রেখে প্রমাণটি দিয়ে যাব - আপনি যা ব্যয় করেছেন তার জন্য আবারও ধন্যবাদ!
ক্লিমেন্ট সি

1

আপনি সমাধান করার চেষ্টা করে এটি শুরু করতে পারেন । আমি নিশ্চিত যে স্যাম্পলগুলি প্রয়োজনীয় এবং পর্যাপ্ত হবে।Θ ( 1 / ϵ 2 )n=2Θ(1/ϵ2)

এটা আপনি এটা মধ্যে রূপান্তর তাকান সহায়ক হতে পারে সম্ভব দূরত্ব এবং দূরত্ব (মোট প্রকরণ দূরত্ব)।এল 1L2L1

  • এটি জানা যায় যে, একটি নমুনা সহ, যদি বিতরণগুলি পরিচিত হয়, মোট বৈচিত্রের দূরত্বটি পুরোপুরি সেই সুবিধার বৈশিষ্ট্যটিকে চিহ্নিত করে যার সাহায্যে কেউ কে থেকে আলাদা করতে পারে । সুতরাং, যদি মোট প্রকরণের দূরত্ব বড় হয় এবং বিতরণগুলি জানা যায়, তবে একটি উচ্চতর সম্ভাবনার সাথে সঠিক এমন একটি পরীক্ষা তৈরি করতে পারে; মোট প্রকরণের দূরত্ব যদি ছোট হয় তবে কেউ তা করতে পারে না। আমি জানি না যে কেসটিতে মোট বৈচিত্রের দূরত্ব বড় তবে কেটি সম্পর্কে বিতরণ করা যায় তা অজানা।D1D2

  • এরপরে আপনি পণ্য বিতরণ, এবং । মোট প্রকরণের দূরত্ব ( দূরত্ব) ব্যবহার করে , এমন কোনও ভাল সীমানা বলে মনে হচ্ছে না যা থেকে । তবে, দূরত্ব ব্যবহার করার সময় , আমি বিশ্বাস করি যে ফাংশন হিসাবে এর ভাল অনুমান রয়েছে । (দুর্ভাগ্যবশত, আমি, যারা অনুমান / সীমা করার জন্য একটি নির্দিষ্ট রেফারেন্স খনন মনে করতে পারে না তাই আমি আশা করি আমি misremembering করছি না।) এছাড়াও রয়েছে পরিচিত সীমা যে আপনার নির্ণয় করার অনুমতি দিন এর কার্যকারিতা হিসেবে দূরত্ব দূরত্ব । ডি এন 2D1nD2nL1||D1nD2n||1||D1D2||1L2||D1nD2n||2||D1D2||2L1L2

  • অতএব, আপনি যে পদ্ধতির চেষ্টা করতে পারেন তা অবশ্যই বাঁধতে হবে , তারপরে সেই সীমাবদ্ধতা থেকে ।||D1nD2n||2||D1nD2n||1

আমি জানি না যে এটি কোথাও ভাল বা না নেতৃত্ব দেবে কিনা; এটা শুধু একটি ধারণা। সম্ভবত আপনি যে কাগজটি উদ্ধৃত করেছেন তার লেখকরা এরই মধ্যে কিছু চেষ্টা করে দেখেছেন বা বিবেচনা করেছেন।

সম্ভবত সহায়ক তথ্যসূত্র:


হাই, আপনার উত্তরের জন্য ধন্যবাদ! যাইহোক, আমি একটি মধ্যে asymptotic আগ্রহী আবদ্ধ লোয়ার, যখন । বিশেষ করে, মধ্যে সম্পর্ক এবং নিয়ম একটি জড়িত ফ্যাক্টর - অর্থাত তারা প্রকৃতপক্ষে জন্য সমতুল্য ধ্রুব কিন্তু এসিম্পটোটিকভাবে ভিন্ন; ডিস্ট্যান্সকে প্রক্সি হিসাবে ব্যবহার করা কোনও বিকল্প নয়, যতদূর আমি বলতে পারি ( দূরত্বের ঘনিষ্ঠতার পরীক্ষা করার জন্য , সঠিক জটিলতাটি ps এপসিলন )] [বিএফআর + 10 , ভাল 11 ]nL2L1nnL1L1Θ(n2/3/poly(ϵ))
ক্লিমেন্ট সি

0

সম্পাদনা: এটি ভুল! মন্তব্যগুলিতে আলোচনাটি দেখুন - আমি নীচের ত্রুটিগুলি নির্দেশ করব।

আমি মনে করি আমরা বলতে পারি যে প্রয়োজন।1ϵ4

সেট করুন । যাক অভিন্ন বন্টন হতে (প্রতিটি বিন্দু সম্ভাবনা ) এবং দিন একটি যুত পরিমাণ দ্বারা অভিন্ন থেকে পৃথক প্রতিটি বিন্দুতে। পরীক্ষা করে দেখুন যে দূরত্ব ।n=Θ(1ϵ2)D1=Θ(ϵ2)D2±Θ(ϵ2)L2ϵ

সুতরাং আমাদের একটি পার্শ্বযুক্ত ফেয়ার কয়েনটি একটি পার্শ্বযুক্ত ta -ভিত্তিক মুদ্রার থেকে আলাদা করতে হবে । আমি মনে করি এটা হার্ড হিসাবে অন্তত একটি কহন যেমন হওয়া উচিত A থেকে পার্শ্বযুক্ত ন্যায্য মুদ্রা পার্শ্বযুক্ত -biased মুদ্রা, যা করতে হবে নমুনা। সম্পাদনা: এটি ভুল! মুদ্রাটি additively ভিত্তিক, তবে এটি একটি ধ্রুবক ফ্যাক্টর দ্বারা গুণকভাবে পক্ষপাতী হয়। ডিডাব্লু নির্দেশ করে যে, এর অর্থ বিন্দুতে ধ্রুবক নমুনাগুলি কে থেকে ।nnΘ(ϵ2)22Θ(ϵ2)Θ(1(ϵ2)2)=Θ(1ϵ4)ϵ2D1D2


লক্ষ্য করুন যে argument যতদূর আমরা আর্গুমেন্টের এই লাইনটিকে এগিয়ে নিতে পারি। Concretely, ধরুন আমরা বৃদ্ধি করার চেষ্টা , বলে, । অভিন্ন বিতরণে, প্রতিটি পয়েন্টের সম্ভাবনা থাকে । কিন্তু এ , আমরা দ্বারা অভিন্ন থেকে পৃথক হতে প্রতিটি বিন্দু প্রয়োজন চাই । থেকে এটি সম্ভব নয় ।1ϵ4n1ϵ3ϵ3D2ϵ2.5ϵ2.5ϵ3

আরও বিমূর্তভাবে, ধরুন আমরা প্রতিটি পয়েন্ট uniform দ্বারা ইউনিফর্মের চেয়ে আলাদা হতে চাই । তারপর সবচেয়ে আমরা সেট করতে পারেন হতে হবে । একটি দূরত্ব পেতে , আমাদের সন্তুষ্ট করতে হবে যে দূরত্বগুলির যোগফলের , সুতরাং , তাই তাই , এবং আমরা পেতে ।ϵkn1ϵkL2ϵϵn(ϵk)2=ϵϵk/2=ϵk=2n=1ϵ2

এছাড়াও, আমি মনে করি একই যুক্তিটি বলছে যে, আমরা যদি সাথে দূরত্বে আগ্রহী , আমাদের require প্রয়োজন , তাই আমরা pick পছন্দ করব , তাই নমুনার সংখ্যা হবে। আমি মনে করি এটি চেয়ে আলাদা এমন একটি বাউন্ড হিসাবে উপলব্ধি করে । এটি হিসাবে অনন্তের কাছে পৌঁছে । আপনি দুটি ডিস্ট্রিবিউশন পার্থক্য করতে চেষ্টা করি তবে দূরত্ব উপর আবদ্ধ সঙ্গে , আমি করতে হবে unboundedly বৃহৎ এবং পার্থক্য ছড়িয়ে ইচ্ছামত পাতলা, তাই আপনি সেগুলির পার্থক্য না পারে (Lpp>1k=pp1n=1/ϵpp11/ϵ2pp1np1L1ϵnnঅর্থাত্ সমস্ত জন্য কোনও নির্দিষ্ট সংখ্যার নমুনা নেই । এটি হিসাবে কাছেও পৌঁছে ; এটি একটি আবদ্ধ হিসাবে অর্থবোধ করে কারণ, আদর্শের জন্য আমরা set নির্ধারণ করতে পারি এবং প্রতিটি পয়েন্টকে দ্বারা পৃথক করা যাক ; ইউনিফর্ম থেকে আলাদা কিনা তা নিশ্চিত হওয়ার জন্য আমাদের কিছু বিন্দু বার নমুনা করতে হবে, যা নমুনাগুলি গ্রহণ করবে।n1ϵ3pLn=1ϵΘ(ϵ)1ϵ21ϵ3


১. আপনি কি সত্যিই বোঝাতে চেয়েছেন যে প্রতিটি পয়েন্টে দ্বারা ইউনিফর্ম থেকে পৃথক হয় ? আমি সন্দেহ করি যে এটি একটি টাইপো এবং আপনি বোঝাতে চেয়েছিলেন । । D2±1/ϵ2±ϵ2
ডিডাব্লু

1
2. আমি কিনতে না যে পার্থক্য থেকে প্রয়োজন নমুনা। আমার কাছে দেখে মনে হচ্ছে নমুনা যথেষ্ট। ব্যাখ্যা (অন্তর্দৃষ্টি): ধরুন আমরা নমুনা সংগ্রহ করি এবং প্রতিটি সম্ভাব্য মান কতবার ঘটে তা গণনা করি। যদি তারা থেকে আসে তবে প্রত্যেকটি 100 বার হওয়া উচিত ( 10 সহ)। যদি তারা থেকে আসে তবে প্রতিটি তাদের অর্ধেকের জন্য 200 বার ( ডেভ 14) হওয়া উচিত, অন্য অর্ধের জন্য / 0 বার (স্ট্যান্ড ডেভ 0) should দু'জনের মধ্যে পার্থক্য করার জন্য এটি কেবলমাত্র যথেষ্ট, যদি আপনি জানেন যে আপনি বা সাথে সাথে কাজ করছেন । D1D21/ϵ4Θ(1/ϵ2)m=100/ϵ2D1D2D1D2
ডিডাব্লু

@DW (1) আপনি ঠিক বলেছেন! সংশোধন করা হয়েছে। (২) আপনি যেমন রেখেছেন, আমি তাতে সম্মতি দিচ্ছি, তবে আমি মনে করি বিভিন্ন ধরণের ধরণের ধরণের পছন্দ আরও কঠিন। আমি এর মতো কিছু চিত্রিত করছি: , সুতরাং প্রতিটি বিন্দুতে সম্ভাব্যতা রাখে । তারপরে প্রতিটি বিন্দুতে দ্বারা পৃথক হয় (পরীক্ষা করুন যে দূরত্বটি )), সুতরাং এটি প্রতিটি পয়েন্টে সম্ভাব্যতা বা রাখে। n=1/100ϵ2D1100ϵ2D210ϵ2L2ϵ90ϵ2110ϵ2
usul

1
আমি মনে করি নমুনাগুলি এখনও যথেষ্ট। জড়ো নমুনা, এবং গণনা কতবার প্রতিটি সম্ভাব্য মান ঘটে। জন্য , প্রতিটি 1,000,000 বার (এসটিডি দেব ঘটা উচিত )। জন্য , প্রতিটি 900,000 বার (এসটিডি দেব ঘটা উচিত ) অথবা 1.100.000 বার (এসটিডি দেব )। এটি সহজেই দুজনের মধ্যে পার্থক্য করার পক্ষে যথেষ্ট, যদি আমরা জানি যে আমরা বা নিয়ে কাজ করছি , কারণ 1,000,000 এবং 1,100,000 এর মধ্যে পার্থক্যটি 100 মানক বিচ্যুতি, অর্থাৎ বিশাল। মি = 10 6 এন ডি 1 1000 ডি 21000 1000 ডি 1 ডি 2O(1/ϵ2)m=106nD11000D210001000D1D2
DW

@ ডিডাব্লু আমি এ সম্পর্কে আরও ভেবেছি - আপনি ঠিক বলেছেন। যদি তাদের মাধ্যমগুলি একটি ধ্রুবক গুণক কারণের দ্বারা পৃথক হয় তবে প্রতি বিন্দুতে ধ্রুব সংখ্যক নমুনাগুলি তাদের আলাদা করা উচিত। এটি গুরুত্বপূর্ণ গুণক নয়, যুক্তকারী উপাদান। এই পদ্ধতির পরে কেবল এর নিম্ন । 1/ϵ2
usul
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.