আমি বিপরীত কিছু দেখিয়ে আমার পূর্ববর্তী ত্রুটির জন্য প্রায়শ্চিত্ত করার চেষ্টা করব - যে নমুনাগুলি যথেষ্ট ( of এর নীচের সীমানা) প্রায় টাইট)! আপনি কি মনে করেন দেখুন ...1/ϵ2Θ~( ঘε2)1 / ε2
মূল স্বজ্ঞাত দুটি পর্যবেক্ষণ থেকে শুরু হয়। প্রথমত, ডিস্ট্রিবিউশন অর্ডারে একটি আছে যাতে দূরত্ব , সেখানে উচ্চ সম্ভাবনা সঙ্গে পয়েন্ট হতে হবে ( )। উদাহরণস্বরূপ, যদি আমাদের সম্ভাবনার পয়েন্ট থাকে , আমাদের । ε Ω ( ε 2 ) 1 / ε 3 ε 3 ‖ ডি 1 - ডি 2 ‖ 2 ≤ √এল2εΩ ( ϵ)2)1 / ε3ϵ3∥D1−D2∥2≤1ϵ3(ϵ3)2−−−−−−√=ϵ3/2<ϵ
দ্বিতীয়ত, একটি সঙ্গে অভিন্ন ডিস্ট্রিবিউশন বিবেচনা দূরত্ব । আমাদের যদি সম্ভাব্যতা এর পয়েন্ট থাকে তবে সেগুলি প্রতিটি দ্বারা পৃথক হবে এবং নমুনা যথেষ্ট would অন্যদিকে, যদি আমাদের পয়েন্ট থাকে তবে তাদের প্রত্যেকের এবং আবার নমুনাগুলি (প্রতি স্থির সংখ্যা হিসাবে পৃথক হওয়া প্রয়োজন পয়েন্ট) যথেষ্ট। সুতরাং আমরা আশা করতে পারি যে, পূর্বে উল্লিখিত উচ্চ-সম্ভাবনা পয়েন্টগুলির মধ্যে সর্বদা কিছুটা পয়েন্ট "যথেষ্ট" যা আঁকেন তা আলাদা করে রাখে। ϵ ও ( 1 ) ও ( 1 ) ও ( ϵ ) 1 / ϵ 2 ও ( 1 / ϵ 2 ) ও ( ϵ 2 ) ও ( 1 / ϵ 2 ) ও ( 1 / ϵ 2 )L2ϵO(1)O(1)O(ϵ)1/ϵ2O(1/ϵ2)O(ϵ2)O(1/ϵ2)O(1/ϵ2)
অ্যালগরিদম। প্রদত্ত এবং পরামিতি একটি কনফিডেন্স যাক । প্রতিটি বিতরণ থেকে নমুনা আঁকুন । যাক নিজ নিজ উচ্চতর, পয়েন্টের জন্য নমুনা নিচের সংখ্যা হতে । যদি কোনো বিন্দু , যার জন্য এবং , ঘোষণা বিতরণ ভিন্ন। অন্যথায়, তাদের একই ঘোষণা করুন।এম এক্স = এম লগ ( 1 / ε 2 ) এক্সϵMX=Mlog(1/ϵ2) ai,biii∈[n]ai≥XXϵ2ai,biii∈[n] একটিআমি-খআমি≥√ai≥X8ai−bi≥ai−−√X√4
নির্ভুলতা এবং আত্মবিশ্বাসের সীমা ( ) নিম্নলিখিত লিমাটির উপর নির্ভর করে যা বলে যে দুরত্বের সমস্ত বিচ্যুতি এমন পয়েন্ট থেকে আসে যার সম্ভাবনাগুলি দ্বারা পৃথক হয় । এল 2 Ω ( ϵ 2 )1−e−Ω(M)L2Ω(ϵ2)
দাবি করুন। ধরুন । আসুন। যাক । তারপরে
δ i = | | ডি 1 ( i ) - ডি 2 ( i ) | এস কে = { আই : δ আই > ϵ 2∥D1−D2∥2≥ϵδi=|D1(i)−D2(i)|∑আই∈ এস কে δ 2 আই ≥ϵ2(1-2Sk={i:δi>ϵ2k}
∑i∈Skδ2i≥ϵ2(1−2k).
প্রুফ । আমরা আশা করি আপনি
আসুন দ্বিতীয় যোগফলটি আবদ্ধ করি; আমরা সাপেক্ষে । ফাংশন যেহেতু কঠোরভাবে উত্তল এবং ক্রমবর্ধমান, আমরা কোনো গ্রহণ করে উদ্দেশ্য বৃদ্ধি করতে পারেন এবং বৃদ্ধি দ্বারা যখন কমছে দ্বারা । সুতরাং, উদ্দেশ্যটি তাদের সর্বোচ্চ মানগুলিতে যতগুলি সম্ভব শর্তাবলীর সাথে সর্বাধিক করা হবে এবং বাকীটিΣ আমি ∉ এস ট δ 2 আমি Σ আমি ∉ এস ট δআমি≤2এক্স↦এক্স2δআমি≥δঞδআমিγδঞγ0 ε 2
∑i∈Skδ2i + ∑i∉Skδ2i≥ϵ2.
∑i∉Skδ2i∑i∉Skδi≤2x↦x2δi≥δjδiγδjγ0। প্রতিটি পদটির সর্বাধিক মান হ'ল , এবং এই মানটির সর্বাধিক পদ রয়েছে (যেহেতু তারা সর্বাধিক সমষ্টি )। সুতরাং
2কেϵ2k 2∑i∉এসকেδ 2 আই ≤2কে2kϵ22∑i∉Skδ2i≤2kϵ2(ϵ2k)2=2ϵ2k. □
দাবি । যাক । যদি থাকে তবে কমপক্ষে একটি পয়েন্ট থাকতে পারে এবং ।‖ ডি 1 - ডি 2 ‖ 2 ≥ ϵ আই ∈ [ n ] পি i > ϵ 2pi=max{D1(i),D2(i)}∥D1−D2∥2≥ϵi∈[n] δআমি≥ϵ √pi>ϵ24δi≥ϵpi√2
প্রুফ । প্রথমত, এ সব পয়েন্ট আছে সংজ্ঞা দ্বারা (এবং না করার জন্য খালি হতে পারে পূর্ববর্তী দাবি দ্বারা)।পি i ≥ δ i > ϵ 2Sk এসকেকে>2pi≥δi>ϵ2kSkk>2
দ্বিতীয়ত, কারণ , আমাদের
বা, পুনরায় সাজানো,
সুতরাং অসমতা
কমপক্ষে একটি পয়েন্ট ধরে রাখে । এখন বাছাই করুন । ∑ i ∈ এস কে δ 2 আই ≥ ϵ 2 ( 1∑ipi≤2∑আই∈এসকে(δ 2 আই -পিআইϵ2(1
∑i∈Skδ2i≥ϵ2(12−1k)∑i∈Skpi,
δ2আমি≥পিআইϵ2(1∑i∈Sk(δ2i−piϵ2(12−1k))≥0,
এসকেকে=4◻δ2i≥piϵ2(12−1k)
Skk=4□
দাবি (মিথ্যা ধনাত্মক) । তাহলে , আমাদের এলগরিদম তাদের সর্বাধিক সম্ভাবনা সঙ্গে বিভিন্ন ঘোষণা ।ই - Ω ( এম )D1=D2e−Ω(M)
স্কেচ । দুটি ক্ষেত্রে বিবেচনা করুন: এবং । প্রথম ক্ষেত্রে, এর নমুনার সংখ্যা উভয়ই বিতরণ থেকে ছাড়িয়ে যাবে না : নমুনাগুলির গড় সংখ্যা এবং একটি লেজ আবদ্ধ বলে যে সম্ভাবনার সাথে , নমুনাগুলি একটি অ্যাডেটিভ দ্বারা তাদের গড়ের অতিক্রম করে না ; যদি আমরা মানটি বজায় রাখতে সাবধান হন , তবে আমরা এ জাতীয় কয়েকটি পয়েন্ট নির্ধারণ না করেই তাদের উপর বেঁধে রাখতে পারি (স্বজ্ঞাতভাবে, সম্ভাব্য পয়েন্টগুলির সংখ্যায় সীমাটি তাত্পর্যপূর্ণভাবে হ্রাস পায়)।পি আমি ≥ ε 2 / 16 আমি এক্স / 8 < এক্স / 16 ই - Ω ( এক্স / পি আমি ) = ε 2 ই - Ω ( এম / পি আমি ) আমি এক্স / 16 পি আমিpi<ϵ2/16pi≥ϵ2/16iX/8<X/16e−Ω(X/pi)=ϵ2e−Ω(M/pi)iX/16pi
ক্ষেত্রে , আমরা একটি চেরনফ বাউন্ড ব্যবহার করতে পারি: এটি বলে যে, যখন আমরা নমুনা নিই এবং সম্ভাব্য দিয়ে একটি বিন্দু হয় তখন দ্বারা তার গড় থেকে আলাদা হওয়ার সম্ভাবনা থাকে সর্বাধিক হয় । এখানে, দিন তাই সম্ভাব্যতা দ্বারা বেষ্টিত, ।মি পি পি এম সি √pi≥ϵ2/16mppm ই - Ω ( ( সি √)cpm−−−√সি= √ √e−Ω((cpm√)2/pm)=e−Ω(c2) ই-Ω(এক্স)=ϵ2ই-Ω(এম)c=X√16e−Ω(X)=ϵ2e−Ω(M)
সুতরাং সম্ভাবনা সঙ্গে , (উভয় ডিস্ট্রিবিউশন) নমুনা সংখ্যা মধ্যে তার গড় । সুতরাং, আমাদের পরীক্ষা এই পয়েন্টগুলি ধরবে না (এগুলি একে অপরের খুব কাছাকাছি), এবং আমরা সেগুলির মধ্যে সমস্ত over আবদ্ধ করতে পারি। আই √1−ϵ2e−Ω(M)i পিআইএক্সpiXϵ2−−−−√X√16 16/ε2◻piXϵ216/ϵ2□
দাবি (মিথ্যা নেতিবাচক) । তাহলে , আমাদের এলগরিদম তাদের সর্বাধিক সম্ভাবনা সঙ্গে অভিন্ন ঘোষণা ।ϵ 2 ই - Ω ( এম )∥D1−D2∥2≥ϵϵ2e−Ω(M)
স্কেচ । এবং সাথে কিছু পয়েন্ট রয়েছে । আগের দাবির মতো আবদ্ধ একই চেরনোফ বলে যে সম্ভাবনার সাথে with , নমুনার সংখ্যাটি তার গড় থেকে সর্বাধিক । এটি (ডাব্লুএলজি) বিতরণ যা ; তবে ডিস্ট্রিবিউশন থেকে এর নমুনার সংখ্যার আরও কম সম্ভাবনা রয়েছেপি আমি > ε 2 / 4 δ আমি ≥ ε √ipi>ϵ2/41-ϵ2ই-Ω(এম)আমিপিiএম√δi≥ϵpi−−√/21−ϵ2e−Ω(M)ipim 1পিi=ডি1(আই)=ডি2(আই)+δiআমি2pim−−−√X√161pi=D1(i)=D2(i)+δii2 এই অ্যাডিটিভ পরিমাণের দ্বারা এর গড় থেকে পৃথক হওয়া (হিসাবে গড় এবং ভিন্নতা কম)।
সুতরাং উচ্চ সম্ভাবনার সাথে প্রতিটি বন্টন থেকে এর নমুনার সংখ্যাটি তার গড়ের মধ্যে রয়েছে; তবে তাদের সম্ভাবনাগুলি দ্বারা পৃথক , সুতরাং তাদের উপায়গুলি
√i δiএক্সpiXϵ2−−−√X√16δi
Xϵ2δi≥Xpi−−√2ϵ=piXϵ2−−−−√X−−√2.
তাই উচ্চ সম্ভাবনা সঙ্গে, পয়েন্টের জন্য , অন্তত দ্বারা নমুনার পৃথক সংখ্যা । √i ◻#samples(1)−−−−−−−−−−−√X√4□
স্কেচ সম্পূর্ণ করার জন্য, আমরা আরো অক্ষরে অক্ষরে যে দেখানোর জন্য প্রয়োজন হবে, জন্য বড় যথেষ্ট, নমুনা সংখ্যা তার গড় পাসে যথেষ্ট যে, যখন আলগোরিদিম ব্যবহার করে বদলে , এটি কিছু পরিবর্তন করে না (যা ধ্রুবকগুলিতে কিছু উইগল রুম রেখে সোজা হওয়া উচিত)।আমি √Mi √#samples−−−−−−−−√mean−−−−−√