বুটস্ট্র্যাপ নমুনার বনাম নমুনার পরিসংখ্যান


18

বলুন যে স্ট্যাস্টিটিক (যেমন গড়) এর জন্য এই নমুনা থেকে আমার কাছে একটি নমুনা এবং বুটস্ট্র্যাপ নমুনা রয়েছে । যেমনটি আমরা সবাই জানি, এই বুটস্ট্র্যাপের নমুনাটি পরিসংখ্যানগুলির অনুমানের নমুনা বন্টনের অনুমান করে ।χ

এখন, এই গড় হল বুটস্ট্র্যাপ নমুনা একটি ভাল অনুমান জনসংখ্যা পরিসংখ্যাত মূল পরিসংখ্যাত চেয়ে নমুনা ? কোন পরিস্থিতিতে এটি হবে?


2
বুটস্ট্র্যাপ নমুনা গড় হল নমুনা গড় এবং আপনি এই মামলার বুটস্ট্র্যাপ নমুনা প্রয়োজন হবে না।
শি'য়ান

1
ধন্যবাদ @ শি'আন আমি নিশ্চিত যে আমি অনুসরণ করি follow বুটস্ট্র্যাপ নমুনার গড়টি নমুনার গড় থেকে সংখ্যাগতভাবে পৃথক হতে পারে। আপনি কি বলার চেষ্টা করছেন যে দুটি এখনও তাত্ত্বিকভাবে সমান? আপনি উভয় প্রান্তে নিশ্চিত করতে পারেন?
আমেলিও ওয়াজকেজ-রেইনা

2
আসুন আমাদের পরিভাষাটি পরিষ্কার হয়ে উঠুন: "বুটস্ট্র্যাপ স্যাম্পল" ডেটা থেকে নির্দিষ্ট স্যাম্পল-প্রতিস্থাপনের সাথে উল্লেখ করতে পারে বা এটি এমন একটি (বহুবিধ) র্যান্ডম ভেরিয়েবলকে উল্লেখ করতে পারে যার মধ্যে একটি নমুনা একটি উপলব্ধি হিসাবে বিবেচিত হবে। আপনি সঠিক যে কোনও উপলব্ধির অর্থ ডেটার গড় থেকে পৃথক হতে পারে তবে @ শিওন আরও প্রাসঙ্গিক পর্যবেক্ষণ সরবরাহ করে যে এলোমেলো পরিবর্তনশীলের গড় (যা সংজ্ঞা অনুসারে জনসংখ্যার বুটস্ট্র্যাপের প্রাক্কলন বলতে বোঝায় ) অবশ্যই মিলে যেতে হবে ডেটা গড় সঙ্গে।
হুবুহু

1
তারপরে আপনার প্রশ্নটি প্রায় stats.stackexchange.com/questions/126633/… এর সমান ; পার্থক্যটি হ'ল বুটস্ট্র্যাপের নমুনা উপলব্ধিগুলি ওভারল্যাপ করতে পারে তবে উত্তরটিতে দেওয়া বিশ্লেষণটি একই ফলস্বরূপ সহজেই বুটস্ট্র্যাপের পরিস্থিতিতে চলে যায়।
হোবল

1
আমি @ হুবার সংযোগটি দেখছি, যদিও বুটস্ট্র্যাপে একটিতে "প্রতিস্থাপনের সাথে সাবসেট" রয়েছে এবং আপনি যেমন বলেছিলেন তেমন উপলব্ধি ওভারল্যাপ হতে পারে। আমি ধারণা করব যে বুটস্ট্র্যাপে পুনরায় নমুনাগুলি পেতে ব্যবহৃত বিতরণ (যেমন সিউডোর্যান্ডমনেস) এছাড়াও বুটস্ট্র্যাপ নমুনা থেকে অনুমানের পক্ষপাতাকে প্রভাবিত করতে পারে। সম্ভবত উত্তরটি হ'ল সমস্ত ব্যবহারিক বিষয়ে পার্থক্য নগণ্য। শর্ত, সূক্ষ্মতা এবং অনুশীলনের পার্থক্য: এই পরে প্রশ্নটি।
অ্যামিলিও ওয়াজকেজ-রেইনা

উত্তর:


19

আসুন জেনারালাইজেশন করা যাক যাতে বিষয়টির ক্রুসে ফোকাস করা যায়। আমি অতি ক্ষুদ্রতম বিবরণ বানান করব যাতে কোনও সন্দেহ না হয়। বিশ্লেষণের জন্য কেবল নিম্নলিখিতগুলির প্রয়োজন:

  1. গাণিতিক গড় সংখ্যার একটি সেটের হতে সংজ্ঞায়িত করা হয়z- র1,...,z- রমি

    1মি(z- র1+ ++ +z- রমি)
  2. প্রত্যাশা একটি লিনিয়ার অপারেটর। এটি হ'ল, যখন এলোমেলো পরিবর্তনশীল এবং α আমি সংখ্যা, তখন একটি রৈখিক সংমিশ্রণের প্রত্যাশা হল প্রত্যাশার লিনিয়ার সংমিশ্রণ,জেডআমি,আমি=1,...,মিαআমি

    (α1জেড1+ ++ +αমিজেডমি)=α1(জেড1)+ ++ +αমি(জেডমি)

যাক একটি নমুনা হতে ( বি 1 , ... , বি ) একটি ডেটাসেটের থেকে প্রাপ্ত এক্স = ( x এর 1 , ... , x এর এন ) গ্রহণ করে থেকে অবিশেষে উপাদান এক্স প্রতিস্থাপন সঙ্গে। যাক মি ( বি ) এর গাণিতিক গড় হতে বি । এটি একটি এলোমেলো পরিবর্তনশীল। তারপরবি(বি1,...,বি)এক্স=(এক্স1,...,এক্সএন)এক্সমি(বি)বি

(মি(বি))=(1(বি1+ ++ +বি))=1((বি1)+ ++ +(বি))

প্রত্যাশা রৈখিকতা অনুসরণ করে। যেহেতু এর উপাদানগুলি সমস্ত একই ফ্যাশনে পাওয়া যায়, তাই তাদের সবার একই প্রত্যাশা থাকে, বলুন:বি

E(B1)==E(Bk)=b.

এটি পূর্ববর্তীগুলিকে সহজ করে তোলে

E(m(B))=1k(b+b++b)=1k(kb)=b.

সংজ্ঞা অনুসারে, প্রত্যাশা হ'ল সম্ভাব্যতা-ওজনের মানগুলির যোগফল। যেহেতু প্রতিটি মানের নির্বাচিত হওয়ার 1 / n এর সমান সুযোগ রয়েছে বলে ধরে নেওয়া হয়,X1/n

E(m(B))=b=E(B1)=1nx1++1nxn=1n(x1++xn)=x¯,

তথ্য গাণিতিক গড়।

প্রশ্ন উত্তর দেওয়ার জন্য যদি একটি ব্যবহার ডেটা মানে জনসংখ্যা গড় অনুমান করার জন্য, তারপর বুটস্ট্র্যাপ গড় (যা কেনার ক্ষেত্রে দেখা যায় = ) ও সমান ˉ এক্স , এবং তাই হয় অভিন্ন জনসংখ্যা গড় একজন মূল্নির্ধারক হিসাবে।x¯k=nx¯


পরিসংখ্যানগুলির জন্য যা ডেটারের লিনিয়ার ফাংশন নয়, একই ফলাফল অগত্যা ধরে রাখে না। তবে, ডেটাতে পরিসংখ্যানের মানটির জন্য বুটস্ট্র্যাপের অর্থের বিকল্পটি নেওয়া সহজ হবে: এটি বুটস্ট্র্যাপিং কীভাবে কাজ করে তা নয়। পরিবর্তে, তথ্য পরিসংখ্যাত জন্য বুটস্ট্র্যাপ গড় তুলনা করে আমরা সম্পর্কে তথ্য প্রাপ্ত পক্ষপাত পরিসংখ্যাত করুন। পক্ষপাত দূর করতে মূল পরিসংখ্যান সামঞ্জস্য করতে এটি ব্যবহার করা যেতে পারে । যেমন, পক্ষপাত-সংশোধন করা অনুমান এর ফলে মূল পরিসংখ্যান এবং বুটস্ট্র্যাপ গড়ের একটি বীজগণিত সংমিশ্রণে পরিণত হয়। আরও তথ্যের জন্য, "বিসিএ" (পক্ষপাত সংশোধন এবং ত্বরণযুক্ত বুটস্ট্র্যাপ) এবং "এবিসি" দেখুন। উইকিপিডিয়া কয়েকটি রেফারেন্স সরবরাহ করে।


আপনি বোঝাতে চাইছেন যে বুটস্ট্র্যাপের গড়ের প্রত্যাশা ডেটা মানে সমান, না? বুটস্ট্র্যাপের অর্থ নিজেই (মূল) ডেটা নমুনা দ্বারা নির্ধারিত হয় না।
ক্যাপিবারালেট

@ user2429920 বুটস্ট্র্যাপ মানে নমুনা দ্বারা নির্ধারিত একটি পরিসংখ্যান। এই অর্থে এটি নমুনা গড়ের সাথে সমান। নমুনা বিতরণ অর্থে এর প্রত্যাশা নেওয়া হয়। আমার সন্দেহ হয় আপনি সম্ভবত প্রতিস্থাপনের সাথে বারবার সাবমলিংয়ের মাধ্যমে বুটস্ট্র্যাপ গণনার প্রক্রিয়াটির সাথে সম্পর্কিত অন্য কোনও অর্থে "প্রত্যাশা" ব্যবহার করছেন ।
whuber

1
আমি মনে করি শেষ অনুচ্ছেদটি এই প্রশ্নের যথাযথ উত্তর কারণ এটি সাধারণ এবং কেবলমাত্র গড় পরিসংখ্যানগুলিতে মনোনিবেশ করা হয়নি। আমার ওপি-র একই সন্দেহ ছিল এবং আমি বিসিএর অস্তিত্ব সম্পর্কে অবগত ছিলাম না। যদিও এই উত্তরের বিক্ষোভ আমাকে খুব বেশি কাজে দেয় নি (আমি আমার পরিসংখ্যান হিসাবে অর্থটি ব্যবহার করছি না) শেষ অনুচ্ছেদটি বিষয়টি সম্পর্কে জটিলতার বিষয়ে খুব স্পষ্ট ছিল। আমি বিশ্বাস করি যে শি'ানের উত্তরও সেই ক্ষেত্রে মোকাবেলা করে যেখানে গড় পরিসংখ্যান ব্যবহৃত হয়, একই সমস্যা। ধন্যবাদ!
গ্যাব্রিয়েল

1
@ গ্যাব্রিয়েল ভাল পয়েন্টসমূহ আমি রেকর্ডটি যাচাই করেছি: সম্পাদনার আগে, এই প্রশ্নটি মূলত কেবল গড় সম্পর্কে জিজ্ঞাসা করেছিল। এজন্যই উত্তরগুলি সেই পরিসংখ্যানগুলিতে এতটা মনোযোগী বলে মনে হচ্ছে।
whuber

9

এফ^এন(এক্স)=1এনΣআমি=1এনআমিএক্সআমিএক্সএক্সআমি~IIDএফ(এক্স),
এফ^এন[এক্স]=1এনΣআমি=1এনএক্সআমি=এক্স¯এন
এফ^এন[এক্স]এক্স¯এন

2
+1 এটিই উত্তর যা আমি প্রথমে লিখতে চেয়েছিলাম তবে আশঙ্কা করেছিল যে এটি কিছু পাঠকের পক্ষে খুব অস্বচ্ছ। তবুও আমি এটিকে এত সুন্দরভাবে উপস্থাপন করতে পেরে আনন্দিত। আপনার শেষ বাক্যটিতে আপনি কী বোঝাতে চাইছেন তা আমি নিশ্চিত নই, যদিও আপনি যেখানে সিমুলেটেড সান্নিধ্যের "প্রত্যাশা" এর সাথে তার "সীমা" থেকে পৃথক করে দেখেন: প্রত্যাশা স্থির হওয়ার কারণে (এটি সিমুলেশন আকারের সাথে পৃথক হয় না) ), গ্রহণের আসলে কোনও সীমা নেই।
whuber

@ শুভ: মন্তব্যটি করার জন্য আপনাকে ধন্যবাদ এবং আপনার মত একই সময়ে আমার সংক্ষিপ্ত উত্তরটি লেখার জন্য দুঃখিত! আপনার ব্যাখ্যাগুলি অবশ্যই বুটস্ট্র্যাপের নবীনদের দ্বারা আরও পঠনযোগ্য। আমি চূড়ান্ত বাক্যটি সংশোধন করেছি, যার সীমিত অংশটি বিপুল সংখ্যার আইন।
শি'আন

3
আপনার এই শেষ বাক্যে "গড়" ব্যবহারটি যথেষ্ট অস্পষ্ট! আপনার এলএলএন ক্লু থেকে আমি এটি বের করেছি। বুটস্ট্র্যাপ বিতরণের যে কোনও সীমাবদ্ধ সিমুলেশনের জন্য, সিমুলেশনের প্রতিটি নমুনা তার নিজস্ব গড় তৈরি করে ("মানে" এর একটি অর্থ রয়েছে)। প্রদত্ত সিমুলেশনের সমস্ত নমুনার গড় একটি সিমুলেশন গড় উত্পাদন করে (এর আরও একটি অর্থ রয়েছে)। সিমুলেশন মানে একটি ধ্রুবকে রূপান্তরিত হয় সিমুলেশন আকারটি বড় হওয়ার সাথে সাথে এটি বুটস্ট্র্যাপ মানে (তৃতীয় অর্থ), এবং এটি নমুনার গড় (চতুর্থ অর্থ) এর সমান হয় । (এবং এই জনসংখ্যা অনুমান মানে --a পঞ্চম অর্থ!)
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.