যেখানেই বুটস্ট্র্যাপিং - কেউ আমাকে শুরু করার জন্য একটি সহজ ব্যাখ্যা সরবরাহ করতে পারে?


9

বুটস্ট্র্যাপিং সম্পর্কে পড়ার বিভিন্ন প্রচেষ্টা সত্ত্বেও আমি সর্বদা একটি ইটের দেয়ালে আঘাত করে চলেছি বলে মনে হয়। আমি ভাবছি যে কেউ যদি বুটস্ট্র্যাপিংয়ের যুক্তিসঙ্গতভাবে অ-প্রযুক্তিগত সংজ্ঞা দিতে পারে?

আমি এটা আমাকে পুরোপুরি তা বুঝতে সক্ষম করতে যথেষ্ট বিস্তারিত প্রদান এই ফোরামে সম্ভব নয়, কিন্তু মূল লক্ষ্য এবং বুটস্ট্র্যাপিং প্রক্রিয়া সঙ্গে সঠিক পথে একটি মৃদু ধাক্কা হবে অনেক প্রশংসা করা! ধন্যবাদ।

উত্তর:


8

বুটস্ট্র্যাপিং-এ উইকিপিডিয়া এন্ট্রি আসলে খুব ভাল:

http://en.wikipedia.org/wiki/Bootstrapping_%28statistics%29

বুটস্ট্র্যাপিং সবচেয়ে সাধারণ কারণ প্রয়োগ করা হয় যখন অন্তর্নিহিত বিতরণ থেকে যে কোনও নমুনা নেওয়া হয় তার ফর্মটি অজানা। Statতিহ্যগতভাবে পরিসংখ্যানবিদরা একটি সাধারণ বিতরণ (কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্য সম্পর্কিত খুব ভাল কারণে) ধরে নিয়েছেন, তবে পরিসংখ্যানগুলি (যেমন স্ট্যান্ডার্ড বিচ্যুতি, আত্মবিশ্বাসের ব্যবধান, পাওয়ার গণনা ইত্যাদি) সাধারণ বিতরণ তত্ত্বের মাধ্যমে অনুমান করা হয় কেবলমাত্র যদি অন্তর্নিহিত জনসংখ্যা বিতরণ হয় তবে কঠোরভাবে বৈধ হয় স্বাভাবিক।

বারবার নমুনাটিকে নিজেই পুনরায় স্যাম্পল করে বুটস্ট্র্যাপিং বিতরণটি স্বতন্ত্র অনুমানগুলিকে সক্ষম করে। Ditionতিহ্যগতভাবে আসল নমুনার প্রতিটি "রেজামাল" এলোমেলোভাবে মূল নমুনার মতো একই সংখ্যক পর্যবেক্ষণ নির্বাচন করে। তবে এগুলি প্রতিস্থাপনের সাথে নির্বাচিত হয়। যদি নমুনাতে এন পর্যবেক্ষণ থাকে তবে প্রতিটি বুটস্ট্র্যাপের পুনরায় নমুনায় এন পর্যবেক্ষণ থাকবে, অনেকগুলি আসল নমুনা পুনরাবৃত্তি করে এবং অনেকগুলি বাদ দেওয়া হয়।

সুদের প্যারামিটার (উদাঃ বিজোড় অনুপাত ইত্যাদি) এর পরে প্রতিটি বুটস্ট্র্যাপযুক্ত নমুনা থেকে অনুমান করা যায়। বুটস্ট্র্যাপটি 1000 বার বলে পুনরাবৃত্তি 2.5 ম, 50 তম এবং 97.5 তম পার্সেন্টাইল নির্বাচন করে পরিসংখ্যানগুলির (যেমন বিজোড় অনুপাত) উপর 95 "আত্মবিশ্বাসের ব্যবধানের একটি অনুমানের মঞ্জুরি দেয়।


8

আমেরিকান সায়েন্টিস্টের বুটস্ট্র্যাপে সম্প্রতি কসমা শালিজির একটি চমৎকার নিবন্ধ ছিল যা মোটামুটি সহজ পাঠযোগ্য এবং ধারণাটি উপলব্ধি করার জন্য আপনাকে প্রয়োজনীয় জিনিস দেয়।


7

খুব বিস্তৃতভাবে: স্বজ্ঞাততা, পাশাপাশি নামের উৎপত্তি ("বুটস্ট্র্যাপ দ্বারা নিজেকে টানতে"), পর্যবেক্ষণ থেকে প্রাপ্ত যে কোনও জনসংখ্যা সম্পর্কে তথ্য নির্ধারণের জন্য কোনও নমুনার বৈশিষ্ট্য ব্যবহার করার ক্ষেত্রে (পরিসংখ্যানের "বিপরীত" সমস্যা) অনুমান), আমরা ভুল হওয়ার আশা করি। এই ত্রুটির প্রকৃতিটি সনাক্ত করতে, নমুনাকে নিজেই তার নিজের হিসাবে একটি জনসংখ্যার হিসাবে বিবেচনা করুন এবং যখন আপনি এর থেকে নমুনা আঁকেন তখন আপনার অনুমানমূলক পদ্ধতি কীভাবে কাজ করে তা অধ্যয়ন করুন এটা একটা "এগিয়ে" সমস্যা: যদি আপনি আপনার sample- সম্পর্কে সব জানতে পদাধিকারবলেজনসংখ্যা এবং এটি সম্পর্কে কিছু অনুমান করার দরকার নেই। আপনার অধ্যয়নটি (ক) আপনার অনুমানমূলক পদ্ধতিটি কতটা পক্ষপাতদুষ্ট হতে পারে এবং (খ) আপনার পদ্ধতির পরিসংখ্যানগত ত্রুটির আকার এবং প্রকৃতিটি নির্দেশ করবে। সুতরাং, আপনার মূল অনুমান সামঞ্জস্য করতে এই তথ্যটি ব্যবহার করুন। অনেকগুলি (তবে অবশ্যই সমস্ত নয়) পরিস্থিতিতে অ্যাডজাস্ট করা পক্ষপাতটি asympototically অনেক কম।

এই পরিকল্পনামূলক বিবরণ দ্বারা প্রদত্ত একটি অন্তর্দৃষ্টি হ'ল বুটস্ট্র্যাপিংয়ের জন্য সিমুলেশন বা পুনরাবৃত্ত সাব্পলিংয়ের প্রয়োজন হয় না : জনগণের জানাশুনা হওয়ার পরে যে কোনও ধরণের স্ট্যাটিস্টিকাল পদ্ধতি অধ্যয়ন করার জন্য এটি কেবল সর্বজনগ্রাহী হিসাবে গণ্য হয়। গা boot় হিসাবে গণনা করা যায় এমন প্রচুর বুটস্ট্র্যাপ অনুমান রয়েছে।

এই উত্তরটি পিটার হলের "দ্য বুটস্ট্র্যাপ অ্যান্ড এজওয়ার্থ এক্সপেনশন" (স্প্রিংগার 1992) বইয়ের বিশেষত বুটস্ট্র্যাপিংয়ের "মূল নীতিমালা" সম্পর্কে তাঁর বর্ণনাটির কাছে অনেক .ণী।


আমি এই "আসল" পদ্ধতির (কব্জি। অন্যান্য এন্ট্রি) পছন্দ করি। তবুও, বুটস্ট্র্যাপ অনুশীলনে কেন কাজ করে তা ব্যাখ্যা করা আমার সবসময় কঠিন মনে হয় ...
chl

4

উপর উইকি বুটস্ট্র্যাপিং নিম্নলিখিত বিবরণ দেয়:

বুটস্ট্র্যাপিং একটিকে একক পরিসংখ্যানের অনেকগুলি বিকল্প সংস্করণ সংগ্রহ করতে দেয় যা সাধারণভাবে একটি নমুনা থেকে গণনা করা হয়। উদাহরণস্বরূপ, ধরে নিই আমরা বিশ্বব্যাপী মানুষের উচ্চতায় আগ্রহী। যেহেতু আমরা সমস্ত জনসংখ্যা পরিমাপ করতে পারি না, আমরা এর কেবলমাত্র একটি সামান্য অংশকে নমুনা করি। সেই নমুনা থেকে একটি পরিসংখ্যানের কেবল একটি মান পাওয়া যায়, যেমন একটি গড়, বা একটি মানক বিচ্যুতি ইত্যাদি, এবং তাই আমরা দেখতে পাই না যে পরিসংখ্যানের পরিমাণে কতটা পৃথক হয়। বুটস্ট্র্যাপিং ব্যবহার করার সময়, আমরা এলোমেলোভাবে এন নমুনা তথ্য থেকে এন উচ্চতাগুলির একটি নতুন নমুনা বের করি, যেখানে প্রতিটি ব্যক্তি বেশিরভাগ সময়ে নির্বাচিত হতে পারে। এটি বেশ কয়েকবার করে, আমরা প্রচুর পরিমাণে ডেটাসেট তৈরি করি যা আমরা এই প্রতিটি ডেটাসেটের পরিসংখ্যান দেখেছি এবং গণনা করতে পারি। সুতরাং আমরা পরিসংখ্যান বিতরণ একটি অনুমান পেতে।

উপরের বর্ণনার কোন অংশটি আপনি বুঝতে পারছেন না তা যদি আপনি পরিষ্কার করে বলতে পারেন তবে আমি আরও বিশদ সরবরাহ করব।


4

আমি এটি নিম্নরূপে ভাবতে চাই: আপনি যদি কোনও জনসংখ্যার থেকে এলোমেলোভাবে নমুনা ডেটা সেট করেন তবে অনুমিতভাবে সেই নমুনায় এমন বৈশিষ্ট্য থাকবে যা উত্সের জনসংখ্যার সাথে মোটামুটিভাবে মেলে। সুতরাং, যদি আপনি বিতরণের কোনও নির্দিষ্ট বৈশিষ্ট্যের উপর আত্মবিশ্বাসের ব্যবস্থাগুলি অর্জন করতে আগ্রহী হন, উদাহরণস্বরূপ, এর স্নিগ্ধতা, আপনি নমুনাকে ছদ্ম-জনসংখ্যা হিসাবে বিবেচনা করতে পারেন যা থেকে আপনি এলোমেলো ছদ্ম-নমুনার অনেকগুলি সেট অর্জন করতে পারেন, প্রত্যেকের আগ্রহের বৈশিষ্ট্যের মান। মূল নমুনা মোটামুটি জনসংখ্যার সাথে মেলে এমন ধারণাও এর অর্থ হ'ল আপনি সিউডো-জনসংখ্যার "প্রতিস্থাপন সহ" নমুনা প্রয়োগ করে সিউডো-নমুনাগুলি অর্জন করতে পারেন (উদাহরণস্বরূপ, আপনি কোনও মান নমুনা দিয়েছিলেন, রেকর্ড করুন, তারপরে এটি আবার রেখে দিন; সুতরাং প্রতিটি মান একাধিকবার পালন করার সুযোগ রয়েছে))।


3

বুটস্ট্র্যাপ মূলত পুনরাবৃত্তি পরীক্ষার একটি অনুকরণ; আসুন বলি যে আপনার বলগুলির সাথে একটি বাক্স রয়েছে যা একটি বলের গড় আকার অর্জন করতে চায় - যাতে আপনি তাদের কয়েকটি আঁকেন, পরিমাপ করুন এবং একটি গড় নিন। এখন আপনি বিতরণটি পেতে এটি পুনরাবৃত্তি করতে চান, উদাহরণস্বরূপ একটি স্ট্যান্ডার্ড বিচ্যুতি পেতে - তবে আপনি খুঁজে পেয়েছেন যে কেউ বাক্সটি চুরি করেছে।
এখন যা করা যায় তা হ'ল আপনার যা ব্যবহার করা হয় - এটি পরিমাপের এই সিরিজ। নতুন বাক্সে বলগুলি রেখে দেওয়া এবং প্রতিস্থাপনের সাথে একই সংখ্যক বল অঙ্কন করে মূল পরীক্ষাটি অনুকরণ করা - উভয়টি একই নমুনার আকার এবং কিছু পরিবর্তনশীলতা থাকতে পারে। এখন এটি ধারাবাহিক অর্থ পেতে বহুবার প্রতিলিপি করা যেতে পারে যা অবশেষে গড় বন্টন আনুমানিক হিসাবে ব্যবহার করা যেতে পারে।


3

এটি বুটস্ট্র্যাপিংয়ের সারমর্ম: আপনার উপাত্তের বিভিন্ন নমুনা গ্রহণ, প্রতিটি নমুনার (যেমন, গড়, মধ্যমা, সম্পর্ক, রিগ্রেশন সহগ, ইত্যাদি) জন্য একটি পরিসংখ্যান প্রাপ্ত এবং নমুনা জুড়ে পরিসংখ্যানের পরিবর্তনশীলতা ব্যবহার করে কিছু বোঝাতে পরিসংখ্যানগুলির জন্য আদর্শ ত্রুটি এবং আত্মবিশ্বাসের ব্যবধানগুলি। - বুটস্ট্র্যাপিং এবং বুট প্যাকেজ আর

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.