বুটস্ট্র্যাপিং কেন দরকারী?


13

আপনি যা করছেন সবই যদি অভিজ্ঞতা অভিজ্ঞতা থেকে পুনরায় স্যাম্পলিং হয় তবে কেন কেবল অনুশীলনমূলক বিতরণ অধ্যয়ন করবেন না? উদাহরণস্বরূপ বারবার নমুনা প্রয়োগ করে পরিবর্তনশীলতা অধ্যয়ন করার পরিবর্তে, কেন না কেবল অনুশীলনমূলক বিতরণ থেকে পরিবর্তনশীলতার পরিমাণ নির্ধারণ করা?


6
" (এই অর্থে) বুটস্ট্র্যাপ বিতরণটি আমাদের প্যারামিটারের জন্য একটি (আনুমানিক) ননপ্যারমেট্রিক, ননফর্মেশনাল পোস্টেরিয়র ডিস্ট্রিবিউশনকে উপস্থাপন করে But তবে এই বুটস্ট্র্যাপ বিতরণটি বেদাহীনভাবে প্রাপ্ত হয় - আনুষ্ঠানিকভাবে পূর্বের কোনও নির্দিষ্টকরণ ব্যতীত ও উত্তরোত্তর বিতরণ থেকে নমুনা না রেখে। সুতরাং আমরা বুটস্ট্র্যাপ বিতরণটিকে "দরিদ্র লোক" বেয়েস উত্তরোত্তর হিসাবে ভাবতে পারি " পরিসংখ্যানগত শিক্ষার উপাদানসমূহ "
S বিভাগ

8
আমাদের অনুমানের অনিশ্চয়তা কীভাবে আমরা অভিজ্ঞতাগত বিতরণ থেকে প্রমাণ করব?
usεr11852

2
"হালকা নিয়মিততার শর্তে, বুটস্ট্র্যাপ অনুমানক বা পরীক্ষার পরিসংখ্যান বিতরণে একটি সান্নিধ্য লাভ করে যা কমপক্ষে প্রথম-আদেশের অ্যাসিম্পটোটিক তত্ত্ব থেকে প্রাপ্ত সান্নিধ্যের মতো যথাযথ"। unc.edu/~saraswat/teaching/econ870/fall11/JH_01.pdf
জোবোম্যান

10
আপনি তর্ক করছেন, বোঝার চেষ্টা করছেন না। বিশ্বাস করুন, আপনি বুঝতে পারেন নি যে বুটস্ট্র্যাপ চার হাজার বা দশক ধরে কয়েক হাজার পরিসংখ্যানবিদদের তুলনায় মূল্যহীন। আপনি উদ্ধৃতিটি মনোযোগ সহকারে পড়েন নি। আমি মনে করি আপনি পরিসংখ্যানগুলিতে এলোমেলোভাবে গুরুত্বপূর্ণ ভূমিকাটি উপলব্ধিতে ব্যর্থ হয়েছেন। "কেন বিরক্ত !!" এর মত বিবৃতি " এর ডিস্ট্রিবিউশন প্রাপ্তির বিষয়ে ... কমপক্ষে বলতে গেলে অস্বাভাবিক, যদি আপনি আপনার অনুমানের বন্টন বোঝা গুরুত্বপূর্ণ মনে করেন না, তবে আপনি পরিসংখ্যানের ক্ষেত্রটি কেন বিদ্যমান তা বিবেচনা করতে চাইতে পারেন এ সব, এবং পুনরায় মনে করেন যে।T(X)
jbowman

4
@ztyh আপনি বলতে "আপনি প্রতিটি নমুনা মানচিত্র যদি করার আপনার একটা বন্টন পেতে "। সম্ভবত আপনার এই সম্পর্কে চিন্তা করা উচিত, আপনি কীভাবে থেকে a একক পয়েন্ট মানচিত্র করবেন ? বা এই বিষয়টির জন্য যে কোনও ফাংশন । টি ( এক্স ) টি ( এক্স ) এক্স আই টি ( এক্স ) = ˉ এক্স টি ( এক্স 1 , এক্স 2 , এক্স এন )XT(X)T(X)XiT(X)=X¯T(X1,X2,Xn)
নরমসেই

উত্তর:


18

বুটস্ট্র্যাপিং (বা অন্যান্য পুনরায় মডেলিং) একটি পরিসংখ্যান বিতরণ অনুমান করার জন্য একটি পরীক্ষামূলক পদ্ধতি।

এটি একটি খুব সোজা এবং সহজ পদ্ধতি (এর অর্থ কেবলমাত্র পরিসংখ্যানের কাঙ্ক্ষিত বিতরণ প্রাপ্ত করার জন্য আপনি নমুনা তথ্যের অনেক এলোমেলো রূপের সাথে গণনা করুন)।

আপনি সম্ভবত এটি ব্যবহার করবেন যখন 'তাত্ত্বিক / বিশ্লেষণাত্মক' মত প্রকাশের পক্ষে / গণনা করা খুব কঠিন হয় (বা আকসাকালের মতো কখনও কখনও তারা অজানা থাকে)।

  • উদাহরণ 1: আপনি যদি একটি পিসিএ বিশ্লেষণ করেন এবং ভেরিয়েবলগুলির মধ্যে কোনও সম্পর্ক নেই বলে অনুমানের ভিত্তিতে ফলাফলগুলি ' ইজেনভ্যালুগুলির বিচ্যুতির প্রাক্কলনের অনুমানের সাথে তুলনা করতে চান '

    আপনি অনেক সময় ডেটা স্ক্র্যাম্ব করতে পারেন এবং পিজিএ ইগেনভ্যালুগুলিকে পুনরায় কম্পিউটিং করতে পারবেন যাতে আপনি ইগেনভ্যালুগুলির জন্য বিতরণ (নমুনা ডেটার সাথে এলোমেলো পরীক্ষার ভিত্তিতে) পান।

    নোট করুন যে বর্তমান পদ্ধতিগুলি একটি স্ক্রি প্লটের দিকে নজর রাখছে এবং কোনও নির্দিষ্ট স্থানীয় মূল্য গুরুত্বপূর্ণ / গুরুত্বপূর্ণ কিনা তা 'সিদ্ধান্ত নেওয়ার জন্য' থাম্বের নিয়মগুলি প্রয়োগ করে।

  • উদাহরণ 2: আপনি একটি অ-রৈখিক রিগ্রেশন y ~ f (x) করেছেন যা ফ ফাংশনের জন্য গুচ্ছের পরামিতিগুলির কিছুটা প্রাক্কলণ সরবরাহ করে। এখন আপনি এই পরামিতিগুলির জন্য স্ট্যান্ডার্ড ত্রুটিটি জানতে ইচ্ছুক

    ওএলএস-এর মতো অবশিষ্টাংশ এবং লিনিয়ার বীজগণিতগুলির কিছু সাধারণ চেহারা এখানে সম্ভব নয়। তবে, একটি সহজ উপায় হ'ল প্যারামিটারগুলি কীভাবে পৃথক হবে তা ধারণা পাওয়ার জন্য অবশিষ্টাংশগুলি / ত্রুটিগুলি পুনরায় স্ক্র্যামল করে একই রিগ্রেশনকে বহুবার গণনা করা হয় (ত্রুটি শর্তের জন্য বিতরণটি পর্যবেক্ষিত অবশিষ্টাংশ দ্বারা মডেল করা যেতে পারে)।


লিখেছেন স্ট্যাকএক্সচেঞ্জ স্ট্রাইক


2
আমি মনে করি আপনার উদাহরণটি বুটস্ট্র্যাপ নয়। এটি কেবল একটি নাল বিতরণ থেকে নমুনা। বুটস্ট্র্যাপটি যেখানে আপনার একটি নমুনা রয়েছে এবং সেই নমুনা থেকে বার বার নমুনা।
ztyh

3
আপনার প্রশ্নে আপনি কোনও নমুনার বৈচিত্র্য গণনা করতে কল্পনা করেন যা সত্যই সহজ এবং বুটস্ট্র্যাপিংয়ের প্রয়োজন হয় না। আমার উদাহরণে আমি এমন একটি পরিস্থিতির কথা বলি যেখানে আমাদের মান রয়েছে যা নমুনা থেকে নেওয়া from তারপরে আমরা কেবল কোনও ভিন্নতা গণনা করতে পারি না, তবুও আমরা জানতে চাই যে এটি কীভাবে পরিবর্তিত হয়। অনেকবার ডেটা স্ক্র্যাম্বল করে এবং পিসিএ ইগেনভ্যালুগুলি পুনরায় গণনা করার মাধ্যমে আপনি এমন নমুনা বিতরণ করার পরে এমন একটি বিতরণ (এলোমেলো) ডেটা পেতে পারেন। যদি আমার ভুল না হয় তবে এটিকে বুটস্ট্র্যাপিং বলা হয়।
সেক্সটাস এম্পেরিকাস

ঠিক আছে, আমি দেখতে পাচ্ছি যেখানে আমি জিনিসগুলি ভুল বুঝেছিলাম। আপনার উদাহরণটি অর্থবোধ করে। ধন্যবাদ।
ztyh

8

মূল কথাটি হ'ল বুটস্ট্র্যাপটি ডেটা বিতরণের বৈশিষ্ট্যগুলি সন্ধান করার বিষয়ে সত্যই নয় , বরং ডেটাতে প্রয়োগ করা একটি অনুমানের বৈশিষ্ট্যগুলি সন্ধান করতে পারে।

অনুপ্রেরণামূলক বিতরণ ফাংশনের মতো কিছু আপনাকে সিডিএফ থেকে মোটামুটি ভাল অনুমানের কথা বলবে যেখান থেকে ডেটা এসেছে ... তবে বিচ্ছিন্নতার মাধ্যমে এটি আপনাকে সেই ডেটা থেকে যে অনুমানগুলি তৈরি করবে তা কতটা নির্ভরযোগ্য হবে তা সম্পর্কে আপনাকে প্রাথমিকভাবে কিছুই বলে দেয় না। বুটস্ট্র্যাপ ব্যবহার করে এই প্রশ্নের উত্তর দেওয়া হয়েছে।


1
"ডেটা বিতরণ" সন্ধানের জন্য (নন-প্যারাম্যাট্রিক) বুটস্ট্র্যাপ ব্যবহার করা হাসি হাসিখুশি: এটি কেবলমাত্র অভিজ্ঞতা অভিজ্ঞতা বিতরণ ফাংশন নিয়ে আসে, যা বিশ্লেষক ঠিক সেই ডেটা সেট দিয়ে শুরু করেছিলেন। যখন আমি "এক্স এর জন্য সমাধান করতাম" এবং "এক্স = এক্স" সন্ধান করতাম তখন কলেজ বীজগণিতের কথা মনে করিয়ে দেয়।
অ্যাডমো

3

অন্তর্নিহিত বিতরণ কী তা যদি আপনি ঠিক জানেন তবে আপনার এটি অধ্যয়ন করার দরকার নেই। কখনও কখনও, প্রাকৃতিক বিজ্ঞান আপনি ঠিক বিতরণ জানেন।

যদি আপনি বিতরণের ধরণটি জানেন তবে আপনার কেবলমাত্র তার প্যারামিটারগুলি অনুমান করতে হবে এবং এটি বোঝাতে চাইছেন it উদাহরণস্বরূপ, কোনও সময় আপনি একটি প্রাইমারী জানবেন যে অন্তর্নিহিত বিতরণটি স্বাভাবিক। কিছু ক্ষেত্রে আপনি এমনকি এর অর্থ কী তা জানেন। সুতরাং, সাধারণের জন্য এটি অনুসন্ধানের জন্য কেবলমাত্র বাকীটি হ'ল স্ট্যান্ডার্ড বিচ্যুতি। আপনি নমুনা থেকে নমুনার স্ট্যান্ডার্ড বিচ্যুতি পান, এবং ভয়েলা, আপনি অধ্যয়নের জন্য বিতরণ পাবেন।

যদি আপনি কীভাবে বিতরণটি জানেন না তবে ভাবেন যে এটি তালিকার বেশ কয়েকটিগুলির মধ্যে একটি, তবে আপনি সেই বিতরণের ডেটাতে ফিট করার চেষ্টা করতে পারেন এবং সবচেয়ে ভাল ফিট করে এমনটি বেছে নিতে পারেন। তারপরে আপনি সেই বিতরণটি অধ্যয়ন করেন।

শেষ পর্যন্ত, প্রায়শই আপনি জানেন না যে আপনি কীভাবে বিতরণ করছেন। আর আপনার বিশ্বাস করার কোনও কারণ নেই যে এটি 20 টির মধ্যে একটির সাথে সম্পর্কিত যা আপনার ডেটা ফিট করতে পারে। আপনি কি করতে যাচ্ছেন? ঠিক আছে, আপনি গড় এবং স্ট্যান্ডার্ড বিচ্যুতি দেখুন, দুর্দান্ত। তবে কি খুব ঝুঁকিপূর্ণ? যদি এর কুরটোসিস খুব বড় হয় তবে কী হবে? ইত্যাদি। আপনার সত্যিকারের বিতরণের সমস্ত মুহুর্তগুলি জানতে এবং এটি অধ্যয়ন করতে হবে। সুতরাং, এক্ষেত্রে প্যারামিমেটিক নন বুটস্ট্র্যাপিং কার্যকর হয়। আপনি এটি থেকে খুব বেশি, এবং সাধারণ নমুনা ধরে নেই, তার মুহুর্তগুলি এবং অন্যান্য বৈশিষ্ট্যগুলি অধ্যয়ন করুন।

যদিও নন-প্যারামেট্রিক বুটস্ট্র্যাপিং কোনও যাদুকরী সরঞ্জাম নয়, এতে সমস্যা রয়েছে। উদাহরণস্বরূপ, এটি পক্ষপাতদুষ্ট হতে পারে। আমি মনে করি প্যারামেট্রিক বুটস্ট্র্যাপিং নিরপেক্ষ is


1
আমি মনে করি আপনি সত্যিকারের বিতরণটি না জানলেও অনেক মুহুর্ত গণনা করা সহজ। সুতরাং আমি মনে করি যে সমস্যাটি আপনি কীভাবে বিতরণ করছেন তা না জেনে নয়। বরং আপনি কী ধরণের পরিসংখ্যান নিয়ে গবেষণা করার চেষ্টা করছেন তা এটি। কিছু পরিসংখ্যান গণনা করা কঠিন এবং কেবল তখনই বুটস্ট্র্যাপ দরকারী।
ztyh

ইউএসআর 11852 এর কাছে প্রশ্নের মন্তব্যে লাইক করুন, আসলে আমার কাছে পরিসংখ্যানের
গণনাযোগ্যতার

আসলে আমি এটি এখনও একটি বুদ্ধিমান মনে করি। আপনি প্রতিটি নমুনাটি ম্যাপ করুন । তারপর কোয়ান্টাইল সন্ধান করা আবার একটি 1 লাইন কোড। মোট 2 কোড লাইন। ln(x3+x)
ztyh

1
কোয়ান্টাইল একটি বোকা উদাহরণ ছিল, আমি আপনাকে এটি দিতে হবে। পরিবর্তে মানে চেষ্টা করুন। আমার অনুশীলনে আমাকে বা আরও জটিল ফাংশনগুলি পূর্বাভাস করতে হবে যেখানে একটি অজানা যৌথ বিতরণ থেকে। আমার চূড়ান্ত পূর্বাভাসের বৈশিষ্ট্যগুলি পাওয়া দরকার। মুহুর্তের সাথে চেষ্টা করুন। বুটস্ট্র্যাপিংয়ের সাথে এটি কোনও ব্রেইনার নয়। f ( x , z ) x , zxzf(x,z)x,z
আকসকল

1
কতটা জটিল হতে পারে, আপনাকে কেবল এবং থেকে এর নমুনাগুলি ম্যাপ করতে হবে । তারপরে সেই ম্যাপযুক্ত নমুনাগুলি অধ্যয়ন করুন। আপনি যদি বুটস্ট্র্যাপ ব্যবহার করতে পারেন তবে তার অর্থ আপনি এটি করতে পারেন এবং এটি অনেক সহজ ...x z f ( x , z )fxzf(x,z)
ztyh
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.