আমাদের বুটস্ট্র্যাপিংয়ের দরকার কেন?


16

আমি বর্তমানে ল্যারি ওয়াসারম্যানের "সমস্ত পরিসংখ্যান" পড়ছি এবং ননপ্যারমেট্রিক মডেলের পরিসংখ্যান সম্পর্কিত ফাংশন অনুমানের বিষয়ে অধ্যায়টিতে তিনি লিখেছেন এমন কিছু দেখে আশ্চর্য হয়েছি।

সে লিখেছিলো

"কখনও কখনও আমরা কিছু গণনা করে একটি পরিসংখ্যান ফাংশনের আনুমানিক স্ট্যান্ডার্ড ত্রুটি খুঁজে পাই। তবে অন্য ক্ষেত্রে স্ট্যান্ডার্ড ত্রুটি কীভাবে অনুমান করা যায় তা স্পষ্ট নয়"।

আমি উল্লেখ করতে চাই যে পরবর্তী অধ্যায়ে তিনি বুটস্ট্র্যাপ সম্পর্কে এই সমস্যাটির বিষয়ে কথা বলছেন, তবে যেহেতু আমি সত্যই এই বিবৃতিটি বুঝতে পারি না আমি বুটস্ট্র্যাপিংয়ের পিছনে উত্সাহটি পুরোপুরি পাই না?

আদর্শ ত্রুটিটি কীভাবে অনুমান করা যায় তা স্পষ্ট না হলে এর জন্য কী উদাহরণ রয়েছে?

সকল উদাহরণ আমি এতদূর দেখা করেছি হয়েছে "সুস্পষ্ট" যেমন আছে তারপর ^ গুলি ( পি এন ) = X1,...Xn Ber(p)se^(p^এন)=পি^(1-পি^)/এন


4
আমি একটি সাইট অনুসন্ধানে অন্যান্য উত্তরগুলির জন্য অনেকগুলি উদাহরণ খুঁজে পাচ্ছি যা বুটস্ট্র্যাপ প্রস্তাব করে । এর মধ্যে stats.stackexchange.com/questions/14213 , stats.stackexchange.com/questions/63979 , stats.stackexchange.com/questions/25218 এবং আরও অনেক কিছু রয়েছে।
whuber

উত্তর:


16

দুটি উত্তর।

  1. দুটি অর্থের অনুপাতের স্ট্যান্ডার্ড ত্রুটিটি কী? মিডিয়ানের স্ট্যান্ডার্ড ত্রুটি কী? কোন জটিল পরিসংখ্যানের স্ট্যান্ডার্ড ত্রুটিটি কী? সম্ভবত একটি বদ্ধ ফর্ম সমীকরণ রয়েছে, তবে এটি সম্ভবত সম্ভব যে কেউ এটিকে কার্যকর করেনি।
  2. গড়ের স্ট্যান্ডার্ড ত্রুটির (বলুন) সূত্রটি ব্যবহার করার জন্য, আমাদের অবশ্যই কিছু অনুমান করা উচিত। যদি এই অনুমানগুলি লঙ্ঘিত হয় তবে আমরা অগত্যা পদ্ধতিটি ব্যবহার করতে পারি না। @ শুভর মন্তব্যগুলিতে যেমন উল্লেখ করেছেন, বুটস্ট্র্যাপিং আমাদের এই কিছু অনুমানকে শিথিল করতে দেয় এবং তাই আরও উপযুক্ত মানক ত্রুটি সরবরাহ করতে পারে (যদিও এটি অতিরিক্ত অনুমানও করতে পারে)।

2
উত্তর 1 জরিমানা, তবে উত্তর 2 টি প্রশ্নটি ভিক্ষা বলে মনে হচ্ছে কারণ বুটস্ট্র্যাপিং অনুমানও করে তোলে। আমি মনে করি বিন্দুটি হতে পারে এটি অন্যান্য জনপ্রিয় প্রক্রিয়াগুলির তুলনায় সাধারণত বিভিন্ন ধারণা তৈরি করে তবে আপনি কী বলতে চাইছেন সে সম্পর্কে আমার ধারণা এবং আমি ভুল হতে পারি।
whuber

@ শুভ - ধন্যবাদ, আমি কিছুটা ব্যাখ্যা দিয়েছি added
জেরেমি মাইলস

5
সম্পাদনা করার জন্য আপনাকে ধন্যবাদ। কিন্তু এটা ক্ষেত্রে যে বুটস্ট্র্যাপিং সাধারণত তোলে নয় ভিন্ন অনুমিতি বদলে আসলে শক্তিহানিকর কিছু? উদাহরণস্বরূপ, একটি নমুনার একটি এসই অনুমান করার জন্য প্রয়োজনীয় অনুমানগুলি হ'ল ডেটা আইড হয় এবং অন্তর্নিহিত বিতরণটির একটি সীমাবদ্ধ বৈকল্পিক থাকে। বুটস্ট্র্যাপটি আসলে এই ক্ষেত্রে অনুমান যুক্ত করতে হবে: নমুনার আকার "পর্যাপ্ত পরিমাণে বড়" না হলে এটি কাজ করে না। যদিও এটি প্রযুক্তিগত দিক দিয়ে কোলাহল করার মতো মনে হচ্ছে, আমি যা বোঝার চেষ্টা করছি সেটি হচ্ছে বড় চিত্র: বুটস্ট্র্যাপিং কোনও প্যানাসিয়া নয় বা এটি সর্বদা প্রযোজ্যও নয়।
whuber

3
@ জেরেমি মাইলস বুটস্ট্র্যাপ অনুমান মুক্ত নয়। আপনাকে যাচাই করতে হবে যে বেশিরভাগ বুটস্ট্র্যাপ ত্রুটি গণনার জন্য বিতরণটি মূলত যা বেশিরভাগ স্ট্যান্ডার্ড ত্রুটির জন্য সামঞ্জস্যপূর্ণ অনুমানকারী প্রাপ্তির চেয়ে জটিল হতে পারে। অতিরিক্তভাবে, মাধ্যমের অনুপাতটি easy-পদ্ধতি থেকে প্রাপ্ত খুব সহজ ত্রুটির প্রায় কাছাকাছি রয়েছে। সুতরাং আমি মনে করি না যে উদাহরণটি ওপির বক্তব্যকে অস্বীকার করে।
অ্যাডমো

9

একটি উদাহরণ উদাহরণস্বরূপ সাহায্য করতে পারে। ধরুন, কার্যকারণীয় মডেলিংয়ের কাঠামোটিতে আপনি (আগ্রহের এক্সপোজার) ওয়াই (আগ্রহের ফলাফল ) এর মধ্যকার সম্পর্কটি একটি পরিবর্তনশীল ডাব্লু দ্বারা মধ্যস্থতাবদ্ধ কিনা তা নির্ধারণ করতে আপনি আগ্রহী ? এর অর্থ এই যে দুটি রিগ্রেশন মডেলগুলিতে:XYW

E[Y|X]=β0+β1XE[Y|X,W]=γ0+γ1X+γ2W

প্রভাব প্রভাব γ 1 এর চেয়ে পৃথক ।β1γ1

উদাহরণ হিসাবে, ধূমপান এবং কার্ডিওভাসকুলার (সিভি) ঝুঁকির মধ্যে সম্পর্ক বিবেচনা করুন। ধূমপান স্পষ্টতই সিভি ঝুঁকি বাড়ায় (হার্ট অ্যাটাক এবং স্ট্রোকের মতো ইভেন্টের জন্য) শিরাগুলি ভঙ্গুর এবং ক্যালক্লিফিক হওয়ার ফলে। তবে ধূমপানও একটি ক্ষুধা দমনকারী। সুতরাং আমরা কৌতূহল করব যে ধূমপান এবং সিভি ঝুঁকির মধ্যে অনুমানের সম্পর্কটি বিএমআই দ্বারা মধ্যস্থতা লাভ করে, যা স্বতন্ত্রভাবে সিভি ঝুঁকির জন্য ঝুঁকির কারণ। এখানে একটি লজিস্টিক রিগ্রেশন মডেল বা করোনারি আর্টারি ক্যালেসিফিকেশন (সিএসি), বাম ভেন্ট্রিকুলার ইজেকশন ভগ্নাংশ (এলভিইএফ), বা বাম ভেন্ট্রিকুলার ভর (এলভিএম) এর মতো অবিচ্ছিন্ন পরিবর্তনশীল একটি বাইনারি ইভেন্ট (মায়োকার্ডিয়াল বা স্নায়বিক ইনফার্কশন) হতে পারে।Y

আমরা দুটি মডেল ফিট করব 1: বয়স, লিঙ্গ, আয়, এবং হৃদরোগের পারিবারিক ইতিহাসের মতো ধূমপান এবং ফলাফলের সাথে সামঞ্জস্য করার পরে 2: পূর্ববর্তী সমস্ত কোভারিয়েটগুলির পাশাপাশি বডি মাস ইনডেক্স। মডেল 1 এবং 2 এর মধ্যে ধূমপানের প্রভাবের পার্থক্যটি যেখানে আমরা আমাদের অনুগ্রহকে ভিত্তি করি।

আমরা হাইপোথেসিস এইচ পরীক্ষা করতে আগ্রহী

H:β1=γ1K:β1γ1

একটি সম্ভাব্য প্রভাব পরিমাপ হতে পারে: বা এস = β 1 / γ 1 বা পরিমাপের যে কোনও সংখ্যা। আপনি টি এবং এস এর জন্য সাধারণ অনুমান ব্যবহার করতে পারেন । এই অনুমানকারীগুলির স্ট্যান্ডার্ড ত্রুটিটি পাওয়া খুব জটিল। এগুলির বিতরণকে বুটস্ট্র্যাপিং করা তবে একটি সাধারণভাবে ব্যবহৃত কৌশল এবং এটি থেকে সরাসরি পি- ভ্যালু গণনা করা সহজ ।T=β1γ1S=β1/γ1TSp


আমি মনে করি আপনি এই উত্তরটি নিয়ে কোথায় যাচ্ছেন তা আমি বুঝতে পেরেছি তবে বিশদগুলি দেখে আমি হতবাক। আপনি কী আপনার এবং এস এর বিবরণগুলিতে পরামিতিগুলির উপরে টুপি রাখার পরিকল্পনা করেছিলেন ? এগুলির মতো পাঠ্য শোনানো অনুমানের পরিবর্তে কোনও মডেলের বৈশিষ্ট্য হওয়া উচিত। এর মতো দুটি পৃথক মডেলের বৈশিষ্ট্যগুলি মিশ্রিত করতে এটি কী বোঝায় ? যদি আপনি সত্যিই টুপি বোঝাতে চেয়েছিলেন, তবে টি এবং এস হ'ল পরিসংখ্যান, স্পষ্টতই অনুমানকারী হিসাবে ব্যবহৃত হতে পারে, তবে তারা কী অনুমান করার উদ্দেশ্যে? TSTS
হোবার

TS

γ2=0

@ শুভ আহ আমি বিভ্রান্তি দেখছি এখানে ম্যাককিনন থেকে একটি প্রস্তাবিত নিবন্ধ দেখুন ।
অ্যাডামো

আপনাকে ধন্যবাদ: সেই রেফারেন্স আমাকে আপনার উদাহরণটি আরও ভালভাবে বুঝতে সহায়তা করে। যদিও এই পদ্ধতির সাথে জড়িত অনেক তাত্ত্বিক solecism সম্পর্কে আমার প্রতিক্রিয়া রয়েছে তবে এগুলি আপনার উদাহরণের যথাযথতার সাথে অপ্রাসঙ্গিক: এটাই যথেষ্ট যে লোকেরা এইভাবে ডেটা বোঝার চেষ্টা করেছে এবং অনুমানকারীদের জন্য স্ট্যান্ডার্ড ত্রুটিগুলি অনুমান করার প্রয়োজন দেখেছেটি অথবা এস। যদিও আমি লক্ষ্য করেছি যে আপনার শেষ অনুচ্ছেদটি এখনও তার মধ্যে পার্থক্য করে নাটি এবং এর অনুমানকারী: টিএকটি মডেল সম্পত্তি এবং যেমন কোন বিতরণ এবং কোন এসই আছে। এর একটি অনুমানকারীটিএকটি বিতরণ আছে।
হোবার

2

প্রতিটি পরিসংখ্যান পরিমাপের জন্য প্যারামেট্রিক সমাধান থাকা বাঞ্ছনীয় তবে একই সময়ে, বেশ অবাস্তব। বুটস্ট্র্যাপ সেই সব ক্ষেত্রে কাজে আসে। আমার মনে যে উদাহরণটি প্রবাহিত হয়েছে তা উচ্চ স্কুং ব্যয় বিতরণের দুটি মাধ্যমের মধ্যে পার্থক্যকে উদ্বেগ করে। সেক্ষেত্রে ক্লাসিক দ্বি-নমুনা টি-পরীক্ষা তার তাত্ত্বিক প্রয়োজনীয়তাগুলি পূরণ করতে ব্যর্থ হয় (তদন্তের অধীনে নমুনাগুলি তাদের দীর্ঘ ডান-লেজের কারণে স্বাভাবিকতা থেকে বিদায় নিয়েছিল) এবং নন-প্যারামেট্রিক পরীক্ষাগুলি প্রকাশের অভাব হয় সিদ্ধান্ত গ্রহণকারীদের জন্য দরকারী ইনফ্রোমেশন (যারা সাধারণত পদে আগ্রহী না) are এই ইস্যুতে আটকে না যাওয়ার সম্ভাব্য সমাধান হ'ল দ্বি-নমুনা বুটস্ট্র্যাপ টি-টেস্ট।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.