বুটস্ট্র্যাপ বনাম ক্রমানুসরণ অনুমান পরীক্ষা


37

এ জাতীয় বুটস্ট্র্যাপিং, বিন্যাস পরীক্ষা, jackknife, ইত্যাদি অসংখ্য নিবন্ধ আছে & বই উদাহরণস্বরূপ এই কৌশল নিয়ে আলোচনা, যেমন বিভিন্ন জনপ্রিয় রিস্যাম্পলিং কৌশল, যা প্রায়ই বাস্তবে ব্যবহার করা হয়, হয় ফিলিপ আমি ভালো (2010) বিন্যাস, প্যারামেত্রিক এবং বুটস্ট্র্যাপ টেস্ট অনুমানের

আমার প্রশ্নটি যা পুনরায় মডেলিং কৌশলটি আরও বেশি জনপ্রিয়তা অর্জন করেছে এবং প্রয়োগ করা সহজ? বুটস্ট্র্যাপিং বা পারমিটেশন পরীক্ষা?


8
জনপ্রিয়তা মানের জন্য একটি ভাল পরিমাপ খুব কমই। উদ্ধৃতি সংখ্যার (গ্রাহক) সংখ্যা বিবেচনা করে ম্যাকডোনাল্ডস যে কোনও ত্রি-তারকা মিশেলিন প্রতিষ্ঠানের চেয়ে অনেক বেশি জনপ্রিয় (ভাল?) রেস্তোঁরা। আপনি কি আপনার পরবর্তী সেমিনারের স্পিকারকে ম্যাকডোনাল্ডসে নিয়ে যাবেন?
স্টাস্ক

উত্তর:


68

উভয়ই জনপ্রিয় এবং দরকারী, তবে প্রাথমিকভাবে বিভিন্ন ব্যবহারের জন্য। অনুমানের পরীক্ষা করার জন্য ক্রমশক্তি পরীক্ষাটি সেরা এবং আত্মবিশ্বাসের ব্যবধানগুলি নির্ধারণের জন্য বুটস্ট্র্যাপিং সর্বোত্তম।

পারমুয়েশন টেস্টগুলি বিনিময়যোগ্যতার একটি নির্দিষ্ট নাল অনুমানের পরীক্ষা করে, অর্থাত্ কেবল এলোমেলো নমুনা / র্যান্ডমাইজেশন দেখা পার্থক্য ব্যাখ্যা করে। এটি টি-টেস্ট এবং আনোভা-র মতো জিনিসের সাধারণ বিষয়। এটি সময় সিরিজের মতো জিনিসগুলিতেও প্রসারিত হতে পারে (নাল অনুমান যে কোনও ক্রমিক সম্পর্ক নেই) বা রিগ্রেশন (কোনও সম্পর্কের নাল অনুমান) is আত্মবিশ্বাসের ব্যবধানগুলি তৈরি করতে পারমুয়েশন টেস্টগুলি ব্যবহার করা যেতে পারে তবে এর জন্য আরও অনেক অনুমানের প্রয়োজন হয় যা যুক্তিসঙ্গত হতে পারে বা নাও হতে পারে (তাই অন্যান্য পদ্ধতিগুলি পছন্দসই)। ম্যান-হুইটনি / উইলকক্সন পরীক্ষা আসলে একটি ক্রমচারণ পরীক্ষার একটি বিশেষ ঘটনা, তাই তারা কিছুটা উপলব্ধির চেয়ে অনেক বেশি জনপ্রিয়।

বুটস্ট্র্যাপ নমুনা প্রক্রিয়াটির পরিবর্তনশীলতার অনুমান করে এবং আত্মবিশ্বাসের ব্যবধানগুলি নির্ধারণের জন্য ভাল কাজ করে। আপনি এইভাবে হাইপোথিসিসের পরীক্ষা করতে পারেন তবে ক্রমুয়েশন টেস্ট অনুমানগুলি ধারণ করে এমন ক্ষেত্রে এটি পারমিটেশন পরীক্ষার চেয়ে কম শক্তিশালী বলে মনে হয়।


2
উত্তর করার জন্য ধন্যবাদ. বুটস্ট্র্যাপের আত্মবিশ্বাসের ব্যবধান কেন পারমিটেশন পরীক্ষার চেয়ে কম শক্তিশালী? এত কত? কেউ কি এমন পরিস্থিতিগুলিকে চিহ্নিত করতে পারে যার অধীনে এটি উল্লেখযোগ্যভাবে কম শক্তিশালী? আত্মবিশ্বাসের ব্যবধানটি দেখানোর পক্ষে এটি একটি সুবিধা বলে মনে হচ্ছে, সুতরাং সেই দিক থেকে বুটস্ট্র্যাপ আরও মূল্যবান বলে মনে হচ্ছে।
dfrankow

2
@ ডিফ্র্যাঙ্কো, দুটি পদ্ধতি বিভিন্ন অনুমান ব্যবহার করে। বড় নমুনা এবং পার্থক্যের জন্য তারা উভয়ই ঠিক থাকবে তবে ছোট নমুনা / পার্থক্যের সাথে অনুমতিপত্র পরীক্ষা পার্থক্যগুলি খুঁজে পেতে এবং উপযুক্ত হতে পারে more এই উত্তরটি দেখুন: stats.stackexchange.com/questions/112147/… উদাহরণস্বরূপ যেখানে বুটস্ট্র্যাপ এমনকি সঠিক আকারের হয় না ( নালটি সত্য হলে খুব প্রায়ই প্রত্যাখ্যান হয়)।
গ্রেগ স্নো

বুটস্ট্র্যাপিংয়ে কি কোনও পারমিটেশন টেস্টের তারতম্য নয়?
ভিকি বি

@ ভিকিবি, বুটস্ট্র্যাপিং এবং পারমিটেশন পরীক্ষাগুলি প্রায়শই একসাথে উল্লেখ করা হয়, তবে প্রতিস্থাপন ছাড়াই প্রতিস্থাপন এবং ক্রম ছাড়ের নমুনাগুলির সাথে নমুনাগুলি বুস্ট্রেপিং করা হয় যা তারা কী করতে পারে এবং কতটা শক্তিশালী সে বিষয়ে তারতম্য করে।
গ্রেগ স্নো

12

আপনি যদি আর ব্যবহার করেন তবে সেগুলি কার্যকর করা সহজ। উদাহরণস্বরূপ, দেখুন

আমি বলব একটি তৃতীয় বড় কৌশল আছে: ক্রস বৈধতা। এটি মডেলগুলির ভবিষ্যদ্বাণীপূর্ণ শক্তি পরীক্ষা করতে ব্যবহৃত হয়।


8

আমার প্রশ্নটি হল যে কোন পুনরায় মডেলিংয়ের কৌশলটি বেশি জনপ্রিয়তা অর্জন করেছে
বুটস্ট্র্যাপিং বা ক্রমশক্তি পরীক্ষা?

  1. বুটস্ট্র্যাপিং বেশিরভাগ ক্ষেত্রে বড় নমুনার স্ট্যান্ডার্ড ত্রুটি বা আত্মবিশ্বাসের ব্যবধানগুলি উত্পন্ন করা; নাম অনুসারে অনুক্রমের পরীক্ষাগুলি বেশিরভাগ পরীক্ষার বিষয়ে। (প্রতিটি যদিও অন্য কাজের জন্য ব্যবহৃত হতে পারে তেমন অভিযোজিত হতে পারে))

  2. কীভাবে আমরা জনপ্রিয়তার বিচার করব? আমরা যদি মনোবিজ্ঞান এবং শিক্ষার মতো ক্ষেত্রগুলি দেখি তবে আমরা উইলকক্সন-মান-হুইটনি, স্বাক্ষরিত র‌্যাঙ্ক পরীক্ষা, র‌্যাঙ্ক-পারস্পরিক সম্পর্ক পরীক্ষা ইত্যাদির মতো র‌্যাঙ্ক ভিত্তিক পরীক্ষাগুলির প্রচুর ব্যবহার পেতে পারি। এগুলি সমস্ত ক্রমশক্তি পরীক্ষা (অন্যদিকে এমন অনেকগুলি উদাহরণ রয়েছে যেখানে মূল ডেটার ক্রমুয়েশন পরীক্ষাগুলি পরিবর্তে ব্যবহার করা যেতে পারে তবে সাধারণত হয় না)। কিছু অন্যান্য প্রয়োগের ক্ষেত্রে, ক্রমচারণ পরীক্ষা খুব কমই ব্যবহৃত হত, তবে প্রয়োগের ক্ষেত্রগুলিতে বিচিত্র জনপ্রিয়তা কখনও কখনও দরকারীতার চেয়ে যে কোনও অঞ্চলের স্থানীয় সংস্কৃতি সম্পর্কে আরও বেশি কিছু বলে।

কার্যকর করা সহজ?

অনেক ক্ষেত্রে - বিশেষত সহজতর - তারা প্রায় ঠিক সমানভাবে সহজ - এটি মূলত প্রতিস্থাপনের সাথে নমুনা এবং প্রতিস্থাপন ছাড়াই নমুনা দেওয়ার মধ্যে পার্থক্য।

কিছু জটিল ক্ষেত্রে বুটস্ট্র্যাপিং করা সহজ কারণ কারণ (পরীক্ষার দিক থেকে এটি দেখার জন্য) এটি শূন্যের পরিবর্তে বিকল্পের অধীনে কাজ করে (কমপক্ষে নিষ্পাপ বাস্তবায়নগুলি হবে - এটি করা যাতে এটি ভালভাবে কাজ করে) আরও জটিল হতে পারে)।

আরও জটিল ক্ষেত্রে যথাযথ ক্রমবর্ধমান পরীক্ষাগুলি কঠিন হতে পারে কারণ উপযুক্ত বিনিময়যোগ্য পরিমাণ অযৌক্তিক হতে পারে - প্রায়শই একটি প্রায় বিনিময়যোগ্য পরিমাণ সঠিকতার মূল্যে প্রতিস্থাপিত হতে পারে (এবং সত্যিকার অর্থে বিতরণ-মুক্ত)।

বুটস্ট্র্যাপিং মূলত শুরু থেকেই সম্পর্কিত নির্ভুলতার মানদণ্ড (বিরতিগুলির সঠিক কভারেজ) ছেড়ে দেয় এবং পরিবর্তে বড় নমুনাগুলিতে যুক্তিসঙ্গতভাবে ভাল কভারেজ পাওয়ার চেষ্টা করার দিকে মনোনিবেশ করে (কখনও কখনও বোঝা যায় তার চেয়ে কম সাফল্য সহ; যদি আপনি পরীক্ষা না করেন তবে ডন 'আপনার বুটস্ট্র্যাপটি যে কভারেজটি আপনি আশা করেছেন তা দেয় না'।

পারমিটেশন টেস্টগুলি ছোট নমুনাগুলিতে কাজ করতে পারে (যদিও তাত্পর্য স্তরের সীমিত পছন্দ কখনও কখনও খুব ছোট নমুনাগুলির সাথে সমস্যা হতে পারে), বুটস্ট্র্যাপটি একটি বৃহত-নমুনা কৌশল (আপনি যদি এটি ছোট নমুনাগুলি সহ ব্যবহার করেন তবে অনেক ক্ষেত্রে ফলাফল নাও হতে পারে) খুব দরকারী হতে হবে)।

আমি তাদের খুব একই সমস্যাটির প্রতিযোগী হিসাবে খুব কমই দেখতে পাই এবং এগুলি (বিভিন্ন) বাস্তব সমস্যাগুলিতে ব্যবহার করেছি - প্রায়শই প্রাকৃতিক পছন্দ থাকে যার দিকে নজর দেওয়া উচিত।

উভয়েরই উপকার রয়েছে তবে প্যানাসিয়াতেও নয়। যদি আপনি কেবল তাদের মধ্যে একটিতে মনোনিবেশ করে শেখার প্রচেষ্টা হ্রাস করার আশাবাদী হন তবে আপনি হতাশ হবেন - উভয়ই পুনরায় মডেলিং সরঞ্জামবাক্সের প্রয়োজনীয় অঙ্গ।


1
আপনি কি দয়া করে পরিষ্কার করতে পারেন যে " উপযুক্ত বিনিময়যোগ্য পরিমাণ অযৌক্তিক হতে পারে " এর অর্থ কী? (+1 স্পষ্টতই)
usεr11852

1
দুটি উপাদান এবং একটি কোভারিয়েট (বা কেবলমাত্র বহু ভবিষ্যদ্বাণীকের সাথে একটি নিপীড়ন বিবেচনা করুন) নিয়ে একটি পরীক্ষায় ক্রমশক্তি পরীক্ষা করার চেষ্টা বিবেচনা করুন। স্বাধীনতার সাথে এবং কোনও প্রভাব ছাড়াই একেবারে নীচে, পর্যবেক্ষণগুলি বিনিময়যোগ্য এবং সুতরাং আপনি এই অনুমানটি পরীক্ষা করতে পারেন তবে কেবলমাত্র কারণগুলির একটি ক্রমবর্ধমান পরীক্ষা নির্মাণের উপায় আপনার কাছে নেই (যেহেতু আপনি কোভেরিয়েটের কোনও প্রভাব ফেলবে বলে আশা করছেন এবং এটি নাল হওয়ায় পরীক্ষা করা আকর্ষণীয় নয়); একইভাবে আপনি দুটি কারণের মধ্যে একটির ক্রমচারণ পরীক্ষাটি নির্মাণ করতে পারবেন না। ... সিটিডি
গ্লেন_বি -রাইনস্টেট মনিকা

1
সিটিডি ... আপনি যদি পরীক্ষা করেন না এমন জনসংখ্যার গুণাগুণগুলি জানেন (এবং ত্রুটিগুলি সর্বদা বিনিময়যোগ্য হবে) তবে আপনি সেগুলি পর্যবেক্ষণ করতে পারবেন না তবে একটি সুস্পষ্ট বিনিময়যোগ্য পরিমাণ রয়েছে। আপনি যদি সহগ বা ত্রুটিগুলির (যেমন অবশিষ্টাংশ) অনুমানের স্থানে থাকেন তবে পরিমাণগুলি আর বিনিময়যোগ্য। তবে কিছু নির্দিষ্ট অবস্থার অধীনে এগুলি আনুমানিক বিনিময়যোগ্য হবে (কিছু লোক সুনির্দিষ্টভাবে এটি করার পক্ষে পরামর্শ দেয়) .... এবং যদি আপনি এটি করেন তবে আপনি বুটস্ট্র্যাপের মতো কিছু দিয়ে কিন্তু প্রতিস্থাপনের সাথে স্যাম্পলিংয়ের পরিবর্তে স্যাম্পলিং দিয়ে শেষ করেন।
গ্লেন_বি-রিনস্টেট মনিকা

ধন্যবাদ; আমি এই বিষয়ে সাবধানে চিন্তা করব। আমার এখানে শেখার জন্য আরও গভীর কিছু সন্দেহ আছে। :)
usεr11852 বলেছেন মনিক

1
@ নুল কিছু কারণে আমি আপনার রেফারেন্সের জন্য অনুরোধটি মিস করেছি। একটি প্রাথমিক পয়েন্টের জন্য, এখানে কিছু রেফারেন্সগুলি করা উচিত: davegiles.blogspot.com/2019/04/…
Glen_b-Reinstate Monica
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.