দুটি নমুনার মাধ্যমের সাথে তুলনা করতে কীভাবে বুটস্ট্র্যাপ পরীক্ষা করা যায়?


12

আমার কাছে দুটি ভারী স্কিউল নমুনা রয়েছে এবং টি-স্ট্যাটিস্টিক ব্যবহার করে তাদের উপায়গুলির সাথে তুলনা করতে বুটস্ট্র্যাপিং ব্যবহার করার চেষ্টা করছি।

এটি করার সঠিক পদ্ধতি কী?


যে প্রক্রিয়াটি আমি ব্যবহার করছি

আমি চূড়ান্ত পদক্ষেপে মূল / পর্যবেক্ষণ করা তথ্যের মানক ত্রুটি ব্যবহারের যথাযথতা সম্পর্কে উদ্বিগ্ন যখন আমি জানি যে এটি সাধারণত বিতরণ করা হয় না।

আমার পদক্ষেপ এখানে:

  • বুটস্ট্র্যাপ - প্রতিস্থাপনের সাথে এলোমেলোভাবে নমুনা (এন = 1000)
  • টি-বিতরণ তৈরি করতে প্রতিটি বুটস্ট্র্যাপের জন্য টি-স্ট্যাটিস্টিক গণনা করুন:
    T(b)=(X¯b1X¯b2)(X¯1X¯2)σxb12/n+σxb22/n
  • টি-ডিস্ট্রিবিউশনের এবং শতাংশের মাধ্যমে টি আত্মবিশ্বাসের ব্যবধানগুলি অনুমান করুন1 - α / 2α/21α/2
  • এর মাধ্যমে আত্মবিশ্বাসের ব্যবধান পান:

    CIL=(X¯1X¯2)T_CIL.SEoriginal
    CIU=(X¯1X¯2)+T_CIU.SEoriginal
    যেখানে
    SE=σX12/n+σX22/n
  • আত্মবিশ্বাসের ব্যবধানগুলি যেখানে কোনও উল্লেখযোগ্য পার্থক্য রয়েছে তা নির্ধারণ করতে কোথায় (যেমন শূন্য নয়) দেখুন

আমি উইলকক্সন র‌্যাঙ্ক-সমষ্টিও দেখেছি তবে খুব ভারী স্কেল বিতরণের কারণে (যেমন 75 তম == 95 তম পার্সেন্টাইল) এটি খুব যুক্তিসঙ্গত ফলাফল দিচ্ছে না। এই কারণে আমি বুটস্ট্র্যাপযুক্ত টি-টেস্ট আরও অন্বেষণ করতে চাই।

সুতরাং আমার প্রশ্নগুলি হ'ল:

  1. এটি কি উপযুক্ত পদ্ধতি?
  2. যখন আমি জানি যে এটি অত্যধিকভাবে স্কিউড হয়েছে তখন পর্যবেক্ষণ করা ডেটার এসই ব্যবহার করা কি উপযুক্ত?

সম্ভাব্য সদৃশ: কোন পদ্ধতিটি পছন্দ করা হয়, একটি বুটস্ট্র্যাপিং পরীক্ষা বা ননপ্যারামেট্রিক র‌্যাঙ্ক-ভিত্তিক পরীক্ষা?


নমুনা কত বড়?
মাইকেল এম


উত্তর:


16

আমি কেবল একটি নিয়মিত বুটস্ট্র্যাপ পরীক্ষা করব:

  • আপনার ডেটাতে টি-পরিসংখ্যান গণনা করুন এবং এটি সঞ্চয় করুন
  • ডেটা পরিবর্তন করুন যাতে নাল-অনুমানটি সত্য হয়। এই ক্ষেত্রে, গ্রুপ 1 এর জন্য গ্রুপ 1 এ গড়টি বিয়োগ করুন এবং সামগ্রিক গড় যুক্ত করুন এবং 2 গ্রুপের জন্য একই করুন, এইভাবে উভয় গ্রুপের অর্থ সামগ্রিক গড় হবে।
  • এই ডেটাসেট থেকে বুটস্ট্র্যাপের নমুনাগুলি নিন, সম্ভবত 20,000 এর ক্রমে।
  • এই প্রতিটি বুটস্ট্র্যাপ নমুনায় টি-স্ট্যাটিস্টিক গণনা করুন। এই টি-পরিসংখ্যানগুলির বিতরণ নাল-হাইপোথিসিসটি সত্য হলে আপনার স্কিউড ডেটাতে টি-স্ট্যাটিস্টিকের স্যাম্পলিং বিতরণের বুটস্ট্র্যাপ অনুমান।
  • বুটস্ট্র্যাপ টি-পরিসংখ্যানের অনুপাত যা আপনার পর্যবেক্ষণ করা টি-স্ট্যাটিস্টিকের চেয়ে বড় বা সমান, ভ্যালু সম্পর্কে আপনার অনুমান । আপনি এ খুঁজছেন দ্বারা একটি বিট আরো ভালো করতে পারে বুটস্ট্র্যাপ টি-পরিসংখ্যান যে চেয়ে বড় বা পর্যবেক্ষিত টি-পরিসংখ্যাত সমান সংখ্যা দ্বারা বিভক্ত বুটস্ট্র্যাপ নমুনার সংখ্যা । তবে বুটস্ট্র্যাপের নমুনার সংখ্যা বড় হলে পার্থক্যটি ছোট হতে চলেছে।p(+1)(+1)

আপনি এতে আরও পড়তে পারেন:

  • এসি ডেভিসন এবং ডিভি হিঙ্কলি (1997) বুটস্ট্র্যাপ পদ্ধতি এবং তাদের প্রয়োগের অধ্যায় 4 । কেমব্রিজ: কেমব্রিজ বিশ্ববিদ্যালয় প্রেস।

  • ব্র্যাডলি ইফ্রন এবং রবার্ট জে টিবশিরানী (1993) এর অধ্যায় 16 বুটস্ট্র্যাপের একটি ভূমিকা । বোকা রটন: চ্যাপম্যান অ্যান্ড হল / সিআরসি।

  • বুটস্ট্র্যাপ হাইপোথিসিস পরীক্ষায় উইকিপিডিয়া এন্ট্রি।


এটি মূলত আমি যা করছি তা কিন্তু মূল / পর্যবেক্ষণ করা টি-স্ট্যাটিস্টিকটি> = বুটস্রেপড টি-স্ট্যাটিস্টিকের সময়ের অনুপাতের দিকে তাকিয়ে। প্রথম উদাহরণে ভারী স্কিউড ডেটাতে টি-টেস্ট করা কি ঠিক আছে, আমি কেন বুস্টারপ করতে চাই তার এই অন্যতম কারণ।
ক্যাটসলভজ্যাজ

2
প্রযুক্তিগতভাবে, বুটস্ট্র্যাপ পরীক্ষার জন্য আপনার কেবল একটি পরীক্ষা-পরিসংখ্যান প্রয়োজন যাতে সমস্যা না হয়। তাত্ক্ষণিকভাবে, একটি টি-পরীক্ষা মানে তুলনা করে এবং স্কিউ ডেটা মিডিয়ানদের মধ্যে প্রায়শই অর্থের চেয়ে বেশি অর্থবহ হয়। সুতরাং পরিবর্তে মাধ্যমের তুলনায় একটি পরীক্ষা আরও বোধগম্য হতে পারে। তবে এটি আপনার নাল-হাইপোথিসিসের উপর নির্ভর করে যা আপনার পছন্দ এবং একা আপনার পছন্দ।
মার্টেন বুইস

ঠিক আছে ধন্যবাদ, আমাদের অন্য সমস্ত আউটপুট এই ফর্মটিতে যেমন রয়েছে তেমনি আমরা এটি পরীক্ষা করতে চাই।
বিড়াললভজ্যাজ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.