একাধিক তুলনায় একাধিক রিগ্রেশনে পি-মানগুলি সামঞ্জস্য করা কি ভাল ধারণা?


54

ধরে নেওয়া যাক আপনি কোনও সামাজিক বিজ্ঞান গবেষক / একনোমেট্রিকিয়ান কোনও পরিষেবার জন্য চাহিদার প্রাসঙ্গিক ভবিষ্যদ্বাণী খুঁজে পাওয়ার চেষ্টা করছেন Le আপনার কাছে চাহিদা অনুসারে বর্ণিত দুটি ফলাফল / নির্ভরশীল ভেরিয়েবল রয়েছে (হ্যাঁ / না পরিষেবা এবং অনুষ্ঠানের সংখ্যাটি ব্যবহার করে)। আপনার কাছে 10 ভবিষ্যদ্বাণী / স্বতন্ত্র ভেরিয়েবল রয়েছে যা তাত্ত্বিকভাবে চাহিদাটি ব্যাখ্যা করতে পারে (যেমন, বয়স, লিঙ্গ, আয়, দাম, জাতি ইত্যাদি)। দুটি পৃথক পৃথক একাধিক রিগ্রেশন চালনা করলে 20 সহগের অনুমান এবং তাদের পি-মান পাওয়া যাবে। আপনার অঞ্চলগুলিতে পর্যাপ্ত স্বতন্ত্র ভেরিয়েবলের সাহায্যে আপনি শিগগিরই নির্ভরশীল এবং স্বতন্ত্র ভেরিয়েবলের মধ্যে পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ পারস্পরিক সম্পর্কের সাথে কমপক্ষে একটি পরিবর্তনশীল খুঁজে পাবেন।

আমার প্রশ্ন: আমি যদি রিগ্রেশনে সমস্ত স্বতন্ত্র ভেরিয়েবলগুলি অন্তর্ভুক্ত করতে চাই তবে একাধিক পরীক্ষার জন্য পি-মানগুলি সংশোধন করা ভাল ধারণা? পূর্ববর্তী কাজের কোনও উল্লেখগুলি অনেক প্রশংসিত।


হুঁ ... মজাদার সমস্যা - এক পরিবর্তনশীল [ধরণের] অবিচ্ছিন্ন এবং এক দ্বিধাত্ত্বিক সহ দ্বিবিভক্ত রিগ্রেশন। সাধারণ এমভিএন রিগ্রেশন থিওরি বলে যে দুটি বিভাজনযুক্ত সাধারণ প্রতিক্রিয়ার প্রত্যেকে আলাদা আলাদা রেজিস্ট্রেশন করা - এবং তারপরে ফলাফলগুলি একসাথে ছুঁড়ে ফেলা - সঠিক বিশ্লেষণ - সমস্ত নিরপেক্ষ লৈখিক অনুমানকারীদের মধ্যে রিগ্রেশন অনুমানের ভিসি ম্যাট্রিক্সকে হ্রাস করার - এবং এমভিএন ক্ষেত্রে, সমস্ত পক্ষপাতহীন অনুমানকারীদের মধ্যে]। যখন কোনও রিগ্রেশন লজিস্টিক হয় তখন কি 'পৃথক রেগ্রেশন' এখনও সবচেয়ে ভাল হয়? [নিরপেক্ষতা এক্ষেত্রে কিছুটা প্রসারিত মনে হয়, ব্যতীত
রোনাফ

উত্তর:


48

দেখে মনে হচ্ছে আপনার প্রশ্নটি আরও ভাল ভবিষ্যদ্বাণীকারীদের চিহ্নিত করার সমস্যাটিকে আরও সমাধান করে। এই ক্ষেত্রে, আপনাকে কিছু ধরণের দণ্ডিত রিগ্রেশন (ভেরিয়েবল বা বৈশিষ্ট্য নির্বাচনের সাথে সম্পর্কিত পদ্ধতিগুলিও প্রাসঙ্গিক) ব্যবহার করা বিবেচনা করা উচিত , যেমন এল 1, এল 2 (বা এর সংমিশ্রণ, তথাকথিত ইলাস্টিকনেট ) জরিমানা (সম্পর্কিত প্রশ্নগুলি দেখুন) এই সাইটটি, বা আর দন্ডিত এবং ইলাস্টিকনেট প্যাকেজ, অন্যদের মধ্যে)।

এখন, অতিরিক্ত-আশাবাদ থেকে রক্ষা করার জন্য আপনার রিগ্রেশন সহগের (বা সমতুল্যভাবে আপনার আংশিক পারস্পরিক সম্পর্ক সহগ) এর জন্য পি-মানগুলি সংশোধন করার বিষয়ে (যেমন বনফেরনির সাথে বা আরও ভাল, ধাপে-নীচে পদ্ধতিগুলি) মনে হয়, এটি কেবল তখনই প্রাসঙ্গিক হবে যদি আপনি বিবেচনা করছেন একটি মডেল এবং সেই ভবিষ্যদ্বাণীকারীদের সন্ধান করুন যা ব্যাখ্যাযোগ্য পরিবর্তনের একটি উল্লেখযোগ্য অংশকে অবদান রাখে, এটি হ'ল যদি আপনি মডেল নির্বাচন না করেন (ধাপে ধাপে নির্বাচন, বা শ্রেণিবদ্ধ পরীক্ষা দিয়ে)। এই নিবন্ধটি একটি ভাল শুরু হতে পারে: রিগ্রেশন কোএফিসিয়েন্টগুলির জন্য টেস্টগুলিতে বোনফেরনির সামঞ্জস্য । সচেতন থাকুন যে এই ধরনের সংশোধন আপনাকে মাল্টিকাল্লাইনারিটি ইস্যু থেকে রক্ষা করবে না, যা রিপোর্ট করা পি-মানগুলিকে প্রভাবিত করে।

আপনার ডেটা দেওয়া, আমি কিছু ধরণের পুনরাবৃত্ত মডেল নির্বাচন কৌশল ব্যবহার করার পরামর্শ দিচ্ছি। উদাহরণস্বরূপ আর-তে, stepAICফাংশনটি সঠিক এআইসির মাধ্যমে ধাপে ধাপে মডেল নির্বাচন করতে দেয়। বুস্ট্র্যাপ ( রিলেম্পো প্যাকেজ দেখুন) ব্যবহার করে pred তে অবদানের ভিত্তিতে আপনার ভবিষ্যদ্বাণীকারীদের আপেক্ষিক গুরুত্ব সম্পর্কেও আপনি আন্দাজ করতে পারেন । আমি মনে করি যে রিপোর্টিং এফেক্ট আকারের পরিমাপ বা বর্ণিত% এর% ব্যাখ্যাগুলি পি-ভ্যালুর চেয়ে বেশি তথ্যমূলক, বিশেষত একটি নিশ্চিতকরণের মডেল।R2

এটি লক্ষ করা উচিত যে ধাপে ধাপে ধাপে ধাপে তাদের অসুবিধাগুলিও রয়েছে (উদাহরণস্বরূপ, ওয়াল্ড পরীক্ষাগুলি পদক্ষেপের পদ্ধতি দ্বারা প্ররোচিত হিসাবে শর্তাধীন অনুমানের সাথে খাপ খাইয়ে নেওয়া হয় না), বা আর মেলিংয়ের উপর ফ্র্যাঙ্ক হ্যারেলের নির্দেশ অনুসারে , "এআইসির ভিত্তিতে স্টেপওয়াইজ ভেরিয়েবল সিলেকশন সমস্ত রয়েছে ধাপে ধাপে পরিবর্তনশীল নির্বাচনের সমস্যাগুলি পি-মানের উপর ভিত্তি করে IC সম্পর্কিত প্রশ্ন - লিনিয়ার রিগ্রেশন মডেলটিতে কি একটি পরিবর্তনশীল তাৎপর্যপূর্ণ? - পরিবর্তনশীল নির্বাচনের জন্য এআইসির ব্যবহার সম্পর্কে আকর্ষণীয় মন্তব্য ( @ রব , অন্যদের মধ্যে) উত্থাপিত । আমি শেষে বেশ কয়েকটি রেফারেন্স সংযোজন করেছি ( @ স্টেফান দ্বারা সরবরাহিত পেপার সহ )); পি.এমনে আরও অনেক উল্লেখ রয়েছে

ফ্র্যাঙ্ক হ্যারেল রিগ্রেশন মডেলিং স্ট্র্যাটেজি সম্পর্কিত একটি বই লিখেছেন যাতে এই সমস্যাটি সম্পর্কে প্রচুর আলোচনা এবং পরামর্শ রয়েছে (§4.3, পৃষ্ঠা 56-60)। জেনারালাইজড লিনিয়ার মডেলগুলি ( ডিজাইন বা আরএমএস প্যাকেজগুলি দেখুন) নিয়ে কাজ করার জন্য তিনি দক্ষ আর রুটিনগুলিও বিকাশ করেছিলেন । সুতরাং, আমি মনে করি আপনাকে অবশ্যই এটি দেখতে হবে (তাঁর হ্যান্ডপাউজগুলি তার হোমপৃষ্ঠায় উপলব্ধ)।

তথ্যসূত্র

  1. হুইটিংহাম, এমজে, স্টিফেনস, পি, ব্র্যাডবেরি, আরবি, এবং ফ্রেকলটন, আরপি (2006)। আমরা এখনও বাস্তুশাস্ত্র এবং আচরণে ধাপে ধাপে মডেলিং ব্যবহার করি না কেন? জার্নাল অফ এনিমাল ইকোলজি , 75 , 1182-1189।
  2. অস্টিন, পিসি (২০০৮) পশ্চাদমাবলী ভেরিয়েবল নির্মূলের তুলনায় বুটস্ট্র্যাপ মডেল নির্বাচনের খাঁটি এবং গোলমাল ভেরিয়েবলগুলি নির্বাচনের জন্য অনুরূপ কর্মক্ষমতা ছিল: একটি সিমুলেশন অধ্যয়নক্লিনিকাল এপিডেমিওলজির জার্নাল , 61 (10) , 1009-1017।
  3. অস্টিন, পিসি এবং টু, জেভি (2004)। লজিস্টিক রিগ্রেশনের জন্য অটোমেটেড ভেরিয়েবল নির্বাচন পদ্ধতি তীব্র মায়োকার্ডিয়াল ইনফার্কশন মৃত্যুর পূর্বাভাস দেওয়ার জন্য অস্থির মডেল তৈরি করেছিলক্লিনিকাল এপিডেমিওলজির জার্নাল , 57 , 1138–1146।
  4. গ্রিনল্যান্ড, এস (1994)। একাধিক এক্সপোজারের এপিডেমিওলজিক বিশ্লেষণের জন্য হায়ারারিকিকাল রিগ্রেশনপরিবেশগত স্বাস্থ্যের দৃষ্টিভঙ্গি , 102 (সাফল্য 8) , 33-39 –
  5. গ্রিনল্যান্ড, এস (২০০৮) সাধারণ এপিডেমিওলজিতে একাধিক তুলনা এবং সমিতি নির্বাচনআন্তর্জাতিক জীবাণু বিজ্ঞান জালিয়াতি , 37 (3) , 430-434।
  6. বিয়েন, জে, আতেনাফু, ইজি, হামিদ, জেএস, টু, টি এবং সুং এল (২০০৯)। ভবিষ্যদ্বাণীমূলক মডেলগুলি বিকাশ ও বৈধকরণে চলকগুলির আপেক্ষিক গুরুত্ব নির্ধারণবিএমসি মেডিকেল গবেষণা পদ্ধতি , 9 , 64।
  7. বার্সাক, জেড, গাউস, সিএইচ, উইলিয়ামস, ডি কে, এবং হোসমার, ডিডাব্লু (২০০৮)। লজিস্টিক রিগ্রেশনে ভেরিয়েবলের উদ্দেশ্যমূলক নির্বাচনজীববিজ্ঞান এবং মেডিসিনের উত্স কোড , 3 , 17।
  8. ব্রম্বিন, সি, ফিনোস, এল, এবং সালমাসো, এল (2007)। সাধারণ রৈখিক মডেল ধাপে ধাপে P-মান সামঞ্জস্যএকাধিক তুলনা পদ্ধতি সম্পর্কিত আন্তর্জাতিক সম্মেলন । - step.adj()আর কিছু এমটিপি প্যাকেজে দেখুন।
  9. উইগ্যান্ড, আরই (2010) পরিবর্তনশীল নির্বাচনের জন্য একাধিক ধাপে ধাপে আলগোরিদিম ব্যবহার পারফরমেন্সমেডিসিনে পরিসংখ্যান , 29 (15), 1647–1659।
  10. মুনস কেজি, ডন্ডার্স এআর, স্টিয়ারবার্গ ইডাব্লু এবং হ্যারেল এফই (2004)। বাইনারি ফলাফলগুলির পূর্বাভাস দেওয়ার জন্য দণ্ডিত সর্বাধিক সম্ভাবনা অনুমান। ক্লিনিকাল এপিডেমিওলজির জার্নাল , 57 (12) , 1262–1270।
  11. তিবশিরানী, আর (1996)। পাদদেশ সংকোচন এবং lasso মাধ্যমে নির্বাচনদ্য রয়্যাল স্ট্যাটিস্টিকাল সোসাইটি জার্নাল বি , 58 (1) , 267–288।
  12. ইফ্রন, বি, হাসিটি, টি, জনস্টোন, আমি, এবং তিবশিরানী, আর (2004)। সর্বনিম্ন অ্যাঙ্গেল রিগ্রেশনপরিসংখ্যানগুলির বার্তা , 32 (2) , 407-499।
  13. ফ্লুম, পিএল এবং ক্যাসেল, ডিএল (2007)। ধাপে ধাপে থামানো: কেন ধাপে ধাপে এবং অনুরূপ নির্বাচনের পদ্ধতিগুলি খারাপ এবং আপনার কী ব্যবহার করা উচিতNESUG 2007 কার্যদিবস
  14. শ্যাটাটল্যান্ড, ইএস, কেইন, ই। এবং বার্টন, এমবি (2001)। স্টেপওয়াইজ লজিস্টিক রিগ্রেশনের বিপদ এবং কীভাবে তথ্য মানদণ্ড এবং আউটপুট বিতরণ সিস্টেম ব্যবহার করে এগুলি থেকে বাঁচতে হয়এসজিজি 26 কার্যদিবস (pp। 222-2226)।

10
ডাউনভোটটি আমার আপত্তি নেই, তবে একটি মন্তব্য প্রশংসিত হবে (যাতে আমি নিজে শিখতে পারি, ভুলটি কী তা বুঝতে পারি এবং আমার ভবিষ্যতের প্রতিক্রিয়াগুলি উন্নত করতে পারি)।
chl

3
+1, ভাল উত্তর এবং লেখকের এবং পাঠকদের উভয়কে কী কী অভাব হতে পারে তা বুঝতে সহায়তা করতে ডাউনভোটদের জন্য একটি ব্যাখ্যা রেখে যাওয়া সম্পর্কে Chl এর মন্তব্যে দ্বিতীয়ত। ধন্যবাদ।
Ars

আমি দ্বিতীয় ধরণের দণ্ডিত রিগ্রেশন (উদাহরণস্বরূপ, লাসো) ব্যবহার করার জন্য chl এর পরামর্শ দিয়েছি ation
এস.কোলাসা - মনিকা

10
@ সিএইচএল: আমি পদক্ষেপের পূর্বাভাসকারী নির্বাচনের প্রস্তাব দিয়ে অসন্তুষ্ট। সাধারণত, এটি পি-মানগুলির উপর ভিত্তি করে ("p> .15 সহ কোনও ভবিষ্যদ্বাণীকে বাদ দিন, পি <.05" থাকলে এটি অন্তর্ভুক্ত করুন) এবং পক্ষপাতদুষ্ট অনুমান এবং খারাপ ভবিষ্যদ্বাণীমূলক পারফরম্যান্সের দিকে পরিচালিত করে (হোয়াইটিংহাম এট আল।, 2006, আমরা এখনও কেন বাস্তুশাস্ত্র এবং আচরণে ধাপে ধাপে মডেলিং ব্যবহার করবেন? জে আনিম ইকোল, 75, 1182-1189)। তবে, এআইসি ভিত্তিক পদক্ষেপের পদ্ধতির একই দুর্বলতা রয়েছে - ফ্রাঙ্ক হ্যারেল সোমবার, 09 আগস্ট 2010 16:34:19 -0500 (সিডিটি) "আরজেটিক রিগ্রেশন ইন আর (এসএএস -) - এর থ্রেডে আর-সাহায্যের একটি পোস্টে এটি নিয়ে আলোচনা করেছেন discussed আউটপুট মত) "।
এস। কোলাসা - মনিকা

মন্তব্যগুলিতে লিঙ্কগুলি অন্তর্ভুক্ত করার কোনও উপায় আছে কি?
এস। কোলাসা - মনিকা

25

একটি দুর্দান্ত ডিগ্রীতে আপনি যা পছন্দনীয় তা করতে পারেন তবে আপনি যে পরিমাণ মডেল ধরে রেখেছেন তা ধরে রাখতে তথ্যের ভিত্তিতে র্যান্ডম পর্যায়ে যথেষ্ট পরিমাণ তথ্য রাখেন provided একটি 50% বিভক্ত একটি ভাল ধারণা হতে পারে। হ্যাঁ, আপনি সম্পর্কগুলি সনাক্ত করার কিছু ক্ষমতা হারাতে পারেন তবে আপনি যা অর্জন করেছেন তা প্রচুর; যথা, আপনার কাজ প্রকাশের আগে প্রতিলিপি তৈরির ক্ষমতা । আপনি পরিসংখ্যানগত কৌশলগুলি বহন করার জন্য যতই পরিশীলিত হন না কেন, নিশ্চিতকরণের ডেটা প্রয়োগ করার সময় আপনি কতগুলি "উল্লেখযোগ্য" ভবিষ্যদ্বাণী সম্পূর্ণরূপে অকেজো হয়ে পড়েছেন তাতে আপনি অবাক হয়ে যাবেন।

মনে রাখবেন, ভবিষ্যদ্বাণীটির জন্য "প্রাসঙ্গিক" অর্থ কম পি-মানের চেয়ে বেশি। সর্বোপরি, কেবলমাত্র এটির অর্থ সম্ভবত এই নির্দিষ্ট ডেটাসেটে পাওয়া কোনও সম্পর্ক সুযোগের কারণে নয়। পূর্বাভাসের জন্য ভবিষ্যদ্বাণীটির (মডেলকে অতিরিক্ত মানানসই না করে) যথেষ্ট প্রভাব ফেলতে পারে এমন ভেরিয়েবলগুলি সন্ধান করা আসলে আরও গুরুত্বপূর্ণ; এটি হ'ল "আসল" হওয়ার সম্ভাবনাযুক্ত ভেরিয়েবলগুলি সন্ধান করার জন্য এবং যখন মানগুলির একটি যুক্তিসঙ্গত পরিসরে বিস্তৃত হয় (কেবলমাত্র আপনার নমুনাতে দেখা যায় এমন মানগুলিই নয়!), ভবিষ্যদ্বাণীটি প্রশংসনীয়ভাবে পরিবর্তিত হতে পারে। কোনও মডেলটি নিশ্চিত করার জন্য আপনার কাছে যখন হোল্ড-আউট ডেটা থাকে, আপনি সাময়িকভাবে "উল্লেখযোগ্য" ভেরিয়েবলগুলিকে কম পি-ভ্যালু না রাখলে আপনি আরও আরামদায়ক হতে পারেন।

এই কারণগুলির জন্য (এবং সিএল এর উত্তম উত্তরের উপর ভিত্তি করে), যদিও আমি ধাপে ধাপে মডেল, এআইসির তুলনা এবং বনফেরনি সংশোধনগুলি বেশ কার্যকর (বিশেষত শত শত বা হাজারে সম্ভাব্য ভবিষ্যদ্বাণীদের খেলায়) পেয়েছি, তবে এগুলি কোন পরিবর্তনকের একমাত্র নির্ধারক হওয়া উচিত নয়? আপনার মডেল লিখুন। তত্ত্ব দ্বারা প্রদত্ত গাইডেন্সির দৃষ্টিভঙ্গি হারাবেন না, হয়: কোনও মডেল হওয়ার দৃ strong় তাত্ত্বিক ন্যায়সঙ্গততাযুক্ত ভেরিয়েবলগুলি সাধারণত রাখা উচিত, যদিও তা তাত্পর্যপূর্ণ না হলেও শর্ত থাকে যে তারা অসুস্থ-সমীকরণগুলি তৈরি না করে ( যেমন, কোলাইনারিটি) ।

নোট : আপনি কোনও মডেলটিতে বসতি স্থাপনের পরে এবং হোল্ড-আউট ডেটার সাথে এর কার্যকারিতা নিশ্চিত করার পরে, চূড়ান্ত অনুমানের জন্য হোল্ড-আউট ডেটা সহ ধরে রাখা ডেটা পুনরায় সংযুক্ত করা ভাল। সুতরাং, আপনি মডেল সহগগুলি অনুমান করতে পারেন তার নির্ভুলতার ক্ষেত্রে কিছুই হ'ল না।


ধন্যবাদ! যদি আপনার কাছে মূল ডেটাতে অ্যাক্সেস না থাকে তবে কেবলমাত্র রিগ্রেশন কোঅফিসিয়েন্টগুলির একটি টেবিল, বনফেরনির সামঞ্জস্যটি কি আপনার একমাত্র পছন্দ?
মিকায়েল এম

4
সম্ভবত আপনার পি-মানগুলি রয়েছে :-)। তবে কেবল তাদের এবং সহগের সাথে, বনফেরোনি সামঞ্জস্যের পাশাপাশি আপনি আরও কী করতে পারেন তা কল্পনা করা শক্ত। (আমি যখনই একাধিক পরীক্ষার সাথে কোনও কাগজ পড়ি তখন আমি সর্বদা এ জাতীয় সমন্বয় করি: জাঙ্ক হওয়ার সম্ভাব্য ফলাফলগুলি জানার এটি দ্রুত উপায় Most) বেশিরভাগ লোকেরা ভেরিয়েবলের সংক্ষিপ্ত পরিসংখ্যানও সরবরাহ করে: আপনি বরাবর বা এসডিএস ব্যবহার করতে পারেন প্রতিটি বর্ণনামূলক পরিবর্তনশীল ভবিষ্যদ্বাণীটির উপর কতটা প্রভাব ফেলতে পারে তার অনুমানের সহগগুলি।
whuber

আপনার ব্যাখ্যার জন্য ধন্যবাদ, esp। ক্রস-বৈধতা উপর আমি আপনার শেষ যুক্তির প্রশংসা করি, অর্থাৎ আমাদের তাত্ত্বিক প্রাসঙ্গিকতাও খুঁজে পেতে হবে (পি-মানগুলির বাইরে)।
chl

19

আমি মনে করি এটি খুব ভাল প্রশ্ন; এটি বিতর্কিত একাধিক পরীক্ষার "সমস্যার" কেন্দ্রস্থলে পৌঁছে যা মহামারীবিজ্ঞান থেকে একনোমেট্রিক্স পর্যন্ত ক্ষেত্রগুলিকে জর্জরিত করে। সর্বোপরি, আমরা কীভাবে জানতে পারি যে আমরা যে তাত্পর্য খুঁজে পাই তা উত্সাহজনক কিনা? আমাদের মাল্টিভারেবল মডেলটি কতটা সত্য?

শব্দ ভেরিয়েবলগুলি প্রকাশের সম্ভাবনাটিকে অফসেট করার জন্য প্রযুক্তিগত পদ্ধতির শর্তাবলী, আমি আন্তরিকভাবে 'হুইবার' এর সাথে একমত হই যে আপনার নমুনার কিছু অংশ প্রশিক্ষণের ডেটা এবং বাকী পরীক্ষার ডেটা হিসাবে ব্যবহার করা ভাল ধারণা। এটি প্রযুক্তিগত সাহিত্যে আলোচনার একটি পদ্ধতির, তাই আপনি যদি সময় নেন তবে সম্ভবত কখন এবং কীভাবে এটি ব্যবহার করবেন সে সম্পর্কে কিছু ভাল গাইডলাইন খুঁজে পেতে পারেন।

তবে একাধিক পরীক্ষার দর্শনে আরও সরাসরি আঘাত করার জন্য , আমি আপনাকে নীচের নিবন্ধগুলি নিবন্ধগুলি পড়ার পরামর্শ দিচ্ছি, যার মধ্যে কয়েকটি এমন অবস্থানকে সমর্থন করে যা একাধিক পরীক্ষার জন্য সামঞ্জস্য করা প্রায়শই ক্ষতিকারক (ব্যয় শক্তি), অপ্রয়োজনীয় এবং এমনকি এটি একটি যৌক্তিক ভুল হতে পারে । আমি একজনের পক্ষে এই দাবিটি স্বয়ংক্রিয়ভাবে গ্রহণ করি না যে একজন সম্ভাব্য ভবিষ্যদ্বাণীকারীকে তদন্ত করার আমাদের ক্ষমতা অন্যের তদন্তের মাধ্যমে অজ্ঞাতসারে হ্রাস পেয়েছে। পরিবার-জ্ঞানী হিসাবে আমরা একটি প্রদত্ত মডেল আরও ভবিষ্যতবক্তা অন্তর্ভুক্ত প্রকার 1 টি ত্রুটি হার বৃদ্ধি হতে পারে, কিন্তু যতদিন আমরা আমাদের নমুনা আকার, প্রত্যেকের জন্য প্রকার 1 টি ত্রুটি সম্ভাবনা সীমা অতিক্রম না করে পৃথকভবিষ্যদ্বাণীকারী স্থির; এবং পরিবার-ভিত্তিক ত্রুটির জন্য নিয়ন্ত্রণ করা কোন নির্দিষ্ট ভেরিয়েবল শব্দ এবং কোনটি নয় তা আলোকিত করে না। অবশ্যই, এখানেও তাত্পর্যপূর্ণ পাল্টা যুক্তি রয়েছে।

সুতরাং, যতক্ষণ না আপনি আপনার সম্ভাব্য ভেরিয়েবলগুলির তালিকাকে প্রশ্রয়যোগ্য (যেমন, ফলাফলের পথে পরিচিত পথগুলি) সীমাবদ্ধ রাখবেন ততক্ষণ তত্পরতার ঝুঁকি ইতিমধ্যে বেশ ভালভাবে পরিচালনা করা হয়েছে।

তবে আমি যুক্ত করব যে একটি ভবিষ্যদ্বাণীমূলক মডেল তার ভবিষ্যদ্বাণীকারীদের "সত্য-মান" এর সাথে কার্যকারণী মডেল হিসাবে উদ্বিগ্ন নয় ; মডেলটিতে বিভ্রান্তিকর কিছু হতে পারে, তবে যতক্ষণ আমরা বিস্তৃততার একটি বড় ডিগ্রি ব্যাখ্যা করি ততক্ষণ আমরা খুব বেশি উদ্বিগ্ন নই। এটি কাজটি সহজতর করে তোলে, অন্তত এক অর্থে।

চিয়ার্স,

ব্রেন্ডেন, বায়োস্ট্যাটাস্টিকাল কনসালট্যান্ট

পিএস: আপনি বর্ণিত ডেটার জন্য একটি পৃথক দুটি রেগ্রেশন না করে শূন্য-স্ফীত পোইসন রিগ্রেশন করতে চাইতে পারেন।

  1. পেরেঞ্জার, টিভি বোনফেরনির সমন্বয়গুলির সাথে কী ঘটছে । বিএমজে 1998; 316: 1236
  2. কুক, আরজে এবং ফেয়ারওয়েল, ক্লিনিকাল ট্রায়ালগুলির নকশা এবং বিশ্লেষণে ভিটি বহুগুণ বিবেচনা করুনরয়্যাল স্ট্যাটিস্টিকাল সোসাইটির জার্নাল , সিরিজ এ 1996; ভোল। 159, নং 1: 93-110
  3. রথম্যান, কেজে একাধিক তুলনার জন্য কোনও সমন্বয় প্রয়োজনমহামারীবিজ্ঞান 1990; ভোল। 1, নং 1: 43-46
  4. মার্শাল, জেআর ডেটা ড্রেজিং এবং নোটওয়ার্থনেসমহামারীবিজ্ঞান 1990; ভোল। 1, নং 1: 5-7
  5. গ্রিনল্যান্ড, এস এবং রবিনস, একাধিক তুলনার জন্য জেএম এমপিরিয়াল-বেইস সামঞ্জস্য কখনও কখনও দরকারী । 1991 এপিডেমিওলজি ; ভোল। 2, নং 4: 244-251

চালিত: 2. ক্লিনিকাল ট্রায়ালগুলির নকশা এবং বিশ্লেষণে আরজে এবং বিদায়ী ভিটি বহুগুণ বিবেচনা করুন Cook রয়্যাল স্ট্যাটিস্টিকাল সোসাইটির জার্নাল, সিরিজ এ 1996; ভোল। 159, নং 1: 93-110
ব্রেন্ডেন

আপনার মন্তব্যগুলির জন্য ধন্যবাদ, ব্রেন্ডেন, বিশেষ করে ভবিষ্যদ্বাণী বনাম কার্যকারণ সম্পর্কিত শেষটি। এবং সাইটে আপনাকে স্বাগতম! ভবিষ্যতে আপনার আরও অনেক অবদান দেখার আশা করি hope
whuber

কনডড: ৩. রোথম্যান কেজে একাধিক তুলনার জন্য কোনও সমন্বয় প্রয়োজন। মহামারীবিজ্ঞান 1990; ভোল। 1, নং 1: 43-46 4. মার্শাল জেআর ডেটা ড্রেজিং এবং নোটওয়ার্থনেস। মহামারীবিজ্ঞান 1990; ভোল। 1, নং 1: 5-7 5. একাধিক তুলনার জন্য গ্রিনল্যান্ড এস এবং রবিন্স জেএম এমিরিকাল-বেয়েস সামঞ্জস্য কখনও কখনও দরকারী। 1991 এপিডেমিওলজি; ভোল। 2, নং 4: 244-251
ব্রেন্ডেন

(+1) আপনি নিম্নলিখিত থ্রেডে আগ্রহী হতে পারেন: stats.stackexchange.com/questions/3252/… । দেখে মনে হচ্ছে আমরা প্রচুর লিঙ্কগুলি ভাগ করেছি :-)
chl

6

এখানে ভাল উত্তর আছে। আমাকে কয়েকটি ছোট পয়েন্ট যুক্ত করতে দিন যা আমি অন্য কোথাও coveredাকা দেখি না।

প্রথমত, আপনার প্রতিক্রিয়ার ভেরিয়েবলগুলির প্রকৃতি কী? আরও নির্দিষ্টভাবে, তারা একে অপরের সাথে সম্পর্কিত হিসাবে বোঝা যায়? যদি তারা স্বতন্ত্র (তাত্ত্বিকভাবে) বোঝা যায় তবে / যদি দুটি মডেলের অবশিষ্টাংশগুলি স্বতন্ত্র (অভিজ্ঞতাবাদী) হয়ে থাকে তবে আপনার কেবল দুটি পৃথক একাধিক রিগ্রেশন করা উচিত। অন্যথায়, আপনি একটি মাল্টিভারিয়েট রিগ্রেশন বিবেচনা করা উচিত। ('মাল্টিভিয়ারেট' এর অর্থ> 1 টি প্রতিক্রিয়া ভেরিয়েবল; 'একাধিক' অর্থ> 1 ভবিষ্যদ্বাণীকারী ভেরিয়েবল))

মনে রাখা অন্য জিনিসটি হ'ল মডেলটি একটি বিশ্বব্যাপী পরীক্ষা নিয়ে আসে , যা সমস্ত ভবিষ্যদ্বাণীকের একযোগে পরীক্ষা is এটি সম্ভব যে বিশ্বব্যাপী পরীক্ষাটি 'অ-তাৎপর্যপূর্ণ', যখন পৃথক ভবিষ্যদ্বাণীকারীদের কেউ কেউ 'তাৎপর্যপূর্ণ' বলে মনে হয়। এটি আপনাকে বিরতি দেওয়া উচিত, যদি এটি ঘটে থাকে। অন্যদিকে, যদি বিশ্বব্যাপী পরীক্ষায় কমপক্ষে কিছু ভবিষ্যদ্বাণী সম্পর্কিত সম্পর্কিত পরামর্শ দেয়, যা আপনাকে একাধিক তুলনার সমস্যা থেকে কিছুটা সুরক্ষা দেয় (যেমন এটি প্রস্তাব দেয় যে সমস্ত নাল সত্য নয়)। F


0

আপনি আপাতদৃষ্টিতে সম্পর্কিত নয় এমন রিগ্রেশন করতে পারেন এবং এফ পরীক্ষা ব্যবহার করতে পারেন। আপনার ডেটা এই জাতীয় আকারে রাখুন:

Out1 1 P11 P12 0  0   0
Out2 0 0   0   1  P21 P22

যাতে আপনার প্রথম ফলাফলের জন্য ভবিষ্যদ্বাণীকারীদের মান থাকে যখন সেই ফলাফলটি y পরিবর্তনশীল এবং 0 অন্যথায় এবং বিপরীত হয়। সুতরাং আপনার y উভয় ফলাফলের একটি তালিকা। প্রথম ফলাফলের জন্য P11 এবং P12 দুটি ভবিষ্যদ্বাণী এবং দ্বিতীয় ফলাফলের জন্য P21 এবং P22 দুটি ভবিষ্যদ্বাণী। যদি লিঙ্ক, উভয় ফলাফলের জন্য ভবিষ্যদ্বাণীকারী হয়, ফলাফল 1 এর পূর্বাভাস দেওয়ার জন্য এর ব্যবহারটি 2 ফলাফলের পূর্বাভাস দেওয়ার সময় পৃথক পরিবর্তনশীল / কলামে থাকা উচিত This এটি প্রতিটি ফলাফলের জন্য যৌনতার জন্য আপনার প্রতিরোধের বিভিন্ন differentালু / প্রভাব ফেলতে দেয়।

এই কাঠামোটিতে, আপনি স্ট্যান্ডার্ড এফ পরীক্ষার পদ্ধতি ব্যবহার করতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.