পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ না হওয়া সত্ত্বেও কোনও ব্যক্তিকে যখন কোনও রিগ্রেশনে পরিবর্তনশীল অন্তর্ভুক্ত করা উচিত?


37

আমি ইকোনোমেট্রিক্স এবং আর এর সাথে কিছুটা অভিজ্ঞতার সাথে অর্থনীতি বিভাগের ছাত্র I


1
চিকিত্সা গবেষণায় আপনি এটি অন্তর্ভুক্ত করবেন যদি এটিতে গুণগত ইন্টারঅ্যাকশন জড়িত থাকে। লেসি গনটারের কাজটি দেখুন যা আমি এখানে আগে উল্লেখ করেছি। এছাড়াও চক্রবর্তী এবং মুডি-র বইটি স্প্রঞ্জার 2013 সালে প্রকাশিত।
মাইকেল আর চেরনিক

11
এটিও বিবেচনা করুন যে পরিসংখ্যানগত তাত্পর্য সম্পূর্ণ স্বেচ্ছাসেবী। তাৎপর্য কি? 0.05? 0.1? 0.001? যদি তাত্ত্বিক ভিত্তিটি কোনও ভবিষ্যদ্বাণীকে অন্তর্ভুক্ত করে তবে এটি রাখা যথেষ্ট।
আশে

2
আপনি যখন "পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ নন" বলছেন আপনি বুঝতে পারছেন যে আত্মবিশ্বাসের 5% স্তরে এটি কোন স্বেচ্ছাসেবী পছন্দ? (এবং এখানে আরও ভেরিয়েবলগুলি রয়েছে, আপনার একাধিক পরীক্ষার সমস্যা রয়েছে)।
smci

1
@smci 0.05 = 5% তাত্পর্যপূর্ণ স্তরের 95% আত্মবিশ্বাসের স্তরের সাথে মিল রয়েছে, একই বাক্যে শর্তাদি মেশানো এড়াতে যথেষ্ট কারণ রয়েছে। যেহেতু দৃষ্টিতে আস্থার ব্যবধান ছাড়াই তাত্পর্যপূর্ণ প্রক্রিয়া রয়েছে, সাধারণত যে শব্দটি আরও প্রাসঙ্গিক তা ব্যবহার করা সহজ। ব্যতিক্রমগুলি হ'ল আপনি যখন পরিচিতি স্তরে লিঙ্কটি ব্যাখ্যা করছেন।
নিক কক্স

উত্তর:


30

হ্যাঁ!

কোনও গুণাগুণটি শূন্য থেকে পরিসংখ্যানগতভাবে পৃথক নয় এমনটি বোঝায় না যে সহগটি আসলে শূন্য, এটি সহগ অপ্রাসঙ্গিক। পরিসংখ্যানগত তাত্পর্য হিসাবে কোনও প্রভাব কিছুটা স্বেচ্ছাসেবী কাট অফ পাস করে না তা বোঝায় না যে এটির জন্য নিয়ন্ত্রণ করার চেষ্টা করা উচিত নয়।

সাধারণভাবে বলতে গেলে, সমস্যাটি এবং আপনার গবেষণা নকশায় রেজিস্ট্রার হিসাবে কী অন্তর্ভুক্ত করা উচিত সে সম্পর্কে গাইড হওয়া উচিত।

কিছু দ্রুত উদাহরণ:

এবং এটি একটি সম্পূর্ণ তালিকা হিসাবে গ্রহণ করবেন না । আরও বেশি টন নিয়ে আসা কঠিন নয় ...

1. স্থির প্রভাব

এমন পরিস্থিতি যেখানে প্রায়শই ঘটে থাকে তা হ'ল স্থির প্রভাবগুলির সাথে একটি রিগ্রেশন ।

ধরা যাক আপনার কাছে প্যানেল ডেটা রয়েছে এবং আপনি মডেলটিতে অনুমান করতে চান :b

yit=bxit+ui+ϵit

এই মডেলটিকে সাধারণ সর্বনিম্ন বর্গক্ষেত্রের সাথে অনুমান করা যেখানে কে নির্দিষ্ট প্রভাব হিসাবে বিবেচনা করা হয় প্রতিটি জন্য একটি সূচক ভেরিয়েবল সহ সাধারণ ন্যূনতম স্কোয়ার চালানোর সমতুল্য ।uii

যাইহোক, ভেরিয়েবলগুলি (অর্থাত্ সূচক ভেরিয়েবলের সহগ) খুব কমই অনুমান করা হয়। যে কোনও পৃথক স্থির প্রভাব প্রায়শই পরিসংখ্যানগত দিক থেকে তুচ্ছ। আপনি যদি এখনও স্থির প্রতিক্রিয়াগুলির জন্য অ্যাকাউন্ট নিচ্ছেন তবে আপনি এখনও সমস্ত সূচক ভেরিয়েবলগুলি রিগ্রেশনটিতে অন্তর্ভুক্ত করেন।uiui

(আরও উল্লেখ করুন যে সর্বাধিক পরিসংখ্যান প্যাকেজগুলি এমনকি আপনি অন্তর্নির্মিত পদ্ধতিগুলি ব্যবহার করার সময় স্বতন্ত্র নির্দিষ্ট প্রভাবগুলির জন্য স্ট্যান্ডার্ড ত্রুটিগুলি দেয় না individual আপনি পৃথক স্থির প্রভাবগুলির তাত্পর্য সম্পর্কে সত্যই যত্ন নেন না You আপনি সম্ভবত তাদের সম্মিলিত তাত্পর্য সম্পর্কে যত্নশীল হন ।)

2. একসাথে যে ক্রিয়াকলাপ ...

(ক) বহুবর্ষীয় বক্ররেখা ফিটিং (মন্তব্যগুলিতে @ নিককক্সের টুপি)

আপনি যদি একটি ঝুলানো থাকেন ম কিছু বক্ররেখায় ডিগ্রী বহুপদী, আপনি প্রায় সবসময় লোয়ার অর্ডার বহুপদী khuji।k

যেমন আপনি যদি ২ য় অর্ডার বহুত্বীয় ফিট করে থাকেন তবে আপনি চালনা করবেন:

yi=b0+b1xi+b2xi2+ϵi

সাধারণত এবং তার পরিবর্তে চালানো বেশ উদ্ভটb1=0

yi=b0+b2xi2+ϵi

তবে নিউটনিয়ান মেকানিক্সের শিক্ষার্থীরা ব্যতিক্রমগুলি কল্পনা করতে সক্ষম হবে।

(খ) এআর (পি) মডেলগুলি:

ধরা যাক আপনি একটি এআর (পি) মডেলটি অনুমান করছেন যা আপনি নিম্ন অর্ডার শর্তাদি অন্তর্ভুক্ত করবেন। উদাহরণস্বরূপ একটি এআর (2) এর জন্য আপনি চালিত করবেন:

yt=b0+b1yt1+b2yt2+ϵt

এবং এটি চালানো উদ্ভট হবে:

yt=b0+b2yt2+ϵt

(গ) ত্রিকোণমিতিক কার্যাদি

@ নিককক্স যেমন উল্লেখ করেছেন, কোস এবং পদগুলি একইভাবে একসাথে যাওয়ার প্রবণতা রয়েছে। সে সম্পর্কে আরও তথ্যের জন্য, যেমন এই কাগজটি দেখুনcossin

আরো বিস্তৃতভাবে...

যখন এটি করার উপযুক্ত তাত্ত্বিক কারণ রয়েছে তখন আপনি ডান হাতের পার্শ্বের ভেরিয়েবলগুলি অন্তর্ভুক্ত করতে চান।

এবং অন্যান্য উত্তর হিসাবে এবং এখানে স্ট্যাকএক্সচেঞ্জের আলোচনা হিসাবে, পদক্ষেপ অনুসারে চলক নির্বাচন অসংখ্য পরিসংখ্যানগত সমস্যা তৈরি করতে পারে।

এর মধ্যে পার্থক্য করাও গুরুত্বপূর্ণ:

  • একটি গুণগত পরিসংখ্যানগতভাবে একটি ছোট স্ট্যান্ডার্ড ত্রুটির সাথে শূন্য থেকে আলাদা করা যায় না ।
  • একটি বড় স্ট্যান্ডার্ড ত্রুটির সাথে একটি গুণমান পরিসংখ্যানগতভাবে শূন্য থেকে আলাদা করা যায় না ।

পরবর্তী ক্ষেত্রে, গুণমানটি কোনও ব্যাপার না বলে তর্ক করতে সমস্যাযুক্ত। এটি সহজভাবে খারাপ পরিমাপ করা যেতে পারে।


আপনার প্রথম উদাহরণটি স্পর্শ করে, আমরা যে কারণে মডেলটিতে রাখি তা দেখে মনে হয় যে রয়েছে কিনা তা এর ব্যাখ্যা পরিবর্তন করে । (দেখুন উদাঃ en.wikipedia.org/wiki/Partial_regression_plot কিছু --we ব্যবহার ফ্রেজ মত "রৈখিক প্রভাব জন্য নিয়ন্ত্রণ ")। এই পরিস্থিতিতে, এটির তাত্পর্য হিসাবে আমাদের কাছে মডেলটিতে , এটি আমাদের যে ব্যাখ্যা দেয় তা আমাদের কাছে রয়েছে। uibuiuiui
ব্যবহারকারী795305

5
কিছু খুব ভাল উত্তর যা তবুও ইতিমধ্যে কিছুটা বেশি পরিমাণে ছড়িয়ে পড়েছে, তাই আমি আমার উদাহরণগুলি এখানে একটি মন্তব্যে সীমাবদ্ধ রাখব। পলিনোমিয়াল ফিটিং : সর্বাধিক সাধারণত, একটি চতুর্ভুজটি প্রায় সর্বদা লিনিয়ার এবং স্কোয়ার পদগুলির ডাবল অ্যাক্ট দ্বারা লাগানো উচিত। এমনকি যদি একটি মাত্র শব্দ প্রচলিত পর্যায়ে তাৎপর্যপূর্ণ হয় তবে তাদের যৌথ প্রভাবটি মূল। ট্রাইগনোমেট্রিক প্রেডিক্টর একইভাবে, প্রচলিত পর্যায়ে যদি কেউ যোগ্যতা অর্জন করতে ব্যর্থ হয় তবে সাধারণত সাইন এবং কোসাইন একত্রিত হয়। ডাবল ক্রিয়াকলাপগুলি যেমন লাগানো উচিত।
নিক কক্স

2
@ নিককক্স যেহেতু এটি একটি সম্প্রদায়ের উইকি এবং আপনার বক্তব্যটি এখানে উত্থাপিত ব্যক্তির সাথে সরাসরি প্রাসঙ্গিক, আমি মনে করি যে আপনার মন্তব্যটি উপযুক্ত মোড়কে উত্তরে সম্পাদিত হবে। আমার মতে একটি নিখুঁত মন্তব্য রাখা খুব গুরুত্বপূর্ণ, যদিও আমি মনে করি আপনি ঠিক বলেছেন যে এটি একটি মুক্ত-উত্তর হিসাবে ভাল হবে না
সিলভারফিশ

@ সিলভারফিশ ম্যাথু এটি অনুলিপি করতে স্বাগত। তবে এটিকে সম্পাদনা করা আমার পক্ষে কিছুটা অহংকার বলে মনে হচ্ছে।
নিক কক্স

1
@ নিককক্স হাহাহা, আমার কিছু যায় আসে না। :) আমি আপনার পরামর্শ যুক্ত করেছি এবং সম্পাদনা করতে নির্দ্বিধায় !.
ম্যাথু গন

14

হ্যাঁ সেখানে. কোনও পরিসংখ্যান যা আপনার প্রতিক্রিয়া ভেরিয়েবলকে অর্থবহ উপায়ে, এমনকি একটি পরিসংখ্যানগতভাবে তুচ্ছ পর্যায়েও সম্পর্কিত করতে পারে, এটি অন্তর্ভুক্ত না করা হলে আপনার প্রতিরোধকে বিভ্রান্ত করতে পারে। এটি আন্ডারস্পেসিফিকেশন হিসাবে পরিচিত এবং এটি প্যারামিটারের অনুমানগুলিতে নিয়ে যায় যা অন্যথায় হতে পারে এমন সঠিক নয় accurate

https://onlinecourses.science.psu.edu/stat501/node/328

ওপর থেকে:

যদি রিগ্রেশন সমীকরণের এক বা একাধিক গুরুত্বপূর্ণ ভবিষ্যদ্বাণী ভেরিয়েবলগুলি অনুপস্থিত থাকে তবে একটি রিগ্রেশন মডেলকে অপ্রস্তুত করা হয় (ফলাফল 2)। এই পরিস্থিতিটি সম্ভবত সবচেয়ে খারাপ পরিস্থিতি, কারণ একটি স্বল্প স্পষ্ট মডেল পক্ষপাতদুষ্ট রিগ্রেশন সহগ এবং প্রতিক্রিয়ার পক্ষপাতদুষ্ট ভবিষ্যদ্বাণী দেয়। এটি হ'ল, মডেলটি ব্যবহার করার ক্ষেত্রে, আমরা ধারাবাহিকভাবে জনসংখ্যার opালু এবং জনসংখ্যার অর্থকে অবমূল্যায়ন বা অত্যধিক মূল্যায়ন করব। ইতিমধ্যে খারাপ বিষয়গুলিকে আরও খারাপ করার জন্য, গড় বর্গাকার ত্রুটি এমএসই ঝুঁকির দিকে ঝুঁকছে by যার ফলে তার চেয়ে বিস্তৃত আত্মবিশ্বাসের ব্যবধান পাওয়া যায়।


4
এটি বেশ সত্য নয়। একটি বিভ্রান্তিকর পরিবর্তনশীল হওয়ার জন্য এটির ব্যাখ্যাযোগ্য পরিবর্তনশীল এবং সুস্পষ্ট বর্ণনামূলক পরিবর্তনশীল (গুলি) হওয়া দরকার। যদি আগ্রহের ব্যাখ্যাযোগ্য ভেরিয়েবলগুলি পরিবর্তনশীলের কারণ হয় এবং এটি ফলাফলকে প্রভাবিত করে, তবে এটি একটি হস্তক্ষেপকারী পরিবর্তনশীল এবং আপনার জন্য এটি নিয়ন্ত্রণ করা উচিত নয় (যতক্ষণ না আপনি মোট প্রভাবটি পচে যেতে চান)।
মার্টেন বুইস

1
বিভ্রান্তি নিয়ন্ত্রণের বিষয়টিতে এটি খুব অপর্যাপ্ত আলোচনা। ফলাফলের সাথে সম্পর্কের জন্য উদ্বেগজনক পর্যাপ্ত শর্ত নয় এবং মধ্যস্থতাকারীদের জন্য নিয়ন্ত্রণের মাধ্যমে কার্যকারক মডেলগুলির ভুল ব্যবহারের কারণ হতে পারে: এটি "ধূমপান সমাপ্তি করোনারি আর্টিলি ক্যালসিয়াম (সিএসি) নিয়ন্ত্রণের পরে কার্ডিওভাসকুলার রোগের ঝুঁকি হ্রাস করে না" এর মতো গণ্ডগোল বাড়ে। ধূমপান আপনাকে হৃদরোগ দেয় এমন প্রাথমিক উপায় হ'ল সিএসি। পার্ল দ্বারা কার্যকারিতা দেখুন, দ্বিতীয় সংস্করণ, অধ্যায় 3 বিভাগ 3
অ্যাডামো

সম্পাদনা করতে নির্দ্বিধায়। আমি মনে করি না যে তিনি উত্তরটিতে এই ধরণের গভীরতার সন্ধান করছেন, আমার ব্রেভিটি যদি মোটামুটি অসম্পূর্ণতার দিকে পরিচালিত করে তবে ক্ষমা চাই।
দ্বিগুণ করুন

11

সাধারণত আপনি তাত্পর্যকে তাত্ক্ষণিকভাবে তাত্ক্ষণিকভাবে অন্তর্ভুক্ত করেন না বা বাদ দেন না because আপনি সেগুলি অন্তর্ভুক্ত করেছেন কারণ আপনি ধারনা করেছেন যে নির্বাচিত ভেরিয়েবলগুলি (উত্তম) রিগ্রেশন মানদণ্ডের পূর্বাভাসক। অন্য কথায়, ভবিষ্যদ্বাণীকারী নির্বাচন তত্ত্বের উপর ভিত্তি করে।

লিনিয়ার রিগ্রেশন সম্পর্কিত পরিসংখ্যানগত তুচ্ছতা দুটি জিনিসকে বোঝাতে পারে (যার মধ্যে আমি জানি):

  1. তুচ্ছ ভবিষ্যদ্বাণী মানদণ্ডের সাথে সম্পর্কিত নয়। এগুলি বাদ দিন তবে মনে রাখবেন যে তুচ্ছতা প্রমাণ করে না যে তারা সম্পর্কিত নয়। আপনার তত্ত্ব পরীক্ষা করুন।
  2. ভবিষ্যদ্বাণীকারীরা তাত্পর্যপূর্ণ কারণ তারা অন্যান্য ভবিষ্যদ্বাণীকারীদের একটি ফাংশন হিসাবে প্রকাশ করা যেতে পারে। ভবিষ্যদ্বাণীকারীদের সেটটিকে তখন মাল্টিকোল্লাইনার বলা হয়। এটি ভবিষ্যদ্বাণীকারীদের কোনও অর্থে "খারাপ" করে না তবে অপ্রয়োজনীয়।

তাত্পর্যপূর্ণ ভবিষ্যদ্বাণীকারীদের বাদ দেওয়ার একটি বৈধ কারণ হ'ল আপনি ভবিষ্যদ্বাণীকারীদের ক্ষুদ্রতম উপসেট সন্ধান করছেন যা মানদণ্ডের প্রকরণ বা এর বেশিরভাগ অংশ ব্যাখ্যা করে explain যদি এটি খুঁজে পেয়ে থাকে তবে আপনার তত্ত্বটি পরীক্ষা করে দেখুন।


[পি] রিগ্রেশন মানদণ্ডের redictors ? আপনি এটি পুনরায় প্রকাশ করতে ইচ্ছুক হতে পারে।
রিচার্ড হার্ডি

8

অর্থনীতিতে এটি বাম এবং ডান ঘটে। উদাহরণস্বরূপ, আপনি যদি ত্রৈমাসিক মৌসুমী ডামি কিউ 2, কিউ 3 এবং কিউ 4 ব্যবহার করেন তবে প্রায়শই এমন হয় যে একটি গোষ্ঠী হিসাবে তারা উল্লেখযোগ্য, তবে তাদের মধ্যে কিছু স্বতন্ত্রভাবে তাত্পর্যপূর্ণ নয়। এই ক্ষেত্রে আপনি সাধারণত তাদের সব রাখুন।

আর একটি সাধারণ ঘটনা ইন্টারঅ্যাকশন। একটি মডেল বিবেচনা করুন , যেখানে প্রধান প্রভাব তাৎপর্যপূর্ণ নয় তবে ইন্টারঅ্যাকশন । এই ক্ষেত্রে এটি প্রধান প্রভাব রাখার প্রথাগত। আপনার এটিকে বাদ দেওয়া উচিত নয় এমন অনেকগুলি কারণ রয়েছে এবং তাদের মধ্যে কয়েকটি ফোরামে আলোচনা হয়েছিল।z x zyxzzxz

আপডেট: আরেকটি সাধারণ উদাহরণ পূর্বাভাস। ইকোনোমেট্রিক্স সাধারণত অর্থনীতি বিভাগগুলিতে অনুমানের দৃষ্টিভঙ্গি থেকে শেখানো হয়। অনুমানের দৃষ্টিকোণে পি-ভ্যালু এবং তাত্পর্যটির দিকে অনেক মনোযোগ দেওয়া হয়, কারণ আপনি কী কী কী ঘটছে তা বোঝার চেষ্টা করছেন। পূর্বাভাসে, এই স্টাফের উপর খুব বেশি জোর দেওয়া হয়নি, কারণ মডেলটি আগ্রহের পরিবর্তনশীলটিকে কতটা ভালভাবে পূর্বাভাস দিতে পারে তা আপনারাই যত্নবান।

এটি মেশিন লার্নিং অ্যাপ্লিকেশনগুলির সাথে অনুরূপ, বিটিডব্লিউ, যা সম্প্রতি অর্থনীতিতে প্রবেশ করছে। আপনার কাছে সমস্ত উল্লেখযোগ্য ভেরিয়েবল সহ এমন একটি মডেল থাকতে পারে যা পূর্বাভাস দেয় না। এমএলে এটি প্রায়শই তথাকথিত "ওভার ফিটিং" এর সাথে যুক্ত হয়। স্পষ্টতই, পূর্বাভাসে এই জাতীয় মডেলের খুব কম ব্যবহার রয়েছে।


1
এটি কিছু পর্যায়ে কিছুটা অতিরঞ্জিত বলে মনে হচ্ছে। উদাহরণস্বরূপ, একাকী পাঠ্যপুস্তক থেকে অ-অর্থনীতিবিদ হিসাবেও আমার কাছে এটি স্পষ্ট যে ভবিষ্যদ্বাণী করা কমপক্ষে কয়েক দশক ধরে অর্থনীতিবিদদের কাছে ব্যাপকভাবে শেখানো হয়েছিল। "সাম্প্রতিক" হয়েছে কিনা (অবিকল অর্থাত?) বৃদ্ধি কি আরও সূক্ষ্ম বিন্দু যা আমি অভ্যন্তরীণ লোকদের কাছে রেখে যাই।
নিক কক্স

@ নিককক্স একমত হয়েছেন, এটি এমন মনে হয়েছে যে পাঠ্যক্রমের কোনও পূর্বাভাস নেই, যা সত্য নয়।
আকসকল

7

আপনি দুটি ভিন্ন প্রশ্ন জিজ্ঞাসা করছেন:

  1. পরিসংখ্যানগত তাত্পর্য কখন গুরুত্ব দেয় না?
  2. এটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ না হওয়া সত্ত্বেও আমরা কখন কোনও রিগ্রেশনে একটি পরিবর্তনশীল অন্তর্ভুক্ত করব?

সম্পাদনা: এটি মূল পোস্ট সম্পর্কে সত্য ছিল, তবে সম্পাদনার পরে আর সত্য হতে পারে না।


কিউ 1 সম্পর্কে, আমি মনে করি এটি খুব বিস্তৃত হওয়ার সীমান্তে। অনেকগুলি সম্ভাব্য উত্তর রয়েছে, কিছু ইতিমধ্যে সরবরাহ করা হয়েছে। আরও একটি উদাহরণ হ'ল পূর্বাভাসের জন্য মডেলগুলি তৈরি করার সময় (উত্সটি নীচে উদ্ধৃত করার জন্য দেখুন)।


কিউ 2 সম্পর্কিত, পরিসংখ্যানগত তাত্পর্য মডেল বিল্ডিংয়ের পক্ষে একটি শক্তিশালী মানদণ্ড নয়। রব জে হ্যান্ডম্যান তার ব্লগ পোস্টে "ভেরিয়েবল নির্বাচনের পরিসংখ্যান পরীক্ষা" লিখেছেন :

পরিসংখ্যানিক তাত্পর্য সাধারণত কোনও মডেলটিতে কোনও পরিবর্তনশীল অন্তর্ভুক্ত করা উচিত কিনা তা নির্ধারণের জন্য সাধারণত একটি ভাল ভিত্তি নয়, যদিও অনেক লোক যাদের আরও ভাল জানা উচিত তাদের সঠিকভাবে এই উদ্দেশ্যে ব্যবহার করা হয়েছিল। <...> পরিসংখ্যানমূলক পরীক্ষাগুলি অনুমিতিগুলি পরীক্ষা করার জন্য ডিজাইন করা হয়েছিল, ভেরিয়েবলগুলি নির্বাচন করে না।

এছাড়াও নোট করুন যে আপনি প্রায়শই পরিসংখ্যানগতভাবে বিশদভাবে বিশ্লেষণযোগ্য কিছু পরিবর্তনকগুলি সন্ধান করতে পারেন (সুযোগটি আপনার তাৎপর্য স্তরের পছন্দ দ্বারা নিয়ন্ত্রিত হচ্ছে)। কোনও পরিবর্তনশীল পরিসংখ্যানগত দিক থেকে তাত্পর্যপূর্ণ পর্যবেক্ষণটি এই সিদ্ধান্তে পৌঁছাতে যথেষ্ট নয় যে ভেরিয়েবলটি মডেলের অন্তর্ভুক্ত।


4

আমি অন্য "হ্যাঁ" যুক্ত করব। আমাকে সর্বদা শেখানো হয়েছে - এবং আমি এটি পাশ করার চেষ্টা করেছি - যে কোভারিয়েট পছন্দের প্রাথমিক বিবেচনাটি ডোমেন জ্ঞান, পরিসংখ্যান নয়। বায়োস্টাটিস্টিক্সে, উদাহরণস্বরূপ, যদি আমি ব্যক্তিদের জন্য কিছু স্বাস্থ্য ফলাফলের মডেলিং করি তবে তা হ'ল রিগ্রেশন যা বলুক না কেন, মডেলটিতে আমার বয়স, বর্ণ এবং লিঙ্গ অন্তর্ভুক্ত না করার জন্য আপনার জন্য কিছু সুস্পষ্ট যুক্তি প্রয়োজন।

এটি আপনার মডেলের উদ্দেশ্যগুলির উপরও নির্ভর করে। যদি উদ্দেশ্যটি আপনার পরিণামের সাথে সর্বাধিক যুক্ত রয়েছে তা আরও ভালভাবে উপলব্ধি করা হচ্ছে, তবে একটি পার্সিমোনিয়াস মডেল তৈরির কিছু গুণ রয়েছে। আপনি যদি ভবিষ্যদ্বাণী সম্পর্কে চিন্তা করেন, এবং বোঝার বিষয়ে এতটা না, তবে কোভেরিয়েটগুলি অপসারণ করা একটি ছোট উদ্বেগ হতে পারে।

(অবশেষে, আপনি যদি ভেরিয়েবল নির্বাচনের জন্য পরিসংখ্যানগুলি ব্যবহার করার পরিকল্পনা করছেন তবে ফ্র্যাঙ্ক হ্যারেল এই বিষয়ে কী বলছেন তা পরীক্ষা করে দেখুন - http://www.stata.com/support/faqs/statistics/stepwise-regression-problems/ , এবং তাঁর বই রেগ্রেশন মডেলিং কৌশলগুলি সংক্ষেপে, আপনি যখন ভবিষ্যদ্বাণীকারী বা সেরা ভবিষ্যদ্বাণীকারীদের বেছে নেওয়ার জন্য ধাপে ধাপে বা অনুরূপ পরিসংখ্যান ভিত্তিক কৌশল ব্যবহার করেছেন, ততক্ষণে "এই ভাল ভবিষ্যদ্বাণীকারী?" এর কোনও পরীক্ষা মারাত্মক পক্ষপাতদুষ্ট - অবশ্যই তারা ' ভাল ভবিষ্যদ্বাণীকারী, আপনি তাদের সেই ভিত্তিতে বেছে নিয়েছেন এবং সুতরাং সেই ভবিষ্যদ্বাণীকারীদের জন্য p মানগুলি মিথ্যাভাবে কম)


1
@ একন জন এবং মডেল এফ পরিসংখ্যান, s, এবং প্রভাব অনুমান করে মিথ্যা উচ্চ ... এবং ধাপে-নির্বাচিত মডেলগুলি সত্যিকারের ভবিষ্যদ্বাণীকারী এবং মিথ্যা ভবিষ্যদ্বাণীকে ধরে রাখার সমান সম্ভাবনা সম্পর্কে এবং সত্য ভবিষ্যদ্বাণীকারী এবং ভুয়া ভবিষ্যদ্বাণীদের অপসারণের সমান সম্ভাবনা সম্পর্কে। R2
অ্যালেক্সিস

4

"পরিসংখ্যান তাত্পর্য" এর ফলাফলটি সত্যই যা বলেছিল তা হ'ল, টাইপ আই ত্রুটির নির্বাচিত স্তরে আমরা নির্ভর করতে পারি না নির্ভরশীল ভেরিয়েবলের উপর রেজিস্ট্রারের প্রভাব ইতিবাচক বা নেতিবাচক কিনা (এই পোস্টটি দেখুন)।

সুতরাং, আমরা যদি এই রেজিস্টার রাখি, নির্ভরশীল ভেরিয়েবলের নিজস্ব প্রভাব সম্পর্কে যে কোনও আলোচনার কাছে এটির ব্যাকআপ নেওয়ার পরিসংখ্যানিক প্রমাণ নেই।

তবে এই অনুমান ব্যর্থতাটি বলে না যে রেজিস্ট্রার কাঠামোগত সম্পর্কের অন্তর্ভুক্ত নয়, এটি কেবলমাত্র বলে যে নির্দিষ্ট ডেটা সেট সহ আমরা এর সহগের চিহ্নের কিছু নির্দিষ্টতা সহ নির্ধারণ করতে পারিনি।

সুতরাং নীতিগতভাবে, যদি উপস্থিতি সমর্থন করে এমন তাত্ত্বিক যুক্তিগুলি থাকে তবে রেজিস্ট্রার রাখা উচিত।

অন্যান্য উত্তরগুলি এখানে নির্দিষ্ট মডেল / পরিস্থিতি সরবরাহ করেছে যার জন্য এই জাতীয় রেজিস্ট্রারদের নির্দিষ্টকরণে রাখা হয়, উদাহরণস্বরূপ উত্তরটি স্থির-প্রতিক্রিয়া প্যানেল ডেটা মডেলের উল্লেখ করে।


তাত্পর্যপূর্ণ আলোচনায় কেন "আত্মবিশ্বাসের স্তর" টানুন? আমি প্রায়শই দুর্বল পাঠগুলি এবং "99% আত্মবিশ্বাসের স্তরে উল্লেখযোগ্য" এর মতো কাগজপত্রগুলিতে পড়ি। ধারণাগুলির মধ্যে অবশ্যই একটি সম্পর্ক রয়েছে, তবে আপনার এই শব্দটির প্রয়োজন নেই (যা প্রাথমিক পর্যায়ে এটি ব্যাখ্যা করার মতোই বিভ্রান্ত করে)।
নিক কক্স

@ নিক কক্স আপনার একটি পয়েন্ট আছে আমি এটিকে "টাইপ আই ত্রুটি" এ পরিবর্তন করেছি।
অ্যালেকোস পাপাদোপল্লোস 21

1

পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ না হলেও আপনি যদি গবেষণার কেন্দ্রবিন্দু হন তবে আপনি বিশেষ আগ্রহের পরিবর্তনশীলকে অন্তর্ভুক্ত করতে পারেন। এছাড়াও, বায়োস্টাটিক্সে, ক্লিনিকাল তাত্পর্য প্রায়শই পরিসংখ্যানগত তাত্পর্য থেকে পৃথক হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.