আমি ইকোনোমেট্রিক্স এবং আর এর সাথে কিছুটা অভিজ্ঞতার সাথে অর্থনীতি বিভাগের ছাত্র I
আমি ইকোনোমেট্রিক্স এবং আর এর সাথে কিছুটা অভিজ্ঞতার সাথে অর্থনীতি বিভাগের ছাত্র I
উত্তর:
হ্যাঁ!
কোনও গুণাগুণটি শূন্য থেকে পরিসংখ্যানগতভাবে পৃথক নয় এমনটি বোঝায় না যে সহগটি আসলে শূন্য, এটি সহগ অপ্রাসঙ্গিক। পরিসংখ্যানগত তাত্পর্য হিসাবে কোনও প্রভাব কিছুটা স্বেচ্ছাসেবী কাট অফ পাস করে না তা বোঝায় না যে এটির জন্য নিয়ন্ত্রণ করার চেষ্টা করা উচিত নয়।
সাধারণভাবে বলতে গেলে, সমস্যাটি এবং আপনার গবেষণা নকশায় রেজিস্ট্রার হিসাবে কী অন্তর্ভুক্ত করা উচিত সে সম্পর্কে গাইড হওয়া উচিত।
এবং এটি একটি সম্পূর্ণ তালিকা হিসাবে গ্রহণ করবেন না । আরও বেশি টন নিয়ে আসা কঠিন নয় ...
এমন পরিস্থিতি যেখানে প্রায়শই ঘটে থাকে তা হ'ল স্থির প্রভাবগুলির সাথে একটি রিগ্রেশন ।
ধরা যাক আপনার কাছে প্যানেল ডেটা রয়েছে এবং আপনি মডেলটিতে অনুমান করতে চান :
এই মডেলটিকে সাধারণ সর্বনিম্ন বর্গক্ষেত্রের সাথে অনুমান করা যেখানে কে নির্দিষ্ট প্রভাব হিসাবে বিবেচনা করা হয় প্রতিটি জন্য একটি সূচক ভেরিয়েবল সহ সাধারণ ন্যূনতম স্কোয়ার চালানোর সমতুল্য ।
যাইহোক, ভেরিয়েবলগুলি (অর্থাত্ সূচক ভেরিয়েবলের সহগ) খুব কমই অনুমান করা হয়। যে কোনও পৃথক স্থির প্রভাব প্রায়শই পরিসংখ্যানগত দিক থেকে তুচ্ছ। আপনি যদি এখনও স্থির প্রতিক্রিয়াগুলির জন্য অ্যাকাউন্ট নিচ্ছেন তবে আপনি এখনও সমস্ত সূচক ভেরিয়েবলগুলি রিগ্রেশনটিতে অন্তর্ভুক্ত করেন।
(আরও উল্লেখ করুন যে সর্বাধিক পরিসংখ্যান প্যাকেজগুলি এমনকি আপনি অন্তর্নির্মিত পদ্ধতিগুলি ব্যবহার করার সময় স্বতন্ত্র নির্দিষ্ট প্রভাবগুলির জন্য স্ট্যান্ডার্ড ত্রুটিগুলি দেয় না individual আপনি পৃথক স্থির প্রভাবগুলির তাত্পর্য সম্পর্কে সত্যই যত্ন নেন না You আপনি সম্ভবত তাদের সম্মিলিত তাত্পর্য সম্পর্কে যত্নশীল হন ।)
আপনি যদি একটি ঝুলানো থাকেন ম কিছু বক্ররেখায় ডিগ্রী বহুপদী, আপনি প্রায় সবসময় লোয়ার অর্ডার বহুপদী khuji।
যেমন আপনি যদি ২ য় অর্ডার বহুত্বীয় ফিট করে থাকেন তবে আপনি চালনা করবেন:
সাধারণত এবং তার পরিবর্তে চালানো বেশ উদ্ভট
তবে নিউটনিয়ান মেকানিক্সের শিক্ষার্থীরা ব্যতিক্রমগুলি কল্পনা করতে সক্ষম হবে।
ধরা যাক আপনি একটি এআর (পি) মডেলটি অনুমান করছেন যা আপনি নিম্ন অর্ডার শর্তাদি অন্তর্ভুক্ত করবেন। উদাহরণস্বরূপ একটি এআর (2) এর জন্য আপনি চালিত করবেন:
এবং এটি চালানো উদ্ভট হবে:
@ নিককক্স যেমন উল্লেখ করেছেন, কোস এবং পদগুলি একইভাবে একসাথে যাওয়ার প্রবণতা রয়েছে। সে সম্পর্কে আরও তথ্যের জন্য, যেমন এই কাগজটি দেখুন ।
যখন এটি করার উপযুক্ত তাত্ত্বিক কারণ রয়েছে তখন আপনি ডান হাতের পার্শ্বের ভেরিয়েবলগুলি অন্তর্ভুক্ত করতে চান।
এবং অন্যান্য উত্তর হিসাবে এবং এখানে স্ট্যাকএক্সচেঞ্জের আলোচনা হিসাবে, পদক্ষেপ অনুসারে চলক নির্বাচন অসংখ্য পরিসংখ্যানগত সমস্যা তৈরি করতে পারে।
এর মধ্যে পার্থক্য করাও গুরুত্বপূর্ণ:
পরবর্তী ক্ষেত্রে, গুণমানটি কোনও ব্যাপার না বলে তর্ক করতে সমস্যাযুক্ত। এটি সহজভাবে খারাপ পরিমাপ করা যেতে পারে।
হ্যাঁ সেখানে. কোনও পরিসংখ্যান যা আপনার প্রতিক্রিয়া ভেরিয়েবলকে অর্থবহ উপায়ে, এমনকি একটি পরিসংখ্যানগতভাবে তুচ্ছ পর্যায়েও সম্পর্কিত করতে পারে, এটি অন্তর্ভুক্ত না করা হলে আপনার প্রতিরোধকে বিভ্রান্ত করতে পারে। এটি আন্ডারস্পেসিফিকেশন হিসাবে পরিচিত এবং এটি প্যারামিটারের অনুমানগুলিতে নিয়ে যায় যা অন্যথায় হতে পারে এমন সঠিক নয় accurate
https://onlinecourses.science.psu.edu/stat501/node/328
ওপর থেকে:
যদি রিগ্রেশন সমীকরণের এক বা একাধিক গুরুত্বপূর্ণ ভবিষ্যদ্বাণী ভেরিয়েবলগুলি অনুপস্থিত থাকে তবে একটি রিগ্রেশন মডেলকে অপ্রস্তুত করা হয় (ফলাফল 2)। এই পরিস্থিতিটি সম্ভবত সবচেয়ে খারাপ পরিস্থিতি, কারণ একটি স্বল্প স্পষ্ট মডেল পক্ষপাতদুষ্ট রিগ্রেশন সহগ এবং প্রতিক্রিয়ার পক্ষপাতদুষ্ট ভবিষ্যদ্বাণী দেয়। এটি হ'ল, মডেলটি ব্যবহার করার ক্ষেত্রে, আমরা ধারাবাহিকভাবে জনসংখ্যার opালু এবং জনসংখ্যার অর্থকে অবমূল্যায়ন বা অত্যধিক মূল্যায়ন করব। ইতিমধ্যে খারাপ বিষয়গুলিকে আরও খারাপ করার জন্য, গড় বর্গাকার ত্রুটি এমএসই ঝুঁকির দিকে ঝুঁকছে by যার ফলে তার চেয়ে বিস্তৃত আত্মবিশ্বাসের ব্যবধান পাওয়া যায়।
সাধারণত আপনি তাত্পর্যকে তাত্ক্ষণিকভাবে তাত্ক্ষণিকভাবে অন্তর্ভুক্ত করেন না বা বাদ দেন না because আপনি সেগুলি অন্তর্ভুক্ত করেছেন কারণ আপনি ধারনা করেছেন যে নির্বাচিত ভেরিয়েবলগুলি (উত্তম) রিগ্রেশন মানদণ্ডের পূর্বাভাসক। অন্য কথায়, ভবিষ্যদ্বাণীকারী নির্বাচন তত্ত্বের উপর ভিত্তি করে।
লিনিয়ার রিগ্রেশন সম্পর্কিত পরিসংখ্যানগত তুচ্ছতা দুটি জিনিসকে বোঝাতে পারে (যার মধ্যে আমি জানি):
তাত্পর্যপূর্ণ ভবিষ্যদ্বাণীকারীদের বাদ দেওয়ার একটি বৈধ কারণ হ'ল আপনি ভবিষ্যদ্বাণীকারীদের ক্ষুদ্রতম উপসেট সন্ধান করছেন যা মানদণ্ডের প্রকরণ বা এর বেশিরভাগ অংশ ব্যাখ্যা করে explain যদি এটি খুঁজে পেয়ে থাকে তবে আপনার তত্ত্বটি পরীক্ষা করে দেখুন।
অর্থনীতিতে এটি বাম এবং ডান ঘটে। উদাহরণস্বরূপ, আপনি যদি ত্রৈমাসিক মৌসুমী ডামি কিউ 2, কিউ 3 এবং কিউ 4 ব্যবহার করেন তবে প্রায়শই এমন হয় যে একটি গোষ্ঠী হিসাবে তারা উল্লেখযোগ্য, তবে তাদের মধ্যে কিছু স্বতন্ত্রভাবে তাত্পর্যপূর্ণ নয়। এই ক্ষেত্রে আপনি সাধারণত তাদের সব রাখুন।
আর একটি সাধারণ ঘটনা ইন্টারঅ্যাকশন। একটি মডেল বিবেচনা করুন , যেখানে প্রধান প্রভাব তাৎপর্যপূর্ণ নয় তবে ইন্টারঅ্যাকশন । এই ক্ষেত্রে এটি প্রধান প্রভাব রাখার প্রথাগত। আপনার এটিকে বাদ দেওয়া উচিত নয় এমন অনেকগুলি কারণ রয়েছে এবং তাদের মধ্যে কয়েকটি ফোরামে আলোচনা হয়েছিল।z x ∗ z
আপডেট: আরেকটি সাধারণ উদাহরণ পূর্বাভাস। ইকোনোমেট্রিক্স সাধারণত অর্থনীতি বিভাগগুলিতে অনুমানের দৃষ্টিভঙ্গি থেকে শেখানো হয়। অনুমানের দৃষ্টিকোণে পি-ভ্যালু এবং তাত্পর্যটির দিকে অনেক মনোযোগ দেওয়া হয়, কারণ আপনি কী কী কী ঘটছে তা বোঝার চেষ্টা করছেন। পূর্বাভাসে, এই স্টাফের উপর খুব বেশি জোর দেওয়া হয়নি, কারণ মডেলটি আগ্রহের পরিবর্তনশীলটিকে কতটা ভালভাবে পূর্বাভাস দিতে পারে তা আপনারাই যত্নবান।
এটি মেশিন লার্নিং অ্যাপ্লিকেশনগুলির সাথে অনুরূপ, বিটিডব্লিউ, যা সম্প্রতি অর্থনীতিতে প্রবেশ করছে। আপনার কাছে সমস্ত উল্লেখযোগ্য ভেরিয়েবল সহ এমন একটি মডেল থাকতে পারে যা পূর্বাভাস দেয় না। এমএলে এটি প্রায়শই তথাকথিত "ওভার ফিটিং" এর সাথে যুক্ত হয়। স্পষ্টতই, পূর্বাভাসে এই জাতীয় মডেলের খুব কম ব্যবহার রয়েছে।
আপনি দুটি ভিন্ন প্রশ্ন জিজ্ঞাসা করছেন:
সম্পাদনা: এটি মূল পোস্ট সম্পর্কে সত্য ছিল, তবে সম্পাদনার পরে আর সত্য হতে পারে না।
কিউ 1 সম্পর্কে, আমি মনে করি এটি খুব বিস্তৃত হওয়ার সীমান্তে। অনেকগুলি সম্ভাব্য উত্তর রয়েছে, কিছু ইতিমধ্যে সরবরাহ করা হয়েছে। আরও একটি উদাহরণ হ'ল পূর্বাভাসের জন্য মডেলগুলি তৈরি করার সময় (উত্সটি নীচে উদ্ধৃত করার জন্য দেখুন)।
কিউ 2 সম্পর্কিত, পরিসংখ্যানগত তাত্পর্য মডেল বিল্ডিংয়ের পক্ষে একটি শক্তিশালী মানদণ্ড নয়। রব জে হ্যান্ডম্যান তার ব্লগ পোস্টে "ভেরিয়েবল নির্বাচনের পরিসংখ্যান পরীক্ষা" লিখেছেন :
পরিসংখ্যানিক তাত্পর্য সাধারণত কোনও মডেলটিতে কোনও পরিবর্তনশীল অন্তর্ভুক্ত করা উচিত কিনা তা নির্ধারণের জন্য সাধারণত একটি ভাল ভিত্তি নয়, যদিও অনেক লোক যাদের আরও ভাল জানা উচিত তাদের সঠিকভাবে এই উদ্দেশ্যে ব্যবহার করা হয়েছিল। <...> পরিসংখ্যানমূলক পরীক্ষাগুলি অনুমিতিগুলি পরীক্ষা করার জন্য ডিজাইন করা হয়েছিল, ভেরিয়েবলগুলি নির্বাচন করে না।
এছাড়াও নোট করুন যে আপনি প্রায়শই পরিসংখ্যানগতভাবে বিশদভাবে বিশ্লেষণযোগ্য কিছু পরিবর্তনকগুলি সন্ধান করতে পারেন (সুযোগটি আপনার তাৎপর্য স্তরের পছন্দ দ্বারা নিয়ন্ত্রিত হচ্ছে)। কোনও পরিবর্তনশীল পরিসংখ্যানগত দিক থেকে তাত্পর্যপূর্ণ পর্যবেক্ষণটি এই সিদ্ধান্তে পৌঁছাতে যথেষ্ট নয় যে ভেরিয়েবলটি মডেলের অন্তর্ভুক্ত।
আমি অন্য "হ্যাঁ" যুক্ত করব। আমাকে সর্বদা শেখানো হয়েছে - এবং আমি এটি পাশ করার চেষ্টা করেছি - যে কোভারিয়েট পছন্দের প্রাথমিক বিবেচনাটি ডোমেন জ্ঞান, পরিসংখ্যান নয়। বায়োস্টাটিস্টিক্সে, উদাহরণস্বরূপ, যদি আমি ব্যক্তিদের জন্য কিছু স্বাস্থ্য ফলাফলের মডেলিং করি তবে তা হ'ল রিগ্রেশন যা বলুক না কেন, মডেলটিতে আমার বয়স, বর্ণ এবং লিঙ্গ অন্তর্ভুক্ত না করার জন্য আপনার জন্য কিছু সুস্পষ্ট যুক্তি প্রয়োজন।
এটি আপনার মডেলের উদ্দেশ্যগুলির উপরও নির্ভর করে। যদি উদ্দেশ্যটি আপনার পরিণামের সাথে সর্বাধিক যুক্ত রয়েছে তা আরও ভালভাবে উপলব্ধি করা হচ্ছে, তবে একটি পার্সিমোনিয়াস মডেল তৈরির কিছু গুণ রয়েছে। আপনি যদি ভবিষ্যদ্বাণী সম্পর্কে চিন্তা করেন, এবং বোঝার বিষয়ে এতটা না, তবে কোভেরিয়েটগুলি অপসারণ করা একটি ছোট উদ্বেগ হতে পারে।
(অবশেষে, আপনি যদি ভেরিয়েবল নির্বাচনের জন্য পরিসংখ্যানগুলি ব্যবহার করার পরিকল্পনা করছেন তবে ফ্র্যাঙ্ক হ্যারেল এই বিষয়ে কী বলছেন তা পরীক্ষা করে দেখুন - http://www.stata.com/support/faqs/statistics/stepwise-regression-problems/ , এবং তাঁর বই রেগ্রেশন মডেলিং কৌশলগুলি সংক্ষেপে, আপনি যখন ভবিষ্যদ্বাণীকারী বা সেরা ভবিষ্যদ্বাণীকারীদের বেছে নেওয়ার জন্য ধাপে ধাপে বা অনুরূপ পরিসংখ্যান ভিত্তিক কৌশল ব্যবহার করেছেন, ততক্ষণে "এই ভাল ভবিষ্যদ্বাণীকারী?" এর কোনও পরীক্ষা মারাত্মক পক্ষপাতদুষ্ট - অবশ্যই তারা ' ভাল ভবিষ্যদ্বাণীকারী, আপনি তাদের সেই ভিত্তিতে বেছে নিয়েছেন এবং সুতরাং সেই ভবিষ্যদ্বাণীকারীদের জন্য p মানগুলি মিথ্যাভাবে কম)
"পরিসংখ্যান তাত্পর্য" এর ফলাফলটি সত্যই যা বলেছিল তা হ'ল, টাইপ আই ত্রুটির নির্বাচিত স্তরে আমরা নির্ভর করতে পারি না নির্ভরশীল ভেরিয়েবলের উপর রেজিস্ট্রারের প্রভাব ইতিবাচক বা নেতিবাচক কিনা (এই পোস্টটি দেখুন)।
সুতরাং, আমরা যদি এই রেজিস্টার রাখি, নির্ভরশীল ভেরিয়েবলের নিজস্ব প্রভাব সম্পর্কে যে কোনও আলোচনার কাছে এটির ব্যাকআপ নেওয়ার পরিসংখ্যানিক প্রমাণ নেই।
তবে এই অনুমান ব্যর্থতাটি বলে না যে রেজিস্ট্রার কাঠামোগত সম্পর্কের অন্তর্ভুক্ত নয়, এটি কেবলমাত্র বলে যে নির্দিষ্ট ডেটা সেট সহ আমরা এর সহগের চিহ্নের কিছু নির্দিষ্টতা সহ নির্ধারণ করতে পারিনি।
সুতরাং নীতিগতভাবে, যদি উপস্থিতি সমর্থন করে এমন তাত্ত্বিক যুক্তিগুলি থাকে তবে রেজিস্ট্রার রাখা উচিত।
অন্যান্য উত্তরগুলি এখানে নির্দিষ্ট মডেল / পরিস্থিতি সরবরাহ করেছে যার জন্য এই জাতীয় রেজিস্ট্রারদের নির্দিষ্টকরণে রাখা হয়, উদাহরণস্বরূপ উত্তরটি স্থির-প্রতিক্রিয়া প্যানেল ডেটা মডেলের উল্লেখ করে।
পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ না হলেও আপনি যদি গবেষণার কেন্দ্রবিন্দু হন তবে আপনি বিশেষ আগ্রহের পরিবর্তনশীলকে অন্তর্ভুক্ত করতে পারেন। এছাড়াও, বায়োস্টাটিক্সে, ক্লিনিকাল তাত্পর্য প্রায়শই পরিসংখ্যানগত তাত্পর্য থেকে পৃথক হয়।