লিনিয়ার রিগ্রেশন মডেলটিতে কি একটি পরিবর্তনশীল তাৎপর্যপূর্ণ?


9

আমি নমুনা এবং পরিবর্তনশীল পর্যবেক্ষণ সহ একটি লিনিয়ার রিগ্রেশন মডেল পেয়েছি এবং আমি জানতে চাই:

  1. কোনও নির্দিষ্ট পরিবর্তনশীল মডেলের অন্তর্ভুক্ত থাকার জন্য যথেষ্ট তাৎপর্যপূর্ণ কিনা।
  2. অন্য পরিবর্তনশীল (পর্যবেক্ষণ সহ) মডেলটিতে অন্তর্ভুক্ত করা উচিত কিনা।

কোন পরিসংখ্যান আমাকে সাহায্য করতে পারে? কীভাবে এগুলি সবচেয়ে দক্ষতার সাথে পেতে পারেন?

উত্তর:


26

কোনও মডেলের মধ্যে কোনও ভেরিয়েবল অন্তর্ভুক্ত করা উচিত কিনা তা নির্ধারণের জন্য সাধারণত পরিসংখ্যানগত তাত্পর্য ভাল ভিত্তি হয় না। পরিসংখ্যানগত পরীক্ষাগুলি অনুমিতিগুলি পরীক্ষা করার জন্য ডিজাইন করা হয়েছিল, ভেরিয়েবলগুলি নির্বাচন করে না। আমি জানি প্রচুর পাঠ্যপুস্তক পরিসংখ্যান পরীক্ষার সাহায্যে চলক নির্বাচন নিয়ে আলোচনা করে তবে এটি সাধারণত একটি খারাপ দৃষ্টিভঙ্গি। কিছু কারণের জন্য হ্যারেলের বইটি রিগ্রেশন মডেলিং কৌশলগুলি দেখুন । এই দিনগুলিতে, এআইসির উপর ভিত্তি করে পরিবর্তনশীল নির্বাচন (বা অনুরূপ কিছু) সাধারণত পছন্দ করা হয়।


আসলে, আমার স্মৃতিতে সর্বোত্তমভাবে, হ্যারেল দৃ strongly়ভাবে এআইসির ব্যবহারকে নিরুৎসাহিত করে। আমার ধারণা, ক্রস-বৈধকরণ সম্ভবত আশেপাশের সবচেয়ে নিরাপদ পদ্ধতি হবে।
তাল গালিলি

1
এআইসি অসমায়িতভাবে সিভির সমতুল্য। Stats.stackexchange.com/questions/577/… এর উত্তর দেখুন । আমি উত্তরটি লেখার আগে আমি হ্যারেলকে পরীক্ষা করে দেখেছি, এবং এআইসির কোনও হতাশাই দেখিনি। তিনি এআইসি বা অন্য কোনও পদ্ধতির সাথে পরিবর্তনশীল নির্বাচনের পরে তাত্পর্য পরীক্ষা করার বিষয়ে সতর্ক করেন।
রব হ্যান্ডম্যান

@ টাল: সম্ভবত আরএমএস বইয়ের চেয়ে তার একটি কাগজপত্র থেকে আমার মনে আছে হ্যারেল অনেকগুলি মডেলের একটি পুলের মধ্যে কেবল বেছে নেওয়ার জন্য এআইসি ব্যবহার করতে আপত্তি জানিয়েছিল । আমি মনে করি তার বক্তব্যটি হ'ল আপনাকে অবশ্যই একবারে একটি পরিবর্তনশীল যুক্ত করতে হবে এবং দুটি মডেলের পদ্ধতিগতভাবে তুলনা করতে হবে বা অনুরূপ কৌশলটি ব্যবহার করতে হবে। (স্পষ্টরূপে বলতে
সামঞ্জস্যপূর্ণ

একটি দ্রুত অনুসন্ধান করতে গিয়ে আমি হ্যারেলকে নিম্নলিখিতটি লিখেছি "পি-মান, আর-স্কোয়ার, আংশিক আর-বর্গক্ষেত্র, এআইসিসি, বিআইসিসি, রিগ্রেশন সহগ বা মাল্লোসের সিপির ভিত্তিতে মডেল নির্বাচন করার বিষয়ে সতর্ক থাকুন।" তিনি লিখেছেন যে, 12/14/08 এ, এলআরএম ফাংশন (প্যাকেজ ডিজাইন) - সহপাঠের সহগের জন্য পি-ভ্যালু অর্জন [শিরোনাম] শীর্ষক একটি মেলিং তালিকায়। আমার ধারণা আমি তার অর্থ ভুল বুঝেছি।
তাল গালিলি

2
@ টাল, @ রব: এই থ্রেডে তিনি বলেছিলেন "শ্রেণিবদ্ধ নীতিটি ব্যবহার করতে ভুলবেন না"। সম্ভবত আগ্রহের বিষয়, মেডস্ট্যাটস থেকে এই আলোচনা (হ্যারেলের প্রতিক্রিয়ার জন্য নীচে স্ক্রোল করুন) : .google.google.com
Ars

4

আমি দ্বিতীয় রবের মন্তব্য। একটি ক্রমবর্ধমান পছন্দসই বিকল্প হ'ল আপনার সমস্ত ভেরিয়েবলগুলি অন্তর্ভুক্ত করা এবং সেগুলিকে 0 এর দিকে সঙ্কুচিত করা See দেখুন তিবশিরানী, আর (1996)। পাদদেশ সংকোচন এবং lasso মাধ্যমে নির্বাচন।

http://www-stat.stanford.edu/~tibs/lasso/lasso.pdf


1
এই দিনগুলিতে "ক্রমবর্ধমান পছন্দসই" কি পরিমাণে তা প্রমাণ করার কোনও উপায় আছে?
তাল গ্যালি

আমি মনে করি যে এটি বিজ্ঞানের দিক থেকে অনেক ক্ষেত্রেই সঠিক অর্থে স্বীকৃত যে এই সংকোচনের পদ্ধতিটি * .IC পদ্ধতির চেয়ে সাম্প্রতিক প্রয়োগকৃত স্ট্যাটাস পেপারগুলিতে বেশি ব্যবহৃত হয়। এটি একটি নির্দিষ্ট-স্বল্পতম তাত্ত্বিক sensক্যমত দেখায়।
ব্যবহারকারী 603

1
@ ইউজার 603 - সংকোচনের পদ্ধতির সাথে আপনারও সম্ভাব্য পরিমাণে বৃহত্ গণনা সুবিধা রয়েছে। খোঁজ করার দরকার নেই2পিমডেল
সম্ভাব্যতা ব্লগ

3

অংশ 1 এর জন্য, আপনি এফ-পরীক্ষার সন্ধান করছেন । প্রতিটি মডেলের ফিট থেকে আপনার বর্গক্ষেত্রের অবশিষ্টাংশের গণনা করুন এবং একটি এফ-পরিসংখ্যান গণনা করুন, যা আপনি নিজেরাই উত্পন্ন কোনও এফ-বিতরণ বা অন্য কোনও নাল ডিস্ট্রিবিউশন থেকে পি-মানগুলি খুঁজে পেতে ব্যবহার করতে পারেন।


1

রবের উত্তরের জন্য আরও একটি ভোট।

"আপেক্ষিক গুরুত্ব" সাহিত্যে কিছু আকর্ষণীয় ধারণা রয়েছে। এই কাজটি এমন পদ্ধতিগুলি বিকাশ করে যা পরীক্ষার্থীর ভবিষ্যদ্বাণীকারীদের প্রত্যেকটির সাথে কতটা গুরুত্ব যুক্ত তা নির্ধারণ করতে চেষ্টা করে seek এখানে বায়েশিয়ান এবং ফ্রিকোয়ালিস্ট পদ্ধতি রয়েছে। উদ্ধৃতি এবং কোডের জন্য আর এ "রিলেম্প্পো" প্যাকেজটি দেখুন।


1

আমি রবের উত্তরও পছন্দ করি। আর, যদি আপনি আর এর পরিবর্তে এসএএস ব্যবহার করতে চান তবে আপনি প্রোসি জিএলএম এর সাথে সম্পন্ন মডেলগুলির জন্য প্রোসি জিএলমিটিক ব্যবহার করতে পারেন, যদিও এটি অন্য কয়েকটি মডেলের ক্ষেত্রেও ভাল কাজ করে। দেখা

ফ্লুম অ্যান্ড ক্যাসেল "স্টেপওয়াইজ বন্ধ করছেন: ধাপে ধাপে নির্বাচন পদ্ধতি কেন খারাপ এবং আপনার কী ব্যবহার করা উচিত" বিভিন্ন গোষ্ঠীতে উপস্থাপন করা হয়েছে, সম্প্রতি সম্প্রতি, এনইএসইজি ২০০৯

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.