হাইপোথিসিস পরীক্ষার জন্য একাধিক লিনিয়ার রিগ্রেশন


15

আমি বিভিন্ন ভেরিয়েবলের মডেল তৈরি করতে একাধিক লিনিয়ার রিগ্রেশন ব্যবহার করে পরিচিত। তবে, আমি কৌতূহল ছিলাম যদি রিগ্রেশন টেস্টগুলি কোনও ধরণের বেসিক হাইপোথিসিস পরীক্ষার জন্য ব্যবহৃত হয়। যদি তা হয় তবে সেই পরিস্থিতি / অনুমানগুলি দেখতে কেমন হবে?


1
আপনি কী বোঝাতে চেয়েছেন আপনি আরও ব্যাখ্যা করতে পারেন? ভেরিয়েবলের theাল প্যারামিটার শূন্য থেকে আলাদা কিনা তা পরীক্ষা করা খুব সাধারণ বিষয়। আমি সেই "অনুমানের পরীক্ষা" বলব। আপনি কি এ সম্পর্কে অসচেতন, বা আপনি কিছু আলাদা বোঝাতে চান? আপনার উদ্দেশ্যগুলির জন্য কোন দৃশ্যের অবতারণা করে?
গুং - মনিকা পুনরায়

আমি সে সম্পর্কে অসচেতন। আমিও অনিশ্চিত ছিলাম যে রিগ্রেশন-ভিত্তিক বিশ্লেষণ অন্য যে কোনও ধরণের অনুমানের পরীক্ষার জন্য ব্যবহৃত হতে পারে (সম্ভবত অন্যের চেয়ে এক ভেরিয়েবলের তাত্পর্য সম্পর্কে ইত্যাদি)।
cryptic_star

উত্তর:


26

এখানে একটি সহজ উদাহরণ। আপনি আর এর সাথে পরিচিত কিনা তা আমি জানি না তবে আশাকরি কোডটি যথেষ্ট পরিমাণে স্বতঃস্ফূর্ত।

set.seed(9)        # this makes the example reproducible
N = 36
    # the following generates 3 variables:
x1 =     rep(seq(from=11, to=13),           each=12)
x2 = rep(rep(seq(from=90, to=150, by=20),   each=3 ), times=3)
x3 =     rep(seq(from=6,  to=18,  by=6 ),  times=12)
cbind(x1, x2, x3)[1:7,]    # 1st 7 cases, just to see the pattern
      x1  x2 x3
 [1,] 11  90  6
 [2,] 11  90 12
 [3,] 11  90 18
 [4,] 11 110  6
 [5,] 11 110 12
 [6,] 11 110 18
 [7,] 11 130  6 
    # the following is the true data generating process, note that y is a function of
    #   x1 & x2, but not x3, note also that x1 is designed above w/ a restricted range,
    #   & that x2 tends to have less influence on the response variable than x1:
y  = 15 + 2*x1 + .2*x2 + rnorm(N, mean=0, sd=10)

reg.Model = lm(y~x1+x2+x3)    # fits a regression model to these data

এখন, এর দেখতে দেখতে এটি দেখতে দিন:

. . . 
Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept) -1.76232   27.18170  -0.065  0.94871   
x1           3.11683    2.09795   1.486  0.14716   
x2           0.21214    0.07661   2.769  0.00927 **
x3           0.17748    0.34966   0.508  0.61524   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1 
. . . 
F-statistic: 3.378 on 3 and 32 DF,  p-value: 0.03016 

আমরা আউটপুটটির "সহগুণ" বিভাগটিতে ফোকাস করতে পারি। মডেল দ্বারা অনুমান করা প্রতিটি প্যারামিটার তার নিজস্ব সারি পায়। আসল অনুমানটি নিজেই প্রথম কলামে তালিকাভুক্ত। দ্বিতীয় কলামে অনুমানের স্ট্যান্ডার্ড ত্রুটিগুলি তালিকাভুক্ত করা হয় , এটি হ'ল নমুনা থেকে নমুনায় কতটা অনুমান করা যায় 'যদি আমরা এই প্রক্রিয়াটি বারবার বারবার করি তবে। আরও সুনির্দিষ্টভাবে বলা যায়, এটি অনুমানের নমুনা বিতরণের মানক বিচ্যুতির একটি অনুমান। যদি আমরা প্রতিটি প্যারামিটারের অনুমানটিকে এর এসই দ্বারা ভাগ করি তবে আমরা একটি টি স্কোর পাই যা তৃতীয় কলামে তালিকাভুক্ত; এটি অনুমানের পরীক্ষার জন্য ব্যবহৃত হয়, বিশেষত প্যারামিটারের অনুমানটি 'উল্লেখযোগ্যভাবে' 0 থেকে পৃথক কিনা তা পরীক্ষা করতে columnটি-স্কোরের সাথে সম্পর্কিত পি-মানযদি নাল অনুমানটি সত্য হয় তবে 0 থেকে দূরে বা আরও বেশি অনুমান করা মানটি পাওয়া সম্ভাবনা । মনে রাখবেন যে নাল অনুমানটি সত্য না হলে, এটি পরিষ্কার নয় যে এই মানটি আমাদের অর্থবহ কিছু বলছে।

আমরা যদি সহগুণীয় টেবিল এবং উপরের সত্য উপাত্ত তৈরির প্রক্রিয়াটির মধ্যে পিছনে তাকাই তবে আমরা কয়েকটি আকর্ষণীয় জিনিস দেখতে পাই। ইন্টারসেপ্টটি অনুমান করা হয় -1.8 এবং এর এসই 27, যেখানে আসল মান 15. কারণ সম্পর্কিত পি-মানটি .95, এটি 0 (একটি ধরণের II ত্রুটি ) থেকে 'উল্লেখযোগ্যভাবে পৃথক' হিসাবে বিবেচিত হবে না , তবে এটা তবু হয় মধ্যে সত্য মান এক দঃপূঃ। প্রকৃত মূল্য এবং যে পরিমাণ ওঠানামা করতে হবে তার দৃষ্টিকোণ থেকে এই অনুমান সম্পর্কে ভয়াবহভাবে চরম কিছু নেই; এটি 0 থেকে আলাদা করার জন্য আমাদের কেবল অপর্যাপ্ত শক্তি রয়েছে The একই গল্পটির জন্য কম বেশি কিছু রয়েছে holdsx1x2.21214.2x3x1একার সুযোগের চেয়ে প্রতিক্রিয়া পরিবর্তনশীলটির পূর্বাভাস। এটি বলার আরেকটি উপায়, সমস্ত অনুমানকে 0 থেকে পার্থক্য হিসাবে বিবেচনা করা উচিত কিনা তা এই পরীক্ষার ফলাফল থেকে বোঝা যায় যে কমপক্ষে কিছু প্যারামিটার অনুমান 0 এর সমান নয়, আন্তরিক সঠিক সিদ্ধান্ত। যেহেতু উপরে 4 টি পরীক্ষা রয়েছে, তাই এগুলি ছাড়া আমাদের একাধিক তুলনার সমস্যা থেকে কোনও সুরক্ষা থাকবে না । (মনে রাখবেন যে পি-মানগুলি এলোমেলো পরিবর্তনশীল - কিছু পরীক্ষা-নিরীক্ষার চেয়ে আলাদা কিনা তা পরীক্ষা-নিরীক্ষার চেয়ে আলাদা হতে পারে, যদি পরীক্ষাটি আবার চালানো হয় - তবে এগুলি একে অপরের সাথে অসামঞ্জস্যপূর্ণ হওয়া সম্ভব is এটি নিয়ে আলোচনা করা হয়েছে সিভি এখানে: একাধিক প্রতিরোধের সহগের তাত্পর্য: উল্লেখযোগ্য টি-পরীক্ষা বনাম, অ-উল্লেখযোগ্য এফ-পরিসংখ্যান, এবং এখানে বিপরীত পরিস্থিতি: কোনও রিগ্রেশন কীভাবে তাৎপর্যপূর্ণ হতে পারে তবুও সমস্ত ভবিষ্যদ্বাণীকারী অ-তাত্পর্যপূর্ণ হতে পারে , এবং এখানে: একটি রিগ্রেশন এফ এবং টি পরিসংখ্যান ious) সম্ভবত কৌতূহলীভাবে, এই উদাহরণে কোনও ধরণের ত্রুটি নেই । যে কোনও হারে, এই অনুচ্ছেদে আলোচিত সমস্ত পরীক্ষার 5 টিই অনুমান পরীক্ষা।

আপনার মন্তব্য থেকে, আমি একত্রিত হয়েছি আপনিও ব্যাখ্যা করতে পারেন যে কীভাবে একটি ব্যাখ্যাযোগ্য পরিবর্তনশীল অন্যটির চেয়ে গুরুত্বপূর্ণ কিনা তা নির্ধারণ করবেন। এটি একটি খুব সাধারণ প্রশ্ন, তবে বেশ জটিল। কোনও অ্যাথলিটের উচ্চতা এবং ওজনের উপর ভিত্তি করে কোনও খেলায় সাফল্যের সম্ভাবনা সম্পর্কে ভবিষ্যদ্বাণী করতে চেয়েছিলেন এবং কোনটি আরও গুরুত্বপূর্ণ তা ভাবছেন Ima একটি সাধারণ কৌশল হ'ল কোন আনুমানিক সহগ আরও বড় see যাইহোক, এই অনুমানগুলি ব্যবহৃত ইউনিটগুলির সাথে সুনির্দিষ্ট: উদাহরণস্বরূপ, পাউন্ড বা কিলোগ্রাম ব্যবহৃত হয় কিনা তার উপর নির্ভর করে ওজনের জন্য সহগ পরিবর্তন হবে। এছাড়াও, পাউন্ড এবং ইঞ্চি, বা কিলোগ্রাম এবং সেন্টিমিটারের সমান / তুলনা কীভাবে করা যায় তা দূরবর্তীভাবে পরিষ্কার নয়। লোকেরা নিযুক্ত একটি কৌশল হ'ল মানক করা(অর্থাত্, জেড-স্কোরগুলিতে পরিণত করুন) প্রথমে তাদের ডেটা। তারপরে এই মাত্রাগুলি সাধারণ ইউনিটগুলিতে (যেমন, মানক বিচ্যুতি), এবং সহগগুলি আর-স্কোরের সমান । তদুপরি, একটি আর-স্কোর অন্যের চেয়ে বড় হলে এটি পরীক্ষা করা সম্ভব । দুর্ভাগ্যক্রমে, এটি আপনাকে অরণ্য থেকে সরিয়ে দেয় না; সত্যিকারের আর ঠিক 0 না হওয়া পর্যন্ত, আনুমানিক r ব্যবহৃত হয় কোভারিয়েট মানগুলির পরিসীমা দ্বারা বড় অংশে চালিত। (স্বীকৃতি দেওয়া কতটা সহজ হবে তা আমি জানি না, তবে @ ঝুঁকির দুর্দান্ত উত্তরটি এখানে: Isআর2দরকারী বা বিপজ্জনক , এই পয়েন্টটি দেখায়; এটি দেখতে, কেবল কীভাবে তা চিন্তা করুনR=R2।) সুতরাং, সর্বোত্তম যেটি বলা যেতে পারে তা হ'ল একটি নির্দিষ্ট পরিসরের মধ্যে একটি ব্যাখ্যামূলক ভেরিয়েবলের পরিবর্তনশীলতা অন্য নির্দিষ্ট ব্যাপ্তির মধ্যে অন্য ব্যাখ্যামূলক ভেরিয়েবলের পরিবর্তনের চেয়ে প্রতিক্রিয়ার স্তর নির্ধারণ করা আরও গুরুত্বপূর্ণ।


2

রিগ্রেশন মডেলগুলির প্রয়োজনীয় পরীক্ষাটি হ'ল ফুল-হ্রাস পরীক্ষা। আপনি যেখানে 2 রিগ্রেশন মডেল তুলনা করছেন এটিই, পুরো মডেলের সমস্ত শর্ত রয়েছে এবং হ্রাস পরীক্ষায় terms শর্তগুলির একটি উপসেট রয়েছে (হ্রাস মডেলটির পূর্ণ মডেলে নেস্ট করা দরকার)। পরীক্ষার পরে নাল অনুমানটি পরীক্ষা করে যে হ্রাস করা মডেল পুরো মডেলের পাশাপাশি ফিট করে এবং কোনও পার্থক্য সুযোগের কারণে হয়।

পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার থেকে সাধারণ প্রিন্টআউটগুলিতে একটি সামগ্রিক এফ পরীক্ষার অন্তর্ভুক্ত থাকে, এটি হ'ল সম্পূর্ণ-হ্রাসকৃত পরীক্ষা যেখানে হ্রাসযুক্ত পরীক্ষাটি একটি ইন্টারসেপ্ট একমাত্র মডেল। তারা প্রায়শই প্রতিটি পৃথক ভবিষ্যদ্বাণীকের জন্য একটি পি-মান মুদ্রণ করে, এটি কেবলমাত্র হ্রাসযুক্ত মডেল পরীক্ষার একটি সিরিজ, প্রত্যেকটিতে হ্রাস হওয়া মডেলটি সেই নির্দিষ্ট শব্দটিকে অন্তর্ভুক্ত করে না। আগ্রহের প্রশ্নগুলির উত্তর দেওয়ার জন্য এই পরীক্ষাগুলি ব্যবহার করার অনেক উপায় রয়েছে। প্রকৃতপক্ষে পরিসংখ্যানের কোর্সে পাঠানো প্রতিটি পরীক্ষার ক্ষেত্রে রিগ্রেশন মডেল এবং ফুল-হ্রাস পরীক্ষা ব্যবহার করে গণনা করা যেতে পারে এবং ফলাফলগুলি বেশ কয়েকটি ক্ষেত্রে অভিন্ন এবং কয়েকটি ক্ষেত্রে খুব কাছের কাছাকাছি হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.