আমি বিভিন্ন ভেরিয়েবলের মডেল তৈরি করতে একাধিক লিনিয়ার রিগ্রেশন ব্যবহার করে পরিচিত। তবে, আমি কৌতূহল ছিলাম যদি রিগ্রেশন টেস্টগুলি কোনও ধরণের বেসিক হাইপোথিসিস পরীক্ষার জন্য ব্যবহৃত হয়। যদি তা হয় তবে সেই পরিস্থিতি / অনুমানগুলি দেখতে কেমন হবে?
আমি বিভিন্ন ভেরিয়েবলের মডেল তৈরি করতে একাধিক লিনিয়ার রিগ্রেশন ব্যবহার করে পরিচিত। তবে, আমি কৌতূহল ছিলাম যদি রিগ্রেশন টেস্টগুলি কোনও ধরণের বেসিক হাইপোথিসিস পরীক্ষার জন্য ব্যবহৃত হয়। যদি তা হয় তবে সেই পরিস্থিতি / অনুমানগুলি দেখতে কেমন হবে?
উত্তর:
এখানে একটি সহজ উদাহরণ। আপনি আর এর সাথে পরিচিত কিনা তা আমি জানি না তবে আশাকরি কোডটি যথেষ্ট পরিমাণে স্বতঃস্ফূর্ত।
set.seed(9) # this makes the example reproducible
N = 36
# the following generates 3 variables:
x1 = rep(seq(from=11, to=13), each=12)
x2 = rep(rep(seq(from=90, to=150, by=20), each=3 ), times=3)
x3 = rep(seq(from=6, to=18, by=6 ), times=12)
cbind(x1, x2, x3)[1:7,] # 1st 7 cases, just to see the pattern
x1 x2 x3
[1,] 11 90 6
[2,] 11 90 12
[3,] 11 90 18
[4,] 11 110 6
[5,] 11 110 12
[6,] 11 110 18
[7,] 11 130 6
# the following is the true data generating process, note that y is a function of
# x1 & x2, but not x3, note also that x1 is designed above w/ a restricted range,
# & that x2 tends to have less influence on the response variable than x1:
y = 15 + 2*x1 + .2*x2 + rnorm(N, mean=0, sd=10)
reg.Model = lm(y~x1+x2+x3) # fits a regression model to these data
এখন, এর দেখতে দেখতে এটি দেখতে দিন:
. . .
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.76232 27.18170 -0.065 0.94871
x1 3.11683 2.09795 1.486 0.14716
x2 0.21214 0.07661 2.769 0.00927 **
x3 0.17748 0.34966 0.508 0.61524
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
. . .
F-statistic: 3.378 on 3 and 32 DF, p-value: 0.03016
আমরা আউটপুটটির "সহগুণ" বিভাগটিতে ফোকাস করতে পারি। মডেল দ্বারা অনুমান করা প্রতিটি প্যারামিটার তার নিজস্ব সারি পায়। আসল অনুমানটি নিজেই প্রথম কলামে তালিকাভুক্ত। দ্বিতীয় কলামে অনুমানের স্ট্যান্ডার্ড ত্রুটিগুলি তালিকাভুক্ত করা হয় , এটি হ'ল নমুনা থেকে নমুনায় কতটা অনুমান করা যায় 'যদি আমরা এই প্রক্রিয়াটি বারবার বারবার করি তবে। আরও সুনির্দিষ্টভাবে বলা যায়, এটি অনুমানের নমুনা বিতরণের মানক বিচ্যুতির একটি অনুমান। যদি আমরা প্রতিটি প্যারামিটারের অনুমানটিকে এর এসই দ্বারা ভাগ করি তবে আমরা একটি টি স্কোর পাই যা তৃতীয় কলামে তালিকাভুক্ত; এটি অনুমানের পরীক্ষার জন্য ব্যবহৃত হয়, বিশেষত প্যারামিটারের অনুমানটি 'উল্লেখযোগ্যভাবে' 0 থেকে পৃথক কিনা তা পরীক্ষা করতে columnটি-স্কোরের সাথে সম্পর্কিত পি-মান । যদি নাল অনুমানটি সত্য হয় তবে 0 থেকে দূরে বা আরও বেশি অনুমান করা মানটি পাওয়া সম্ভাবনা । মনে রাখবেন যে নাল অনুমানটি সত্য না হলে, এটি পরিষ্কার নয় যে এই মানটি আমাদের অর্থবহ কিছু বলছে।
আমরা যদি সহগুণীয় টেবিল এবং উপরের সত্য উপাত্ত তৈরির প্রক্রিয়াটির মধ্যে পিছনে তাকাই তবে আমরা কয়েকটি আকর্ষণীয় জিনিস দেখতে পাই। ইন্টারসেপ্টটি অনুমান করা হয় -1.8 এবং এর এসই 27, যেখানে আসল মান 15. কারণ সম্পর্কিত পি-মানটি .95, এটি 0 (একটি ধরণের II ত্রুটি ) থেকে 'উল্লেখযোগ্যভাবে পৃথক' হিসাবে বিবেচিত হবে না , তবে এটা তবু হয় মধ্যে সত্য মান এক দঃপূঃ। প্রকৃত মূল্য এবং যে পরিমাণ ওঠানামা করতে হবে তার দৃষ্টিকোণ থেকে এই অনুমান সম্পর্কে ভয়াবহভাবে চরম কিছু নেই; এটি 0 থেকে আলাদা করার জন্য আমাদের কেবল অপর্যাপ্ত শক্তি রয়েছে The একই গল্পটির জন্য কম বেশি কিছু রয়েছে holdsx1
x2
x3
x1
একার সুযোগের চেয়ে প্রতিক্রিয়া পরিবর্তনশীলটির পূর্বাভাস। এটি বলার আরেকটি উপায়, সমস্ত অনুমানকে 0 থেকে পার্থক্য হিসাবে বিবেচনা করা উচিত কিনা তা এই পরীক্ষার ফলাফল থেকে বোঝা যায় যে কমপক্ষে কিছু প্যারামিটার অনুমান 0 এর সমান নয়, আন্তরিক সঠিক সিদ্ধান্ত। যেহেতু উপরে 4 টি পরীক্ষা রয়েছে, তাই এগুলি ছাড়া আমাদের একাধিক তুলনার সমস্যা থেকে কোনও সুরক্ষা থাকবে না । (মনে রাখবেন যে পি-মানগুলি এলোমেলো পরিবর্তনশীল - কিছু পরীক্ষা-নিরীক্ষার চেয়ে আলাদা কিনা তা পরীক্ষা-নিরীক্ষার চেয়ে আলাদা হতে পারে, যদি পরীক্ষাটি আবার চালানো হয় - তবে এগুলি একে অপরের সাথে অসামঞ্জস্যপূর্ণ হওয়া সম্ভব is এটি নিয়ে আলোচনা করা হয়েছে সিভি এখানে: একাধিক প্রতিরোধের সহগের তাত্পর্য: উল্লেখযোগ্য টি-পরীক্ষা বনাম, অ-উল্লেখযোগ্য এফ-পরিসংখ্যান, এবং এখানে বিপরীত পরিস্থিতি: কোনও রিগ্রেশন কীভাবে তাৎপর্যপূর্ণ হতে পারে তবুও সমস্ত ভবিষ্যদ্বাণীকারী অ-তাত্পর্যপূর্ণ হতে পারে , এবং এখানে: একটি রিগ্রেশন এফ এবং টি পরিসংখ্যান ious) সম্ভবত কৌতূহলীভাবে, এই উদাহরণে কোনও ধরণের ত্রুটি নেই । যে কোনও হারে, এই অনুচ্ছেদে আলোচিত সমস্ত পরীক্ষার 5 টিই অনুমান পরীক্ষা।
আপনার মন্তব্য থেকে, আমি একত্রিত হয়েছি আপনিও ব্যাখ্যা করতে পারেন যে কীভাবে একটি ব্যাখ্যাযোগ্য পরিবর্তনশীল অন্যটির চেয়ে গুরুত্বপূর্ণ কিনা তা নির্ধারণ করবেন। এটি একটি খুব সাধারণ প্রশ্ন, তবে বেশ জটিল। কোনও অ্যাথলিটের উচ্চতা এবং ওজনের উপর ভিত্তি করে কোনও খেলায় সাফল্যের সম্ভাবনা সম্পর্কে ভবিষ্যদ্বাণী করতে চেয়েছিলেন এবং কোনটি আরও গুরুত্বপূর্ণ তা ভাবছেন Ima একটি সাধারণ কৌশল হ'ল কোন আনুমানিক সহগ আরও বড় see যাইহোক, এই অনুমানগুলি ব্যবহৃত ইউনিটগুলির সাথে সুনির্দিষ্ট: উদাহরণস্বরূপ, পাউন্ড বা কিলোগ্রাম ব্যবহৃত হয় কিনা তার উপর নির্ভর করে ওজনের জন্য সহগ পরিবর্তন হবে। এছাড়াও, পাউন্ড এবং ইঞ্চি, বা কিলোগ্রাম এবং সেন্টিমিটারের সমান / তুলনা কীভাবে করা যায় তা দূরবর্তীভাবে পরিষ্কার নয়। লোকেরা নিযুক্ত একটি কৌশল হ'ল মানক করা(অর্থাত্, জেড-স্কোরগুলিতে পরিণত করুন) প্রথমে তাদের ডেটা। তারপরে এই মাত্রাগুলি সাধারণ ইউনিটগুলিতে (যেমন, মানক বিচ্যুতি), এবং সহগগুলি আর-স্কোরের সমান । তদুপরি, একটি আর-স্কোর অন্যের চেয়ে বড় হলে এটি পরীক্ষা করা সম্ভব । দুর্ভাগ্যক্রমে, এটি আপনাকে অরণ্য থেকে সরিয়ে দেয় না; সত্যিকারের আর ঠিক 0 না হওয়া পর্যন্ত, আনুমানিক r ব্যবহৃত হয় কোভারিয়েট মানগুলির পরিসীমা দ্বারা বড় অংশে চালিত। (স্বীকৃতি দেওয়া কতটা সহজ হবে তা আমি জানি না, তবে @ ঝুঁকির দুর্দান্ত উত্তরটি এখানে: Isদরকারী বা বিপজ্জনক , এই পয়েন্টটি দেখায়; এটি দেখতে, কেবল কীভাবে তা চিন্তা করুন।) সুতরাং, সর্বোত্তম যেটি বলা যেতে পারে তা হ'ল একটি নির্দিষ্ট পরিসরের মধ্যে একটি ব্যাখ্যামূলক ভেরিয়েবলের পরিবর্তনশীলতা অন্য নির্দিষ্ট ব্যাপ্তির মধ্যে অন্য ব্যাখ্যামূলক ভেরিয়েবলের পরিবর্তনের চেয়ে প্রতিক্রিয়ার স্তর নির্ধারণ করা আরও গুরুত্বপূর্ণ।
রিগ্রেশন মডেলগুলির প্রয়োজনীয় পরীক্ষাটি হ'ল ফুল-হ্রাস পরীক্ষা। আপনি যেখানে 2 রিগ্রেশন মডেল তুলনা করছেন এটিই, পুরো মডেলের সমস্ত শর্ত রয়েছে এবং হ্রাস পরীক্ষায় terms শর্তগুলির একটি উপসেট রয়েছে (হ্রাস মডেলটির পূর্ণ মডেলে নেস্ট করা দরকার)। পরীক্ষার পরে নাল অনুমানটি পরীক্ষা করে যে হ্রাস করা মডেল পুরো মডেলের পাশাপাশি ফিট করে এবং কোনও পার্থক্য সুযোগের কারণে হয়।
পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার থেকে সাধারণ প্রিন্টআউটগুলিতে একটি সামগ্রিক এফ পরীক্ষার অন্তর্ভুক্ত থাকে, এটি হ'ল সম্পূর্ণ-হ্রাসকৃত পরীক্ষা যেখানে হ্রাসযুক্ত পরীক্ষাটি একটি ইন্টারসেপ্ট একমাত্র মডেল। তারা প্রায়শই প্রতিটি পৃথক ভবিষ্যদ্বাণীকের জন্য একটি পি-মান মুদ্রণ করে, এটি কেবলমাত্র হ্রাসযুক্ত মডেল পরীক্ষার একটি সিরিজ, প্রত্যেকটিতে হ্রাস হওয়া মডেলটি সেই নির্দিষ্ট শব্দটিকে অন্তর্ভুক্ত করে না। আগ্রহের প্রশ্নগুলির উত্তর দেওয়ার জন্য এই পরীক্ষাগুলি ব্যবহার করার অনেক উপায় রয়েছে। প্রকৃতপক্ষে পরিসংখ্যানের কোর্সে পাঠানো প্রতিটি পরীক্ষার ক্ষেত্রে রিগ্রেশন মডেল এবং ফুল-হ্রাস পরীক্ষা ব্যবহার করে গণনা করা যেতে পারে এবং ফলাফলগুলি বেশ কয়েকটি ক্ষেত্রে অভিন্ন এবং কয়েকটি ক্ষেত্রে খুব কাছের কাছাকাছি হবে।