আর-এ ড্রপ 1 আউটপুটটির ব্যাখ্যা করা

আর-তে, drop1কমান্ডটি কিছু পরিষ্কার করে আউটপুট করে।
এই দুটি কমান্ড আপনাকে কিছু আউটপুট পেতে হবে:
example(step)#-> swiss
drop1(lm1, test="F")

আমার এইরকম দেখাচ্ছে:

> drop1(lm1, test="F")
Single term deletions

Model:
Fertility ~ Agriculture + Examination + Education + Catholic + 
    Infant.Mortality
                 Df Sum of Sq    RSS    AIC F value     Pr(F)    
<none>                        2105.0 190.69                      
Agriculture       1    307.72 2412.8 195.10  5.9934  0.018727 *  
Examination       1     53.03 2158.1 189.86  1.0328  0.315462    
Education         1   1162.56 3267.6 209.36 22.6432 2.431e-05 ***
Catholic          1    447.71 2552.8 197.75  8.7200  0.005190 ** 
Infant.Mortality  1    408.75 2513.8 197.03  7.9612  0.007336 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

এই সবকিছুর অর্থ কী? আমি ধরে নিচ্ছি যে "স্টারগুলি" কোন ইনপুট ভেরিয়েবলগুলি রাখতে হবে তা সিদ্ধান্ত নিতে সহায়তা করে। উপরের আউটপুটটির দিকে তাকিয়ে, আমি "পরীক্ষা" ভেরিয়েবলটি ফেলে দিতে এবং "শিক্ষা" ভেরিয়েবলের দিকে ফোকাস করতে চাই, ব্যাখ্যাটি কি এটি সঠিক?

এছাড়াও, এআইসির মানটিও কম, ভাল?

এড। এই আউটপুটটি স্পষ্ট করতে দয়া করে নীচের সম্প্রদায়ের উইকি উত্তরটি নোট করুন এবং আপনি যদি উপযুক্ত দেখতে পান তবে এতে যুক্ত করুন।

r regression self-study stepwise-regression

— gakera
সূত্র

আর-এ সাহায্যের অর্থ আপনাকে কীভাবে ফাংশনটি ব্যবহার করতে হয় তা বোঝানো। এটি পরিসংখ্যান উপর কোর্স হতে বোঝানো হয় না। এবং সে সম্পর্কে, সাধারণভাবে আমি বিশ্বাস করি যে আর-এর সাহায্যের পৃষ্ঠাগুলি আমার জানা সমস্ত ওপেন সোর্স প্যাকেজগুলির মধ্যে সবচেয়ে সম্পূর্ণ এবং কার্যকর। এবং এই জন্য প্যাকেজ প্রদান। এসপিএসএস এবং এসএএস আপনাকে "ব্যাখ্যার জন্য গাইড" হিসাবে অর্ধসত্য এবং সম্পূর্ণ অসম্মতি সহ অনেকগুলি ম্যাম্বো-জাম্বো দেয়।

— জোরিস মেয়েস

এই প্রশ্নটি অবহেলা করা হয়েছে। আমি আমার +1 দেওয়ার ইচ্ছা করি নি, তবে এখন আমার কাছে মনে হচ্ছে এটিকে ভোট দেওয়া খুব গঠনমূলক নয়: (1) ওপি স্পষ্ট করে দেয় এটি হোম ওয়ার্ক এবং চিত্রের জন্য একটি অন্তর্নির্মিত ডেটা সেট ব্যবহার করে, তার নয় ডেটা, (২) সম্পর্কিত কোনও প্রশ্ন step()এই লেখার সময় +২ রেট করা হয়েছে (সুতরাং কেন ?!), (৩) ওপি @ জোরিসের প্রতিক্রিয়াটির কার্যকারিতা স্বীকার করেছে।

— CHL

@ সিএইচএল: মনে হয় আমি আর সংবেদনশীল পায়ের আঙ্গুলের সাথে একমাত্র নই যখন এটি সাহায্যের পৃষ্ঠাগুলিতে আসে :-)। তবে আমি আপনার সাথে আন্তরিকভাবে একমত। প্রশ্নটি বৈধ, একটি পরিষ্কার উপায়ে জিজ্ঞাসা করা হয়েছে এবং তাই এটি হ্রাস করার কোনও কারণ নেই।

— জোরিস মেয়েস

হেই, আমি সাহায্যের জন্য যদি আমি আপনার পাশ দিয়ে আঙ্গুলের উপর পা রাখি তবে আমি দুঃখিত, কমান্ড লাইনের সাথে সত্যিই যখন কিছু আসে তখন আমি খুব ধৈর্যশীল না। আমি সেভাবেই অদ্ভুত, আমি জানি। আপনি যে আমাকে প্রথমে ফোন করেছিলেন তারা হবেনা :) আমি এই জায়গাটি পছন্দ করি, লোকেরা সত্যবাদী।

— গেকেরা

আমরা সেখানে যাই, আমি প্রশ্নটি সম্পাদনা করি যাতে এটি আর এবং আর সহায়তার পক্ষে না যায়) এবং কেবল ওপি পাঠকদের বিভ্রান্ত না করার জন্য এআইসির উপর প্রশ্নটির পুনরাবৃত্তি করেছিলেন।

— গেকেরা

উত্তর:

drop1আপনাকে এআইসির মানদণ্ডের উপর ভিত্তি করে মডেলের তুলনা দেয় এবং সহায়তা ফাইলগুলিতে বর্ণিত হিসাবে বিকল্পটি ব্যবহার করার test="F"সময় আপনি এটিতে "টাইপ II আনোভা" যুক্ত করেন । যতক্ষণ না আপনার কেবল অবিচ্ছিন্ন পরিবর্তনশীল থাকে ততক্ষণ এই টেবিলটি হুবহু সমান summary(lm1), কারণ এফ-মানগুলি কেবল সেই টি-মানগুলির স্কোয়ার হয়। পি-মানগুলি হুবহু এক।

তাহলে এর সাথে কী করব? একে ঠিক সেইভাবে ব্যাখ্যা করুন: এটি যদি এমন কোনও শব্দে প্রকাশ করে যে যদি সেই শব্দটি ব্যতীত মডেল সেই শব্দটির সাথে মডেল থেকে "উল্লেখযোগ্যভাবে" আলাদা হয়। প্রায় "" উল্লেখযোগ্যভাবে মনে রাখুন, কারণ এখানে তাত্পর্যটি বেশিরভাগ লোকেরা যেমন মনে করেন তত ব্যাখ্যা করা যায় না। (একাধিক পরীক্ষার সমস্যা এবং সমস্ত ...)

এবং এআইসি সম্পর্কিত: যত কম তত ভাল লাগে seems এআইসি একটি মান যা ভেরিয়েবলের জন্য নয়, মডেলের জন্য যায় । সুতরাং আউটপুট থেকে সেরা মডেলটি ভেরিয়েবল পরীক্ষা ছাড়াই এক হবে।

মনে মনে, এআইসি এবং এফ পরিসংখ্যান উভয়ের গণনা আর ফাংশনগুলির AIC(lm1)শ্রমের চেয়ে আলাদা । anova(lm1)। এর জন্য AIC(), তথ্যগুলির পৃষ্ঠাগুলিতে দেওয়া হয় extractAIC()। জন্য anova()ফাংশন, বরং এটা সুস্পষ্ট যে টাইপ আমি ও টাইপ -২ এস এস একই নয়।

আমি অভদ্র না হওয়ার চেষ্টা করছি, তবে সেখানে সহায়তা ফাইলগুলিতে কী ব্যাখ্যা করা হয়েছে তা যদি আপনি বুঝতে না পারেন তবে আপনার প্রথমে ফাংশনটি ব্যবহার করা উচিত নয়। স্টেপওয়াইজ রিগ্রেশন অবিশ্বাস্যরূপে জটিল, আপনার পি-ভ্যালুগুলি সবচেয়ে গভীর উপায়ে বিপদে ফেলছে। তাই আবার, না পি-মানগুলির উপর নিজেকে ভিত্তি না । আপনার মডেলটি আপনার অনুমানকে প্রতিবিম্বিত করবে অন্যদিকে নয়।

— জরিস মাইস
সূত্র

আমি এই অনুভূতিটি পছন্দ করি, "যদি আমি বুঝতে না পারি যে আমি ইতিমধ্যে কী করছি, আমার এটি শেখার চেষ্টা করা উচিত নয় ..." এটিও আর সহায়তায় নেওয়া পদ্ধতির বিষয় - এটি ইতিমধ্যে যদি আপনি ইতিমধ্যে না জেনে থাকেন তবে এটি কার্যকর নয় যাচ্ছে. আমি আশা করছিলাম এটি কোনও অন্যরকমের শুরু হতে পারে।

— গেকেরা

তবে আমি আপনার উত্তরের এই অংশটি ব্যবহার করতে পারি: "একে ঠিক সেইভাবে ব্যাখ্যা করুন: শব্দটি ছাড়া মডেল যদি সেই শব্দটির সাথে মডেল থেকে উল্লেখযোগ্যভাবে আলাদা হয় তবে তা প্রকাশ করে।" আমার কাছে এটির অর্থ হ'ল জন (এফ) মানগুলি এই পদগুলির প্রতিটিটির তাত্পর্য এবং একটি ছোট মান এর অর্থ এই পরিবর্তনশীলটি গুরুত্বপূর্ণ। সুতরাং, একটি ভাল মডেলটিতে "***" ভেরিয়েবলগুলি অন্তর্ভুক্ত করা উচিত এবং এর সাথে তারার নেই।

— গেকেরা

@ গেকেরা: তুমি আমাকে ভুল করেছ? আপনি কী করছেন তা যদি বুঝতে না পারেন তবে এটি ব্যবহার করার আগে আপনার অবশ্যই এটি শেখার চেষ্টা করা উচিত । এর অর্থ, পরিসংখ্যানগুলি পড়া এবং একটি কোর্স অনুসরণ করা। সুতরাং, একটি ভাল মডেলের মধ্যে হাইপোথিসিসে রূপান্তরিত ভেরিয়েবলগুলি অন্তর্ভুক্ত করা উচিত। যদি আপনি নিজেকে "***" ভেরিয়েবলের উপর ভিত্তি করে থাকেন তবে আপনাকে প্রথমে মডেলিংয়ের বিষয়ে একটি সম্পূর্ণ কোর্স প্রয়োজন। আপনি অবশ্যই আমার শেষ মন্তব্য বুঝতে পারেন নি। প্রত্যক্ষ যোগাযোগের জন্য দুঃখিত, লোকটির সাথে আসে। বাক্তিগত কিছু না.

— জোরিস মেয়েস

@ গেকেরা: আমি গুরুত্বপূর্ণ কিছু বিষয়গুলি পরিষ্কার করতে আমার উত্তর আপডেট করেছি। মূলত কারণ আপনি যে অংশটি ভেবেছিলেন আপনি ব্যবহার করতে পারবেন বলে ভুল ব্যাখ্যা করেছেন।

— জোরিস মেয়েস

আমি করে শিখছি, এটি সর্বোপরি হোম ওয়ার্ক, এই অধিকার না পেলে কেউ মারা যাবেনা - মাছগুলি ইতিমধ্যে মারা গেছে: পি এখন পর্যন্ত সাহায্যের জন্য ধন্যবাদ, এবং চিন্তা করবেন না, এটি নয় ইন্টারনেটে আমার প্রথমবার :)

— গেকেরা

রেফারেন্সের জন্য, এই মানগুলি টেবিলে অন্তর্ভুক্ত রয়েছে: স্বাধীনতার ডিগ্রিগুলিকে
Df বোঝায় , "স্বাধীনতার ডিগ্রির সংখ্যা হ'ল একটি পরিসংখ্যানের চূড়ান্ত গণনায় মানগুলির সংখ্যা যা আলাদা হতে পারে।"

Sum of Sqকলাম বোঝায় বর্গের সমষ্টি বা আরো সঠিকভাবে ( স্কোয়ারড বিচ্যুতি এর সমষ্টি )। সংক্ষেপে এটি প্রতিটি স্বতন্ত্র মান সেই মানগুলির সামগ্রিক গড় থেকে বিচ্যুত হয় সেই পরিমাণের একটি পরিমাপ।
RSSহয় বর্গের অবশিষ্ট যোগফল । এগুলি নির্ভরশীল (বা আউটপুট) ভেরিয়েবলের পূর্বাভাসিত মানটি সেটের প্রতিটি ডেটা পয়েন্টের (বা আরও বেশি কথা বলার জন্য: ডাটা টেবিলের প্রতিটি "লাইন") এর সত্য মানের থেকে কতটা পৃথক হয় তার একটি পরিমাপ।

AIC হয় Akaike তথ্য নির্ণায়ক যা সাধারণত সংক্ষেপে হিসেবে গণ্য করা হয় "খুব জটিল ব্যাখ্যা করতে" কিন্তু হয়, আনুমানিক পরিসংখ্যান মডেল উপযোগীতা ধার্মিকতা একটি পরিমাপ। আপনার যদি আরও বিশদ প্রয়োজন হয় তবে আপনাকে মৃত গাছগুলিতে তাদের শব্দ (অর্থাত্ বই) দিয়ে ফিরে যেতে হবে। বা উইকিপিডিয়া এবং সেখানকার সংস্থানসমূহ।

F valueসম্পাদনের জন্য কি একটি বলা হচ্ছে ব্যবহার করা হয় এফ পরীক্ষা এবং এটি প্রাপ্ত করা হয় থেকে Pr(F)মান, যা বর্ণনা করে কিভাবে সম্ভবত (অথবা সম্ভাব্য = PR) এফ মান হয়। শূন্যের কাছাকাছি থাকা একটি প্রি (এফ) মান (দ্বারা নির্দেশিত ***) কোনও ইনপুট ভেরিয়েবলের সূচক যা কোনওভাবে কোনও ভাল মডেলকে অন্তর্ভুক্ত করা গুরুত্বপূর্ণ, অর্থাত্, এমন একটি মডেল যা এতে অন্তর্ভুক্ত নয় এটি একটির চেয়ে "উল্লেখযোগ্যভাবে" আলাদা এটা করে.

এই মানগুলির সমস্তটি, এর প্রসঙ্গে drop1 কমান্ডের সামগ্রিক মডেলটির (সমস্ত ইনপুট ভেরিয়েবলগুলি সহ) তুলনা করার জন্য গণনা করা হয় যার ফলে আউটপুট সারণীতে প্রতিটি লাইনের জন্য একটি নির্দিষ্ট ভেরিয়েবল অপসারণ করা হয়।

এখন, যদি এটির উন্নতি করা যায় তবে দয়া করে এটিতে যুক্ত হন বা যেকোন সমস্যা পরিষ্কার করতে পারেন। আমার লক্ষ্যটি কেবল একটি আর কমান্ডের আউটপুট থেকে এর আসল অর্থটির জন্য আরও ভাল "বিপরীত অনুসন্ধান" রেফারেন্সটি পরিষ্কার করা এবং সরবরাহ করা।

— গেকের
সূত্র

@ জিগেরার ব্যবহারিক ব্যবহার এবং আনোভা আর ব্যবহার করে লিনিয়ার মডেলগুলি এবং ভেরিয়েবল / মডেল নির্বাচনের সাথে সম্পর্কিত পদ্ধতিগুলি বোঝার জন্য একটি ভাল সূচনা পয়েন্ট। @ জোরিসের নির্দেশ অনুসারে, ধাপে ধাপে চাপ কম হওয়া খুব কমই প্যানাসিয়া হয় a

— chl

হ্যাঁ, আমি কেন তাদের পোস্ট করতে পারছি না সে সম্পর্কে আমার দাবি অস্বীকার করার সময় @ chl লিঙ্কগুলি যুক্ত করার জন্য ধন্যবাদ। আপনি অবশ্যই সম্মত হন যে আমি স্তন্যপান করছি: ডি

— গেকেরা

@ গাকেরা আমার ধারণা আমি সম্পাদনা প্রতি একাধিক লিঙ্ক যুক্ত করার জন্য আপনার আরও বেশি প্রতিনিধি থাকা দরকার - আমি জানতে পারি একটি প্রশ্নোত্তর ওয়েবসাইটে শুরু করার সময় এটি খুব আনন্দদায়ক নয়। আমি ধরে নিয়েছিলাম যে আপনি নিজের শেষ বাক্যটি নিজেই মুছে ফেলবেন। অন্যদিকে, আমি অনুভব করি যে আপনার নিজের প্রশ্নের উত্তর দেওয়ার জন্য আপনার অত্যধিক উদ্দীপনা আশা করা উচিত নয়, কারণ এটি এক ধরণের সংশোধন '(দরকারী, যদিও)।

— chl

আমি এটি upvotes এর জন্য করছি না (এটি এতটাই Reddit: P) - দরকারী পুনরুদ্ধার ঠিক আমি যা যাচ্ছি তা - মূলত আমার নিজের জন্য তবে অন্যদের জন্যও সম্ভবত দরকারী।

— গেকেরা

@ গেকেরা আমি নিশ্চিত যে এটি উত্সাহ পাওয়ার জন্য ছিল না। বেশিরভাগ সময়, আমরা সম্প্রদায় উইকি (সিডাব্লু) হিসাবে আমাদের নিজস্ব প্রতিক্রিয়া সেট করি, যখন তারা আরও বা বিপরীতমুখী তথ্য যোগ না করে। এটি অন্যের প্রতিক্রিয়াগুলি যোগ বা সংযুক্ত করার একটি নিরপেক্ষ উপায়।

— chl