একই ডেটা সেটটিতে দুটি লিনিয়ার মডেল চালানো কি গ্রহণযোগ্য?


10

একাধিক গ্রুপের সাথে লিনিয়ার রিগ্রেশন (প্রাকৃতিক গোষ্ঠী একটি প্রাইমির সংজ্ঞা দেয়) নিম্নলিখিত দুটি প্রশ্নের উত্তর দেওয়ার জন্য একই ডেটা সেটটিতে দুটি পৃথক মডেল চালানো কি গ্রহণযোগ্য?

  1. প্রতিটি গ্রুপের একটি নন-শূন্য slাল এবং নন-শূন্য ইন্টারসেপ্ট আছে এবং গ্রুপের প্রতিরোধের মধ্যে প্রতিটিটির জন্য কী কী পরামিতি রয়েছে?

  2. গ্রুপ সদস্যপদ নির্বিশেষে কি আছে, একটি শূন্য-বহির্ভুত প্রবণতা এবং নন-শূন্য ইন্টারসেপ্ট এবং গোষ্ঠীগুলির প্রতিরোধের এই পরামিতিগুলি কী?

আর-তে প্রথম মডেলটি হবে lm(y ~ group + x:group - 1), যাতে অনুমিত সহগগুলি প্রতিটি গ্রুপের জন্য সরাসরি ইন্টারসেপ্ট এবং opeাল হিসাবে ব্যাখ্যা করা যায় second দ্বিতীয় মডেলটি হবে lm(y ~ x + 1)

বিকল্পটি হ'ল lm(y ~ x + group + x:group + 1), যার ফলস্বরূপ সহগগুলির একটি জটিল সংক্ষিপ্ত টেবিল তৈরি হবে , যার সাথে গ্রুপ slালু এবং ইন্টারসেপ্টগুলির মধ্যে কিছু রেফারেন্স থেকে opালু এবং বিরতিতে পার্থক্য থেকে গণনা করতে হবে। এছাড়াও আপনাকে গ্রুপের পুনঃক্রম করতে হবে এবং সর্বশেষ গ্রুপের পার্থক্যের (কখনও কখনও) পি-মান পাওয়ার জন্য মডেলটিকে দ্বিতীয়বার চালাতে হবে।

এটি দুটি পৃথক মডেল ব্যবহার করে কোনওভাবেই বা এই মানক অনুশীলনে অনুমানকে প্রভাবিত করে?

এটিকে প্রসঙ্গে রাখতে, এক্সকে ড্রাগের ডোজ এবং গোষ্ঠীগুলিকে বিভিন্ন জাতি হিসাবে বিবেচনা করুন। কোনও ডাক্তারের জন্য নির্দিষ্ট রেসের জন্য ডোজ-প্রতিক্রিয়াশীল সম্পর্কটি জানা বা ড্রাগটি যে আদৌ কাজ করে তা জেনে রাখা আকর্ষণীয় হতে পারে তবে পুরো (মানব) জনসংখ্যার জন্য ডোজ-প্রতিক্রিয়া সম্পর্কিত সম্পর্কটি জানা কখনও কখনও আকর্ষণীয়ও হতে পারে জনস্বাস্থ্য আধিকারিকের জন্য নির্বিশেষে জাতি নির্বিশেষে। এটি কেবলমাত্র গ্রুপের মধ্যে এবং গোষ্ঠীগতভাবে আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা আলাদা জায়গায় কীভাবে আগ্রহী হতে পারে তার একটি উদাহরণ। একটি ডোজ-প্রতিক্রিয়া সম্পর্ক লিনিয়ার হওয়া উচিত কিনা তা গুরুত্বপূর্ণ নয়।


আপনি কি নিশ্চিত যে আপনি লিনিয়ার রিগ্রেশন ব্যবহার করতে চান? ডোজ-প্রতিক্রিয়া সম্পর্কগুলি পর্যাপ্ত পরিমাণের সীমার মধ্যে প্রায় কখনও লিনিয়ার হয় না।
মাইকেল লিউ

@ মিশেল, দুঃখিত, এটি উদাহরণের একটি খারাপ পছন্দ ছিল, আমার ধারণা। আমি সাধারণভাবে এটি সম্পর্কে ভাবছি। ডোজ-প্রতিক্রিয়া সম্পর্কের বিশদগুলি সেইভাবে পাওয়া উচিত নয়। আমি এটি নোট করতে প্রশ্ন সম্পাদনা করেছি।
Jdub

আপনি কি এলোমেলো ইন্টারসেপ্ট, এলোমেলো opeাল মডেল বিবেচনা করেছেন?
অনুমানযোগ্য

উত্তর:


2

আমাকে এই বলে শুরু করা যাক যে আমি মনে করি আপনার প্রথম প্রশ্ন এবং প্রথম আর মডেল একে অপরের সাথে বেমানান। আর-তে, যখন আমরা হয় -1বা দিয়ে একটি সূত্র লিখি +0, আমরা ইন্টারসেপ্টটি দমন করি। সুতরাং, ইন্টারসেপ্টগুলি 0 থেকে উল্লেখযোগ্যভাবে আলাদা হয় কিনা তা আপনাকে বলতে সক্ষম হতে lm(y ~ group + x:group - 1) বাধা দেয় same একই শিরাতে, আপনার নিম্নলিখিত দুটি মডেলগুলিতে +1আর-ও অতিরিক্ত প্রয়োজন, ইন্টারসেপ্টটি স্বয়ংক্রিয়ভাবে আর-তে অনুমান করা হয় I আমি আপনাকে রেফারেন্স সেল কোডিং ব্যবহার করার পরামর্শ দেব ( আপনার গোষ্ঠীগুলির প্রতিনিধিত্ব করতে 'ডমি কোডিং' নামেও ডেকে আনে। যে, সঙ্গে গ্রুপ, তৈরি -1নতুন ভেরিয়েবল, ডিফল্ট হিসাবে একটি গ্রুপ বাছুন এবং নতুন ভেরিয়েবলগুলির প্রতিটিতে সেই গ্রুপের ইউনিটগুলিতে 0 গুলি নির্ধারণ করুন। তারপরে প্রতিটি নতুন ভেরিয়েবল অন্য দলের মধ্যে একটিতে সদস্যতার প্রতিনিধিত্ব করতে ব্যবহৃত হয়; প্রদত্ত গোষ্ঠীর মধ্যে পড়া ইউনিটগুলি সংশ্লিষ্ট ভেরিয়েবলের 1 এবং অন্য কোথাও 0 এর সাথে নির্দেশিত হয়। যখন আপনার সহগগুলি ফেরত দেওয়া হবে, যদি ইন্টারসেপ্টটি 'তাৎপর্যপূর্ণ' হয়, তবে আপনার ডিফল্ট গোষ্ঠীতে একটি শূন্য-বিরতি নেই। দুর্ভাগ্যক্রমে, অন্যান্য গোষ্ঠীর জন্য স্ট্যান্ডার্ড তাত্পর্য পরীক্ষাগুলি আপনাকে 0 থেকে পৃথক কিনা তা বলবে না, বরং তারা ডিফল্ট গ্রুপ থেকে পৃথক হলে। তারা 0 থেকে পৃথক কিনা তা নির্ধারণ করার জন্য, তাদের সহগকে ইন্টারসেপ্টে যুক্ত করুন এবং তাদের টি-মানগুলি পেতে তাদের স্ট্যান্ডার্ড ত্রুটি দ্বারা যোগফলকে ভাগ করুন। Opালুগুলির সাথে পরিস্থিতি একই রকম হবে: এটি, এর পরীক্ষাএক্সডিফল্ট গোষ্ঠীর slাল 0 থেকে উল্লেখযোগ্যভাবে পৃথক হয় কিনা তা আপনাকে জানাতে হবে এবং সেই গোষ্ঠীর opালগুলি ডিফল্ট গোষ্ঠীগুলির থেকে পৃথক কিনা তা ইন্টারঅ্যাকশন শর্তাদি আপনাকে জানায়। 0 টির বিপরীতে অন্যান্য গোষ্ঠীর opালু জন্য পরীক্ষাগুলি ঠিক যেমন বাধা হিসাবে তৈরি করা যায়। আরও ভাল হবে কেবলমাত্র কোনও গ্রুপ নিষ্ক্রিয় পরিবর্তনশীল বা ইন্টারঅ্যাকশন শর্তাদি ছাড়াই একটি 'সীমাবদ্ধ' মডেল ফিট করা এবং এই মডেলটির সাথে পুরো মডেলের সাথে পরীক্ষা করা anova(), যা আপনাকে বলবে যে আপনার গ্রুপগুলি মোটেও অর্থপূর্ণভাবে পৃথক কিনা।

এই কথাগুলি বলা হওয়ার পরে, আপনার মূল প্রশ্নটি এই সমস্তগুলি করা গ্রহণযোগ্য কিনা । এখানে অন্তর্নিহিত সমস্যাটি একাধিক তুলনার সমস্যা । এটি একটি দীর্ঘস্থায়ী এবং কাঁটাযুক্ত বিষয়, যার অনেকগুলি মতামত রয়েছে। (আপনি এই কীওয়ার্ডের সাথে ট্যাগ করা প্রশ্নগুলিতে সিভিতে এই বিষয়ে আরও তথ্যের সন্ধান করতে পারেন )) যদিও এই বিষয়ে মতামত অবশ্যই পৃথক হয়েছে, তবে আমি মনে করি যে বিশ্লেষণগুলি অরথগোনাল ছিল তবে একই ডেটাসেটের জন্য অনেকগুলি বিশ্লেষণ চালানোর জন্য কেউ আপনাকে দোষ দিবে না provided । সাধারণত, অ र्थোগোনাল বিপরীতে কীভাবে কোনও সেটকে তুলনা করা যায় তা নির্ধারণের প্রসঙ্গে চিন্তাভাবনা করা হয়একে অপরের গোষ্ঠীগুলি , তবে এখানে বিষয়টি নয়; আপনার প্রশ্নটি অস্বাভাবিক (এবং আমি মনে করি, আকর্ষণীয়)। আমি এখন পর্যন্ত দেখতে পাচ্ছি, যদি আপনি কেবল নিজের ডেটাসেটটি ভাগ করতে চানপৃথক উপগ্রহগুলি পৃথক করুন এবং প্রতিটিের জন্য একটি সাধারণ রিগ্রেশন মডেল চালান যা ঠিক হবে। আরও আকর্ষণীয় প্রশ্নটি হল যে 'ধসে পড়া' বিশ্লেষণকে পৃথক বিশ্লেষণের সেটকে অরথগোনাল হিসাবে বিবেচনা করা যেতে পারে; আমি এটি মনে করি না, কারণ আপনার গ্রুপ বিশ্লেষণের একটি রৈখিক সংমিশ্রণে ধসে পড়া বিশ্লেষণটি পুনরায় তৈরি করতে সক্ষম হওয়া উচিত।

কিছুটা আলাদা প্রশ্ন হ'ল এটি করা কি সত্যই অর্থবোধক। চিত্র যে আপনি একটি প্রাথমিক বিশ্লেষণ চালিয়েছেন এবং আবিষ্কার করেছেন যে গোষ্ঠীগুলি একে অপরের থেকে যথেষ্ট অর্থপূর্ণ উপায়ে পৃথক; এই বিচ্যুত গোষ্ঠীগুলিকে একসাথে বিচ্ছিন্ন করে তোলা কী অর্থে? উদাহরণস্বরূপ, কল্পনা গোষ্ঠী, তাদের বিবৃতি উপর (একরকম) পার্থক্য তারপর, অন্তত কিছু গ্রুপ নেই 0 পথিমধ্যে আছে। যদি এর মধ্যে একটি মাত্র গ্রুপ থাকে, তবে গোষ্ঠীর জন্য ইন্টারসেপ্ট কেবল 0 হবে যদি সেই গোষ্ঠীটি থাকেএন=0সম্পর্কিত জনসংখ্যায়। বিকল্পভাবে, আসুন আমরা বলতে পারি যে ঠিক দুটি গ্রুপ রয়েছে শূন্য-অবিরামের সাথে একটি ধনাত্মক এবং একটি নেতিবাচক, তবে সম্পূর্ণরূপে কেবল 0 ইন্টারসেপ্ট থাকবে কেবল যদিএনএই গোষ্ঠীর মধ্যে অন্তর্ভুক্তিগুলির বিবিধতার বিস্তৃতিগুলির বিপরীত অনুপাতে। আমি এখানে যেতে পারতাম (আরও অনেক সম্ভাবনা রয়েছে) তবে মূল বিষয়টি হল আপনি গ্রুপগুলির মাপগুলি প্যারামিটার মানগুলির মধ্যে পার্থক্যের সাথে কীভাবে সম্পর্কিত তা নিয়ে প্রশ্ন জিজ্ঞাসা করছেন। সত্যি বলতে, এগুলি আমার কাছে অদ্ভুত প্রশ্ন।

আমি আপনাকে পরামর্শ দিচ্ছি যে আমি উপরে বর্ণিত প্রোটোকলটি অনুসরণ করি। যথা, ডামি কোডগুলি আপনার গ্রুপগুলি। তারপরে অন্তর্ভুক্ত সমস্ত ডমি এবং ইন্টারঅ্যাকশন শর্তাদি সহ একটি সম্পূর্ণ মডেল ফিট করুন। এই শর্তাবলী ছাড়াই একটি হ্রাস মডেল ফিট করুন এবং নেস্টেড মডেল পরীক্ষা করুন। গোষ্ঠীগুলি যদি কোনওভাবে পৃথক হয় তবে গ্রুপগুলি কীভাবে আলাদা হয় তা আরও ভালভাবে বোঝার জন্য (আশাবাদী) এ-প্রাইমারী (তাত্ত্বিকভাবে চালিত) অर्थোগোনাল বিপরীতে অনুসরণ করুন follow (এবং চক্রান্ত - সর্বদা, সর্বদা প্লট করুন))

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.