অ্যাওভ মডেলটিতে কোভেরিয়েটের ক্রম পরিবর্তন করার সময় কেন পি-মানগুলি তাত্পর্যপূর্ণ হয়?


10

আমার কাছে 482 টি পর্যবেক্ষণের ডেটা সেট রয়েছে।

data=Populationfull

আমি 3 এসএনপি-র জন্য একটি জিনোটাইপ সমিতি বিশ্লেষণ করতে যাচ্ছি। আমি আমার বিশ্লেষণের জন্য একটি মডেল তৈরি করার চেষ্টা করছি এবং আমি অ্যাওভ ব্যবহার করছি (y ~ x, ডেটা = ...)। একটি বৈশিষ্ট্যের জন্য আমার কাছে বেশ কয়েকটি স্থির প্রতিক্রিয়া এবং covariates রয়েছে যা আমি মডেলটিতে অন্তর্ভুক্ত করেছি, যেমন:

Starts <- aov(Starts~Sex+DMRT3+Birthyear+Country+Earnings+Voltsec+Autosec, data=Populationfull)

summary(Starts)
                Df Sum Sq Mean Sq F value   Pr(>F)    
Sex              3  17.90    5.97  42.844  < 2e-16 ***
DMRT3            2   1.14    0.57   4.110    0.017 *  
Birthyear        9   5.59    0.62   4.461 1.26e-05 ***
Country          1  11.28   11.28  81.005  < 2e-16 ***
Earnings         1 109.01  109.01 782.838  < 2e-16 ***
Voltsec          1  12.27   12.27  88.086  < 2e-16 ***
Autosec          1   8.97    8.97  64.443 8.27e-15 ***
Residuals      463  64.48    0.14                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

আমি আবিষ্কার করেছি যে আমি যদি মডেলটিতে ভেরিয়েবলের ক্রম পরিবর্তন করেছি তবে আমি বিভিন্ন পি-মান পেয়েছি, দয়া করে নীচে দেখুন।

Starts2 <- aov(Starts~Voltsec+Autosec+Sex+DMRT3+Birthyear+Country+Earnings, data=Populationfull)

summary(Starts2)

                Df Sum Sq Mean Sq F value   Pr(>F)    
Voltsec   1   2.18    2.18  15.627 8.92e-05 ***
Autosec   1 100.60  100.60 722.443  < 2e-16 ***
Sex              3  10.43    3.48  24.962 5.50e-15 ***
DMRT3            2   0.82    0.41   2.957  0.05294 .  
Birthyear        9   3.25    0.36   2.591  0.00638 ** 
Country          1   2.25    2.25  16.183 6.72e-05 ***
Earnings      1  46.64   46.64 334.903  < 2e-16 ***
Residuals      463  64.48    0.14                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

ভেরিয়েবল / ফ্যাক্টর / কোভেরিয়েটস / ফিক্সেডেফেক্টস (?) কোড করে কোন্ ক্রমের উপর নির্ভর করে আমি আলাদা আলাদা পি-মান পেতে পারি? এর জন্য "সংশোধন" করার কোনও উপায় আছে কি? এটি কি ভুল মডেলটি ব্যবহার করছে? আমি তখনও আর তে বেশ নতুন তাই আপনি যদি আমাকে এটির সাহায্য করতে পারেন তবে দয়া করে এটি সত্যিই সহজ রাখুন যাতে উত্তরটি আমি বুঝতে পারি হেই ... ধন্যবাদ, আশা করি কেউ আমাকে এটি বুঝতে সহায়তা করতে পারে!


3
Populationfullআপনার সমস্যাটিকে পুনরায় উত্পাদনযোগ্য করতে দয়া করে কিছু নমুনা ডেটা সরবরাহ করুন । aov()সহায়তা পৃষ্ঠা থেকে উদাহরণ সহ এটি ঘটে না । summary(aov(yield ~ block + N + P + K, npk)); summary(aov(yield ~ K + P + block + N , npk))
মিঃফ্লিক

পি মানগুলি পরিবর্তিত হচ্ছে কারণ মানগুলির পুরো ক্ষেত্র পরিবর্তিত হয়েছে। আপনার প্রথম রান Earnings 1 109.01 109.01 782.838 < 2e-16 ***আপনার দ্বিতীয় রান Earnings 1 46.64 46.64 334.903 < 2e-16 ***। আপনার ফলাফল একই নয়। আপনি পুনরুদ্ধার ভেরিয়েবলের চেয়ে বেশি কিছু করেন নি তা পরীক্ষা করে শুরু করুন।

1
ALSO: দ্বিতীয় মডেলটিতে আপনি উপার্জন নয়, উপার্জনটি ব্যবহার করুন ... যদি বিভিন্ন নামের দুটি ভেরিয়েবল থাকে তবে এটি যদি সমস্যা হয় তবে এটি যদি প্রশ্নটির জায়গায় প্রশ্নটির অনুলিপি করার ক্ষেত্রে টাইপ না হয়।

হ্যাঁ, মান পরিবর্তন হয় তবে কেন? আমি উভয় মডেলগুলিতে হুবহু একই ডেটা ফ্রেম থেকে একই একই কলামগুলি ব্যবহার করেছি (দ্বিতীয় মডেলটিতে আয় বনাম উপার্জন জিনিসটি কেবল এটি ভুল লিখেছি, আমি এখন এটি সংশোধন করেছি)।
রেবেগিনার

1
আপনার ভারসাম্যহীন নকশা থাকার কারণে এটি ঘটছে। আপনি যদি এই ফোরাম বা কেবল গুগল "R এর মধ্যে ভারসাম্যহীন আনোভা" অনুসন্ধান করেন তবে আপনি এ সম্পর্কে প্রচুর সহায়তা পাবেন। আমি carপ্যাকেজটি সন্ধান করার পরামর্শ দেব - এটি টাইপ II এবং টাইপ III আনোভা প্রয়োগ করে, যা ভেরিয়েবলের ক্রমের উপর নির্ভর করে না, যেখানে aovটাইপ আই আনোভা রয়েছে।
ধীরে লরিস

উত্তর:


15

সমস্যাটি aov()তার ডিফল্ট তাত্পর্য পরীক্ষা করার উপায় থেকে আসে । এটি "টাইপ আই" আনোভা বিশ্লেষণ যা বলা হয় তা ব্যবহার করে, যাতে পরীক্ষায় ক্রমটি করা হয় যাতে আপনার মডেলটিতে ভেরিয়েবলগুলি নির্দিষ্ট করা হয়। সুতরাং প্রথম উদাহরণে এটি নির্ধারণ করে যে তারতম্যটি কতটা দ্বারা ব্যাখ্যা করা হয়েছিল sexএবং এর তাত্পর্য পরীক্ষা করে, তারপরে অবশিষ্ট বৈকল্পিকতার কোন অংশটি ব্যাখ্যা করা হয় DMRT3এবং তার অবশিষ্ট তাত্পর্যের ক্ষেত্রে তার তাত্পর্য পরীক্ষা করে , এবং আরও সামনে। দ্বিতীয় উদাহরণে DMRT3কেবল তার পরে মূল্যায়ন করা হয় Voltsec, Autosecএবং sexসেই ক্রমে, সুতরাং DMRT3ব্যাখ্যা করার জন্য কম বৈকল্পিক অবশিষ্ট রয়েছে ।

যদি দুটি পূর্বাভাসীর ভেরিয়েবলগুলি পারস্পরিক সম্পর্কযুক্ত হয় তবে মডেলটিতে প্রবেশ করা প্রথমটি সম্পূর্ণ "ক্রেডিট" লাভ করবে, "দ্বিতীয়টির দ্বারা" ব্যাখ্যা "করার জন্য কম ভেরিয়েন্স রেখে, যা প্রথমটির চেয়ে কম" পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ "হিসাবে প্রদর্শিত হতে পারে না, কার্যকরীভাবে। এই প্রশ্ন এবং এর উত্তর আনোভা বিশ্লেষণের বিভিন্ন ধরণের ব্যাখ্যা করে।

এটিকে ঘুরে দেখার এক উপায় হ'ল ধ্রুপদী আনোভা-র কঠোরতা থেকে নিজেকে সরিয়ে নেওয়া lm()এবং আর-র পরিবর্তে একটি সাধারণ রৈখিক মডেল ব্যবহার করা aov()। এটি কার্যকরভাবে সমানতালে সমস্ত ভবিষ্যদ্বাণীকে বিশ্লেষণ করে একবারে সমস্ত ভবিষ্যদ্বাণীকে "সংশোধন" করে " সেক্ষেত্রে দু'জন পারস্পরিক সম্পর্কযুক্ত ভবিষ্যদ্বাণীকারীদের তাদের আনুমানিক রিগ্রেশন সহগগুলির বড় স্ট্যান্ডার্ড ত্রুটি থাকতে পারে এবং তাদের সহগ সংখ্যাগুলি জনসংখ্যার চেয়ে বিভিন্ন নমুনার মধ্যে পৃথক হতে পারে, তবে কমপক্ষে আপনি মডেল স্পেসিফিকেশনে ভেরিয়েবলগুলি প্রবেশ করার আদেশের বিষয়টি বিবেচ্য নয়।

যদি আপনার প্রতিক্রিয়া ভেরিয়েবলটি কোনও ধরণের গণনা ভেরিয়েবল হয়, যেমন এর নামটি থেকে Startsবোঝা যায়, তবে সম্ভবত আপনি সম্ভবত এনোভা ব্যবহার করা উচিত নয় কারণ পি- ভ্যালু ব্যাখ্যার প্রয়োজন অনুসারে অবশিষ্টাংশগুলি সাধারণত বিতরণ করার সম্ভাবনা কম । গণনা ভেরিয়েবলগুলি সাধারণত রৈখিক মডেলগুলি (যেমন, glm()আর-তে) দিয়ে পরিচালনা করা হয় , যা lm()অন্যান্য ধরণের ত্রুটি কাঠামোর সাধারণীকরণ হিসাবে ভাবা যেতে পারে ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.