অ্যাওভ মডেলটিতে কোভেরিয়েটের ক্রম পরিবর্তন করার সময় কেন পি-মানগুলি তাত্পর্যপূর্ণ হয়?

আমার কাছে 482 টি পর্যবেক্ষণের ডেটা সেট রয়েছে।

data=Populationfull

আমি 3 এসএনপি-র জন্য একটি জিনোটাইপ সমিতি বিশ্লেষণ করতে যাচ্ছি। আমি আমার বিশ্লেষণের জন্য একটি মডেল তৈরি করার চেষ্টা করছি এবং আমি অ্যাওভ ব্যবহার করছি (y ~ x, ডেটা = ...)। একটি বৈশিষ্ট্যের জন্য আমার কাছে বেশ কয়েকটি স্থির প্রতিক্রিয়া এবং covariates রয়েছে যা আমি মডেলটিতে অন্তর্ভুক্ত করেছি, যেমন:

Starts <- aov(Starts~Sex+DMRT3+Birthyear+Country+Earnings+Voltsec+Autosec, data=Populationfull)

summary(Starts)
                Df Sum Sq Mean Sq F value   Pr(>F)    
Sex              3  17.90    5.97  42.844  < 2e-16 ***
DMRT3            2   1.14    0.57   4.110    0.017 *  
Birthyear        9   5.59    0.62   4.461 1.26e-05 ***
Country          1  11.28   11.28  81.005  < 2e-16 ***
Earnings         1 109.01  109.01 782.838  < 2e-16 ***
Voltsec          1  12.27   12.27  88.086  < 2e-16 ***
Autosec          1   8.97    8.97  64.443 8.27e-15 ***
Residuals      463  64.48    0.14                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

আমি আবিষ্কার করেছি যে আমি যদি মডেলটিতে ভেরিয়েবলের ক্রম পরিবর্তন করেছি তবে আমি বিভিন্ন পি-মান পেয়েছি, দয়া করে নীচে দেখুন।

Starts2 <- aov(Starts~Voltsec+Autosec+Sex+DMRT3+Birthyear+Country+Earnings, data=Populationfull)

summary(Starts2)

                Df Sum Sq Mean Sq F value   Pr(>F)    
Voltsec   1   2.18    2.18  15.627 8.92e-05 ***
Autosec   1 100.60  100.60 722.443  < 2e-16 ***
Sex              3  10.43    3.48  24.962 5.50e-15 ***
DMRT3            2   0.82    0.41   2.957  0.05294 .  
Birthyear        9   3.25    0.36   2.591  0.00638 ** 
Country          1   2.25    2.25  16.183 6.72e-05 ***
Earnings      1  46.64   46.64 334.903  < 2e-16 ***
Residuals      463  64.48    0.14                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

ভেরিয়েবল / ফ্যাক্টর / কোভেরিয়েটস / ফিক্সেডেফেক্টস (?) কোড করে কোন্ ক্রমের উপর নির্ভর করে আমি আলাদা আলাদা পি-মান পেতে পারি? এর জন্য "সংশোধন" করার কোনও উপায় আছে কি? এটি কি ভুল মডেলটি ব্যবহার করছে? আমি তখনও আর তে বেশ নতুন তাই আপনি যদি আমাকে এটির সাহায্য করতে পারেন তবে দয়া করে এটি সত্যিই সহজ রাখুন যাতে উত্তরটি আমি বুঝতে পারি হেই ... ধন্যবাদ, আশা করি কেউ আমাকে এটি বুঝতে সহায়তা করতে পারে!

r anova

— Rbeginner
সূত্র

Populationfullআপনার সমস্যাটিকে পুনরায় উত্পাদনযোগ্য করতে দয়া করে কিছু নমুনা ডেটা সরবরাহ করুন । aov()সহায়তা পৃষ্ঠা থেকে উদাহরণ সহ এটি ঘটে না । summary(aov(yield ~ block + N + P + K, npk)); summary(aov(yield ~ K + P + block + N , npk))

— মিঃফ্লিক

পি মানগুলি পরিবর্তিত হচ্ছে কারণ মানগুলির পুরো ক্ষেত্র পরিবর্তিত হয়েছে। আপনার প্রথম রান Earnings 1 109.01 109.01 782.838 < 2e-16 ***আপনার দ্বিতীয় রান Earnings 1 46.64 46.64 334.903 < 2e-16 ***। আপনার ফলাফল একই নয়। আপনি পুনরুদ্ধার ভেরিয়েবলের চেয়ে বেশি কিছু করেন নি তা পরীক্ষা করে শুরু করুন।

ALSO: দ্বিতীয় মডেলটিতে আপনি উপার্জন নয়, উপার্জনটি ব্যবহার করুন ... যদি বিভিন্ন নামের দুটি ভেরিয়েবল থাকে তবে এটি যদি সমস্যা হয় তবে এটি যদি প্রশ্নটির জায়গায় প্রশ্নটির অনুলিপি করার ক্ষেত্রে টাইপ না হয়।

হ্যাঁ, মান পরিবর্তন হয় তবে কেন? আমি উভয় মডেলগুলিতে হুবহু একই ডেটা ফ্রেম থেকে একই একই কলামগুলি ব্যবহার করেছি (দ্বিতীয় মডেলটিতে আয় বনাম উপার্জন জিনিসটি কেবল এটি ভুল লিখেছি, আমি এখন এটি সংশোধন করেছি)।

— রেবেগিনার

আপনার ভারসাম্যহীন নকশা থাকার কারণে এটি ঘটছে। আপনি যদি এই ফোরাম বা কেবল গুগল "R এর মধ্যে ভারসাম্যহীন আনোভা" অনুসন্ধান করেন তবে আপনি এ সম্পর্কে প্রচুর সহায়তা পাবেন। আমি carপ্যাকেজটি সন্ধান করার পরামর্শ দেব - এটি টাইপ II এবং টাইপ III আনোভা প্রয়োগ করে, যা ভেরিয়েবলের ক্রমের উপর নির্ভর করে না, যেখানে aovটাইপ আই আনোভা রয়েছে।

— ধীরে লরিস

সমস্যাটি aov()তার ডিফল্ট তাত্পর্য পরীক্ষা করার উপায় থেকে আসে । এটি "টাইপ আই" আনোভা বিশ্লেষণ যা বলা হয় তা ব্যবহার করে, যাতে পরীক্ষায় ক্রমটি করা হয় যাতে আপনার মডেলটিতে ভেরিয়েবলগুলি নির্দিষ্ট করা হয়। সুতরাং প্রথম উদাহরণে এটি নির্ধারণ করে যে তারতম্যটি কতটা দ্বারা ব্যাখ্যা করা হয়েছিল sexএবং এর তাত্পর্য পরীক্ষা করে, তারপরে অবশিষ্ট বৈকল্পিকতার কোন অংশটি ব্যাখ্যা করা হয় DMRT3এবং তার অবশিষ্ট তাত্পর্যের ক্ষেত্রে তার তাত্পর্য পরীক্ষা করে , এবং আরও সামনে। দ্বিতীয় উদাহরণে DMRT3কেবল তার পরে মূল্যায়ন করা হয় Voltsec, Autosecএবং sexসেই ক্রমে, সুতরাং DMRT3ব্যাখ্যা করার জন্য কম বৈকল্পিক অবশিষ্ট রয়েছে ।

যদি দুটি পূর্বাভাসীর ভেরিয়েবলগুলি পারস্পরিক সম্পর্কযুক্ত হয় তবে মডেলটিতে প্রবেশ করা প্রথমটি সম্পূর্ণ "ক্রেডিট" লাভ করবে, "দ্বিতীয়টির দ্বারা" ব্যাখ্যা "করার জন্য কম ভেরিয়েন্স রেখে, যা প্রথমটির চেয়ে কম" পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ "হিসাবে প্রদর্শিত হতে পারে না, কার্যকরীভাবে। এই প্রশ্ন এবং এর উত্তর আনোভা বিশ্লেষণের বিভিন্ন ধরণের ব্যাখ্যা করে।

এটিকে ঘুরে দেখার এক উপায় হ'ল ধ্রুপদী আনোভা-র কঠোরতা থেকে নিজেকে সরিয়ে নেওয়া lm()এবং আর-র পরিবর্তে একটি সাধারণ রৈখিক মডেল ব্যবহার করা aov()। এটি কার্যকরভাবে সমানতালে সমস্ত ভবিষ্যদ্বাণীকে বিশ্লেষণ করে একবারে সমস্ত ভবিষ্যদ্বাণীকে "সংশোধন" করে " সেক্ষেত্রে দু'জন পারস্পরিক সম্পর্কযুক্ত ভবিষ্যদ্বাণীকারীদের তাদের আনুমানিক রিগ্রেশন সহগগুলির বড় স্ট্যান্ডার্ড ত্রুটি থাকতে পারে এবং তাদের সহগ সংখ্যাগুলি জনসংখ্যার চেয়ে বিভিন্ন নমুনার মধ্যে পৃথক হতে পারে, তবে কমপক্ষে আপনি মডেল স্পেসিফিকেশনে ভেরিয়েবলগুলি প্রবেশ করার আদেশের বিষয়টি বিবেচ্য নয়।

যদি আপনার প্রতিক্রিয়া ভেরিয়েবলটি কোনও ধরণের গণনা ভেরিয়েবল হয়, যেমন এর নামটি থেকে Startsবোঝা যায়, তবে সম্ভবত আপনি সম্ভবত এনোভা ব্যবহার করা উচিত নয় কারণ পি- ভ্যালু ব্যাখ্যার প্রয়োজন অনুসারে অবশিষ্টাংশগুলি সাধারণত বিতরণ করার সম্ভাবনা কম । গণনা ভেরিয়েবলগুলি সাধারণত রৈখিক মডেলগুলি (যেমন, glm()আর-তে) দিয়ে পরিচালনা করা হয় , যা lm()অন্যান্য ধরণের ত্রুটি কাঠামোর সাধারণীকরণ হিসাবে ভাবা যেতে পারে ।

— EDM
সূত্র