আর এর মধ্যে স্বাভাবিকতা বা বৈচিত্রের সমতা না থাকলে ডেটাতে দ্বি-মুখী আনোভা কীভাবে চালানো যায়?


16

আমি এই মুহুর্তে আমার মাস্টার থিসিসে কাজ করছি এবং সিগমাপ্লট-এর সাথে পরিসংখ্যান চালানোর পরিকল্পনা করছি। যাইহোক, আমার ডেটা দিয়ে কিছু সময় ব্যয় করার পরে আমি এই সিদ্ধান্তে পৌঁছেছি যে সিগমাপ্লট আমার সমস্যার জন্য উপযুক্ত নাও হতে পারে (আমার ভুল হতে পারে) তাই আমি আর-তে আমার প্রথম প্রচেষ্টা শুরু করেছি, যা একেবারে সহজ করে নি।

পরিকল্পনাটি ছিল আমার ডেটাতে একটি সহজ দুটি উপায়-আনোভা চালানো যা ফলাফলগুলি 3 টি বিভিন্ন প্রোটিন এবং সেইগুলিতে 8 টি পৃথক চিকিত্সা থেকে আসে, সুতরাং আমার দুটি কারণ হ'ল প্রোটিন এবং চিকিত্সা। আমি উভয় ব্যবহার করে স্বাভাবিকতার জন্য পরীক্ষা করেছি

> shapiro.test(time)

এবং

> ks.test(time, "norm", mean=mean(time), sd=sqrt(var(time)))

উভয় ক্ষেত্রে (সম্ভবত অবাক হওয়ার কিছু নেই) আমি একটি সাধারণ-সাধারণ বিতরণ দিয়ে শেষ করেছি।

বৈচিত্রের সমতার জন্য কোন পরীক্ষার জন্য প্রথম পরীক্ষার প্রশ্নটি আমাকে ছেড়ে দিয়েছে। আমি সাথে এসেছি

> chisq.test(time)

এবং ফলাফলটি হ'ল আমার ডেটাতেও বৈচিত্রের সমতা নেই।

আমি বিভিন্ন ডেটা ট্রান্সফরমেশন (লগ, কেন্দ্র, মানককরণ) চেষ্টা করেছিলাম, যার সবকটিই আমার সমস্যাগুলি বৈকল্পগুলির সাথে সমাধান করে না।

কোন প্রোটিন এবং কোন চিকিত্সা একে অপরের থেকে উল্লেখযোগ্যভাবে পৃথক হয় তা পরীক্ষার জন্য আমি কীভাবে এএনওওএ পরিচালনা করব তা এখন আমার ক্ষতি হচ্ছে। আমি কৃস্কাল-ওয়ালিস-টেস্ট সম্পর্কে কিছু পেয়েছি, তবে কেবলমাত্র একটি কারণের (?) জন্য। আমি র‌্যাঙ্কিং বা র‌্যান্ডমাইজেশন সম্পর্কিত জিনিসগুলিও পেয়েছি, তবে কীভাবে আরগুলিতে এই কৌশলগুলি বাস্তবায়ন করা যায় তা এখনও পাইনি not

আমার কি করা উচিত কারও কি কোনও পরামর্শ আছে?

সম্পাদনা: আপনার উত্তরগুলির জন্য আপনাকে ধন্যবাদ, আমি পড়ে কিছুটা অভিভূত হয়েছি (মনে হচ্ছে এটি কমের পরিবর্তে আরও বেশি কিছু পেয়েছে) তবে আমি অবশ্যই এগিয়ে যাব।

এখানে প্রস্তাবিত হিসাবে আমার তথ্যগুলির একটি উদাহরণ (আমি ফর্ম্যাটটির জন্য খুব দুঃখিত, আমি কোনও ফাইল রাখার জন্য অন্য কোনও সমাধান বা স্থান বের করতে পারি না I আমি এখনও এই সমস্ত ক্ষেত্রেই নতুন)):

protein treatment   time  
A   con 2329.0  
A   HY  1072.0  
A   CL1 4435.0  
A   CL2 2971.0  
A   CL1-HY sim  823.5  
A   CL2-HY sim  491.5  
A   CL1+HY mix  2510.5  
A   CL2+HY mix  2484.5  
A   con 2454.0  
A   HY  1180.5  
A   CL1 3249.7  
A   CL2 2106.7  
A   CL1-HY sim  993.0  
A   CL2-HY sim  817.5  
A   CL1+HY mix  1981.0  
A   CL2+HY mix  2687.5  
B   con 1482.0  
B   HY  2084.7  
B   CL1 1498.0  
B   CL2 1258.5  
B   CL1-HY sim  1795.7  
B   CL2-HY sim  1804.5  
B   CL1+HY mix  1633.0  
B   CL2+HY mix  1416.3  
B   con 1339.0  
B   HY  2119.0  
B   CL1 1093.3  
B   CL2 1026.5  
B   CL1-HY sim  2315.5  
B   CL2-HY sim  2048.5  
B   CL1+HY mix  1465.0  
B   CL2+HY mix  2334.5  
C   con 1614.8  
C   HY  1525.5  
C   CL1 426.3  
C   CL2 1192.0  
C   CL1-HY sim  1546.0  
C   CL2-HY sim  874.5  
C   CL1+HY mix  1386.0  
C   CL2+HY mix  364.5  
C   con 1907.5  
C   HY  1152.5  
C   CL1 639.7  
C   CL2 1306.5  
C   CL1-HY sim  1515.0  
C   CL2-HY sim  1251.0  
C   CL1+HY mix  1350.5  
C   CL2+HY mix  1230.5

2
দেখে মনে হচ্ছে আপনি আর এর সাথে ভাল আছেন তবে আমার মনে হয় আপনার অসুবিধা আর সম্পর্কিত হতে পারে না। সমস্যার কুঁকড়ে যাওয়ার জন্য আপনাকে প্রথমে কোনও পরিসংখ্যানবিদদের পরামর্শ নিতে হবে, তবেই আপনি এটি ব্যবহারিকভাবে মোকাবেলা করতে পারবেন। আপনার বর্তমান প্রশ্নটি বেশ বিস্তৃত এবং এটিতে মানুষকে ঘৃণা করতে বাধা দিতে পারে। প্রযুক্তিগত অংশের জন্য, এখানে কয়েকটি সাইট রয়েছে: ats.ucla.edu/stat/R/seminars/Repmitted_Measures/… এবং ব্যক্তিত্ব
প্রজেক্ট.আর.আর.আরানোভা এইচটিএমএল

4
র‌্যাঙ্ক পরীক্ষার একটি খুব ভাল বিকল্প হ'ল আনোভা'র ( uvm.edu/~dowell/StatPages/More_Stuff/Paruration%20Anova/… ) ক্রমশক্তি ব্যবহার করা । যে পদ্ধতির সাথে heteroscedasticity কিছু যায় আসে না। লোকেরা র‌্যাঙ্ক পরীক্ষাগুলি ব্যবহার করার প্রধান কারণ হ'ল তারা গণনামূলকভাবে আরও সহজ। এখন আর কিছু যায় আসে না। আমাদের আর এবং দক্ষ কম্পিউটার রয়েছে ...
মিক্কো

1
জবাব কী? নোট করুন যে প্রতিক্রিয়াটি সাধারণত বিতরণ করা হয় কিনা তা আমরা আসলে যত্নবান করি না - আমরা বিশ্লেষণের অবশিষ্টাংশগুলি প্রায় অনুরূপ বৈকল্পের সাথে স্বাভাবিক কিনা তা পরীক্ষা করতে চাই। তবে যদি আসলে কোনও চিকিত্সার প্রভাব থাকে তবে আমরা আশা করব না যে প্রতিক্রিয়াটি সাধারণত প্রান্তিকভাবে বিতরণ করা হবে।
Dason

1
আমি নোট করব যে আমি আপনার পোস্ট করা ডেটাটি ধরেছি এবং আনোভা দুইভাবে চালিয়েছি এবং একটি শাপিরো উইলক্সের অবশিষ্টাংশের উপর পরীক্ষা করেছি এবং এটি 0.5022 এর পি-ভ্যালু দিয়েছে যা খুব বেশি উদ্বেগের ইঙ্গিত দেয় না।
Dason

1
আনোবায় কী আসে তা @Sabine স্বাভাবিকতা প্রায়শই বড় উদ্বেগের বিষয় নয়, তবে আপনার নমুনাগুলি একই জনসংখ্যার থেকে আসা উচিত অর্থাত্ র্যান্ডমাইজেশনের পরে ভিন্নতার সাম্যতা সবচেয়ে গুরুত্বপূর্ণ, অনুমান অবশ্যই। আপনার কিছু করা উচিত, যদি আপনার রূপগুলি প্রায় সমান না হয় (চেষ্টা করুন ?bartlett.test)
মিক্কো

উত্তর:


12

এটি কোনও উত্তরের চেয়ে বেশি মন্তব্য হতে পারে, তবে এটি কোনও মন্তব্য হিসাবে খাপ খায় না। আমরা আপনাকে এখানে সহায়তা করতে সক্ষম হতে পারি, তবে এটি কয়েকটি পুনরাবৃত্তি নিতে পারে; আমাদের আরও তথ্য দরকার

প্রথমত, আপনার প্রতিক্রিয়া পরিবর্তনশীল কি?

দ্বিতীয়ত, নোট করুন যে আপনার প্রতিক্রিয়াটির প্রান্তিক বিতরণটি স্বাভাবিক হতে হবে না , বরং মডেলটির (যেমন, অবশিষ্টাংশ) বিতরণ শর্তযুক্ত হওয়া উচিত - এটি পরিষ্কার নয় যে আপনি আপনার অবশিষ্টাংশগুলি পরীক্ষা করেছেন। তদ্ব্যতীত, লিনিয়ার মডেলটির (যেমন, একটি আনোভা) সর্বনিম্ন গুরুত্বপূর্ণ ধারণাটি স্বাভাবিকতা ; অবশিষ্টাংশগুলি পুরোপুরি স্বাভাবিক হওয়ার দরকার পড়বে না। স্বাভাবিকতার পরীক্ষা সাধারণত সার্থক হয় না ( সিভি সম্পর্কে আলোচনার জন্য এখানে দেখুন ), প্লটগুলি আরও ভাল। আমি আপনার অবশিষ্টাংশের কিউকি প্লট চেষ্টা করব । এটি Rদিয়ে সম্পন্ন হয় qqnorm(), বা চেষ্টা qqPlot()করুনcarপ্যাকেজ। অবশিষ্টাংশগুলি যেভাবে নরমাল, সেগুলি বিবেচনা করাও মূল্যবান: অতিরিক্ত কার্টোসিসের চেয়ে স্কিউনেস আরও ক্ষতিকারক, বিশেষত যদি দলগুলির মধ্যে স্কুগুলি বিকল্প দিকনির্দেশনা দেয়।

যদি সত্যিই উদ্বিগ্ন হওয়ার মতো সমস্যা হয় তবে রূপান্তরটি একটি ভাল কৌশল। আপনার কাঁচা ডেটা লগ নেওয়া একটি বিকল্প, তবে একমাত্র নয়। নোট করুন যে কেন্দ্রীকরণ এবং মানককরণ এই অর্থে সত্যই রূপান্তর নয়। আপনি পাওয়ার ট্রান্সফর্মেশনগুলির বক্স এবং কক্স পরিবারের দিকে নজর রাখতে চান । এবং মনে রাখবেন, ফলাফলটি পুরোপুরি স্বাভাবিক হতে হবে না, কেবল যথেষ্ট ভাল।

এরপরে, আমি বৈচিত্রের এককতার জন্য চি-স্কোয়ার পরীক্ষার আপনার ব্যবহার অনুসরণ করি না, যদিও এটি পুরোপুরি ঠিক আছে। আমি আপনি ব্যবহার সুপারিশ করবে Levene টেস্ট (ব্যবহারের leveneTest()মধ্যে car)। ভিন্নজাতীয়ত্ব অস্বাভাবিকতার চেয়ে বেশি ক্ষতিকারক, তবে ভিন্ন ভিন্নতা যদি না হয় তবে এএনওভা বেশ শক্তিশালী। থাম্বের একটি মান নিয়ম হ'ল সবচেয়ে বড় গ্রুপ বৈকল্পিক শক্তিশালী সমস্যা না দেখিয়ে সবচেয়ে ছোট থেকে চারগুণ পর্যন্ত হতে পারে। একটি ভাল রূপান্তর বৈচিত্র্যকেও সম্বোধন করা উচিত।

যদি এই কৌশলগুলি অপর্যাপ্ত হয় তবে আমি প্যারামিমেট্রিকবিহীন পদ্ধতির চেষ্টা করার আগে সম্ভবত শক্তিশালী রিগ্রেশন অন্বেষণ করব ।

আপনি যদি নিজের প্রশ্নটি সম্পাদনা করতে পারেন এবং আপনার ডেটা সম্পর্কে আরও বলতে পারেন, তবে আরও নির্দিষ্ট তথ্য সরবরাহ করতে আমি এটি আপডেট করতে সক্ষম হতে পারি।


আমার ২ য় পয়েন্ট, আমি সম্প্রতি এখানে একটি উত্তর লিখেছি যা এই সমস্যাটিকে আরও পরিষ্কার করতে সহায়তা করতে পারে। আপনি এটি পড়তে চাইতে পারেন।
গুং - মনিকা পুনরায়

8

( দ্রষ্টব্য: প্রশ্নটি স্থানান্তরিত হওয়ার আগে এবং এসও থেকে একীভূত হওয়ার আগে এই উত্তর পোস্ট করা হয়েছিল, সুতরাং এখানে যে প্রশ্ন করা হয় না এমন প্রশ্নের সাথে বিশদ যুক্ত করা হয়েছে Many

অনেকগুলি ভিন্ন ভিন্ন পদ্ধতি রয়েছে এবং এই প্রশ্নটি এই সাইটের অন্যত্র coveredাকা পড়েছে। সাইটের অন্যান্য প্রশ্নের লিঙ্ক এবং কিছু রেফারেন্স সহ এখানে কয়েকটি পদ্ধতির তালিকা রয়েছে:

  1. বাক্স-কক্স পাওয়ার রূপান্তরটি অ-লিনিয়ার স্কেলে থাকা অবশিষ্টাংশগুলিকে স্বাভাবিক করতে পারে
  2. রেঙ্কড ডেটাতে আনোভা খুব সহজ তবে শক্তি হ্রাস পেয়েছে এবং ব্যাখ্যা করা শক্ত। দেখুন Conover এবং ইমান, (1981)
  3. আনুপাতিক ওডস অর্ডিনাল লজিস্টিক মডেল
  4. পারমুয়েশন টেস্টস ( অ্যান্ডারসন এবং টের ব্র্যাক 2003 ), এন্ডারসন দ্বারা বর্ণিত এবং বর্ণিত এবং আর ভেগান প্যাকেজেরadonis কার্য হিসাবে
  5. বুটস্ট্র্যাপিং
  6. হায়ারার্কিকাল বায়েশিয়ান মডেলিং ( গেলম্যান 2005 )

+1, এটি এক্সপ্লোর করার জন্য কয়েকটি উপলভ্য বিকল্পগুলির একটি দুর্দান্ত তালিকা।
গুং - মনিকা পুনরায়

নীচে মন্তব্যগুলি মূলত স্ট্যাক ওভারফ্লোতে বিনিময় করা হয়েছে, মাইগ্রেশনের সময় কোনওভাবে হারিয়ে গেছে। Meta.stats.stackexchange.com/q/1157/930 দেখুন ।
chl

আপনি কি জানেন যে অ্যান্ডারসন এবং ব্রাকের ধারণাগুলির কোনও বাস্তবায়ন আছে কিনা? - হেনরিক 16 ই মে 15: 15
chl

@Henrik সেখানে ফোরট্রান অ্যান্ডারসন 2005 সালে একটি বাস্তবায়ন যা আর ফাংশন মাধ্যমে পাওয়া যায় adonisVeganআর প্যাকেজ / ডেভিড মে 16 বছর বয়সে 16:20
chl

ধন্যবাদ। adonisএমনকি অচিরাচরিত ডিভিএস দিয়ে কাজ করে বলে মনে হচ্ছে যাইহোক, আমার অনুভূতি আছে যে এটি 1 ধরণের স্কোয়ারের মতো কিছু ব্যবহার করে কারণ আমি Terms added sequentially (first to last)যখনই বার্তাটি চালাচ্ছি। আপনি এটি ব্যবহার করেছেন বা এটি সম্পর্কে কিছু বলতে পারেন? - হেনরিক 16 ই মে 17:03
chl
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.