উইলকক্সন পরীক্ষা করার আগে কি চিটকিচু করা ভুল?


9

আমি একটি স্ক্রিপ্ট লিখে ডেটা পরীক্ষা wilcox.testকরেছিলাম, তবে যখন আমি ফলাফল পেয়েছি, সমস্ত পি-মান যেখানে 1 এর সমান some আমি এটি করেছি এবং এখন আমার একটি গ্রহণযোগ্য ফলাফল রয়েছে। এটি করা কি ভুল?

test<- function(column,datacol){
    library(ggplot2)
t=read.table("data.txt", stringsAsFactors=FALSE)
uni=unique(c(t$V9))
    for (xp in uni) { 
          for(yp in uni) {
            testx <- subset(t, V9==xp)
            testy <- subset(t, V9==yp)
            zz <- wilcox.test(testx[[datacol]],jitter(testy[[datacol]]))
            p.value <- zz$p.value
          }
        }
}


এটি আউটপুট dput(head(t))

structure(list(V1 = c(0.268912,
0.314681, 0.347078, 0.286945, 
0.39562, 0.282182), V2 = c(0.158921, 0.210526, 0.262024, 0.322006, 
0.133417, 0.283025), V3 = c(0.214082, 0.166895, 0.132547, 0.147361, 
0.09174, 0.169093), V4 = c(0.358085, 0.307898, 0.258352, 0.243688, 
0.379224, 0.2657), V5= c(-0.142223, 0.010895, 0.14655, 
0.08152, 0.02116, 0.030083), V6 = c(0.096408, -0.091896,

-0.331229, -0.446603, -0.088493, -0.262037), V7` = c(1.680946, 
1.649559, 1.534401, 1.130529, 3.441356, 1.211815), V8 = c("NC_000834",  "NC_000844",
"NC_000845", "NC_000846", "NC_000857",
"NC_000860" ), V9 = c("Chordata",
"Arthropoda", "Chordata", "Chordata", 
"Arthropoda", "Chordata"), V10 =
c("???:???", "Diplostraca", 
"???:???", "Rheiformes", "Diptera",
"Salmoniformes"), V11 = c("???:???",
"Branchiopoda", "Mammalia", "Aves",
"Insecta", "Actinopterygii" )), .Names
= c("V1", "V2", "V3", "V4", "V5", "V6",  "V7",
"V8", "V9", "V10",
"V11"), row.names = c(NA,  6L),
class = "data.frame")

ডেটাটি খুব বড়, এবং এটিই আমি শুরু করা থ্রেড এবং তারা আমাকে বলেছিল এটি করা ভুল হতে পারে

দ্রষ্টব্য এই প্রশ্নটি টেক্সট.এসই থেকে আসে: ল্যাটেক্স টেবিলের ভিতরে পিডিএফ কনটেন আর আউটপুট উত্পন্ন করছে


2
আপনার ডেটা কী তা আপনি আমাদের বলবেন না তবে আমি এমন কোনও প্রক্রিয়া সম্পর্কে অত্যন্ত সন্দেহজনক হব যা ডেটাতে এলোমেলো গোলমাল যোগ করে এবং তারপরে এটি একটি পরিসংখ্যান পরীক্ষা করে। তদতিরিক্ত, আপনি কি নিশ্চিত যে আপনার কোড যা মনে করে তা এটি করে? আমার পড়াশোনাটি হ'ল আপনার লুপ সত্ত্বেও, এটি একক p.value ফিরিয়ে দেবে - x = y = {lastvaluof} (uni)
এন্ড্রি

@ অ্যান্ড্রি: আপনার সহায়তার জন্য ধন্যবাদ, তবে এটি সম্পূর্ণ কোড নয়, এটি ফাংশনের একটি অংশ যা উইলকক্স পরীক্ষার গণনা করে এবং কোডটি প্রতিটি (এক্সপি, ওয়াইপি) এর জন্য পি-মানের বিভিন্ন মান তৈরি করে, এটি কোনওটির একটি লিঙ্ক আমার ডেটার অংশ, আপনি এটি দেখতে এবং পরীক্ষা করতে পারেন যে আমি এটি করতে পারি কিনা, আগাম ধন্যবাদ। mediafire.com/?mnj26kp4bv5lcr5

1
আমি ডেটাতে লিঙ্কগুলি সম্পর্কে খুব সন্দেহজনক হব যা অন্যান্য লিঙ্কগুলিতে পুনঃনির্দেশের প্রয়োজন হয়, বিশেষত যখন আর খুব কার্যকর dput()ফাংশন সরবরাহ করে যা এটি করার কোনও প্রয়োজনকে সরিয়ে দেয়। সহায়তা পেতে দয়া করে একটি পুনরুত্পাদনযোগ্য উদাহরণ সরবরাহ করুন।
চেজ


@ ওয়েলব্লোভার যখন আমি এখানে আপনার পরিসংখ্যান প্রশ্ন জিজ্ঞাসা করার জন্য (টেক্সট.এসই তে) পরামর্শ দিচ্ছিলাম তখন আমি অবগত ছিলাম না যে আপনি ইতিমধ্যে এসও-তে জিজ্ঞাসা করেছেন। দয়া করে আপনার দুটি পোস্টের একটি মুছুন (সম্ভবত এটি এসও তে, যেহেতু এটি একটি পরিসংখ্যানের প্রশ্ন)।
chl

উত্তর:


6

এই সম্পর্কে আর-সহায়তা তালিকায় একটি থ্রেড রয়েছে; উদাহরণস্বরূপ দেখুন: http://tolstoy.newcastle.edu.au/R/e8/help/09/12/9200.html

সেখানে প্রথম পরামর্শটি হ'ল পরীক্ষাকে বিভিন্ন বিদ্রূপের সাথে সংখ্যক বার পুনরাবৃত্তি করা এবং তারপরে গড় বা সর্বোচ্চ গ্রহণ করে সামগ্রিক পি-মান পেতে পি-মানগুলি একত্রিত করা। তারা আরও পরামর্শ দেয় যে পরিবর্তে একটি সরল পেরুমিউশন পরীক্ষা ব্যবহার করা যেতে পারে (দুজনের মধ্যে, এটিই আমি পছন্দ করি)। প্রশ্নটি দেখুন টি-টেস্টের (জোড়যুক্ত এবং অ জোড়-জোড়) পরিবর্তে আর-তে কোন ক্রিয়াকলাপ পরীক্ষার বাস্তবায়ন? অনুমান পরীক্ষার কয়েকটি উদাহরণের জন্য।

এই থ্রেডের অন্য কোথাও গ্রেগ স্নো লিখেছেন: সতর্কতা এড়ানোর জন্য ডেটাতে এলোমেলো গোলমাল যোগ করা হ'ল অ্যালার্মটি কীভাবে বন্ধ হচ্ছে, তা তদন্ত করার পরিবর্তে ধোঁয়া ডিটেক্টর থেকে ব্যাটারিগুলি সরিয়ে দেওয়ার মতো। ( Http://tolstoy.newcastle.edu.au/R/e8/help/09/12/9195.html দেখুন )


আপনার জবাবের জন্য ধন্যবাদ, কিন্তু আমি বিষয়টি পেলাম না, এখন আমার কী করা উচিত? পরীক্ষা পরিবর্তন করুন, বা কোনও কিছুর উপর ভিত্তি করে ডেটা সামঞ্জস্য করুন, এবং এটি কি ???
ওয়েবলভার

আমি সংযুক্ত পৃষ্ঠাটি সংক্ষিপ্ত করব।
অ্যারন

3

(অস্বীকৃতি: আমি কোডটি যাচাই করিনি, আমার উত্তরটি কেবলমাত্র আপনার বর্ণনার ভিত্তিতে)

আমার অনুভূতি আছে যে আপনি যা করতে চান তা সত্যিই খারাপ ধারণা । উইলকক্সন হ'ল পদক্ষেপগুলির জন্য একটি পুনরায় মডেলিং (বা র্যান্ডমাইজেশন) পরীক্ষা। এটি, এটি মানগুলির পদমর্যাদার অবস্থান নেয় এবং এই র‌্যাঙ্কগুলিকে র‌্যাঙ্কের সমস্ত সম্ভাব্য অনুমানের সাথে তুলনা করে (উদাহরণস্বরূপ, এখানে )।

সুতরাং, যেমন আপনি বুঝতে পেরেছেন, বন্ধনগুলি বেশ খারাপ কারণ আপনি এগুলি থেকে বেরিয়ে আসেন না। যাইহোক, আপনার ডেটাতে এলোমেলো শব্দ (জিটার) যুক্ত করা সমস্ত পদকে রূপান্তরিত করবে, যাতে তাদের এলোমেলো র‌্যাঙ্ক থাকে! অর্থাৎ এটি আপনার ডেটা মারাত্মকভাবে বিকৃত করে orts

অতএব: এটি করা ভুল


আপনার উত্তর দেবেন, তবে এই ক্ষেত্রে আমার কী করা উচিত ??
ওয়েবলভার

2

আপনি বেশিরভাগ লোককে জিজ্ঞাসা করেছেন এখন আপনার কী করা উচিত। আমার দৃষ্টিতে, আপনার এখন যা করা উচিত তা গ্রহণযোগ্যতা হ'ল এখানে উপযুক্ত পি-মানটি 1.000। আপনার গ্রুপগুলি পৃথক হয় না।


হ্যালো, এটি গ্রহণ করা কি যুক্তিযুক্ত ?? কারণ সমস্ত গ্রুপ এবং উপগোষ্ঠীগুলি যখন এক সাথে তুলনা করা হয়, একই পি-মান দেয়, এটি যৌক্তিক নয় কারণ প্রতিটি ক্ষেত্রে আমি 1 টি ভেরিয়েবল পরীক্ষা করছি যেমন: পরীক্ষা ("পিএইচ", ভি 1), soo পি-মানটি একই হওয়া উচিত নয় সব। কোন ধারনা ??
ওয়েবলভার

অবশ্যই, এটি যৌক্তিক হতে পারে। 1 এর পি-মান মানে দুটি গ্রুপ যতটা সম্ভব তার কাছাকাছি। যদি আপনি প্রায় সমস্ত বন্ধন পেয়ে থাকেন তবে এটি সত্য হতে পারে।
অ্যারন

অ্যারন @ ওয়েবে এই ডেটাগুলি (ভি 7 এর মাধ্যমে ভি 1) বাঁধা নেই। উইলকক্সন স্বাক্ষরিত-র‌্যাঙ্ক পরীক্ষার সাথে তুলনা করার সময় আমি পি-মানগুলি পাওয়ার কোথাও কোথাও একটি ত্রুটি তৈরি করা উচিত 0.0
whuber

ওপিতে ডেটাগুলির প্রথম কয়েকটি সারি পোস্ট করেছে; স্পষ্টতই আরও সম্পর্ক থাকতে হবে, যদিও এটি ছয় দশমিক জায়গায় ডেটা যাওয়ার কারণে অসম্ভব বলে মনে হচ্ছে। সুতরাং হ্যাঁ, মনে হচ্ছে বিশ্লেষণে কোনও ত্রুটি থাকতে পারে, যদিও আপনি যেটি নির্দেশ করেছেন ঠিক তা নয়।
হারুন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.