প্রভাব আকারগুলি কি পি-মানের তুলনায় উচ্চতর?


14

প্রয়োগকৃত গবেষণায় পি-মানগুলির পরিবর্তে প্রভাব মাপের উপর নির্ভর করা এবং প্রতিবেদনের উপর প্রচুর জোর দেওয়া হয় (উদাহরণস্বরূপ আরও নীচে উদ্ধৃতি)।

তবে কি এমনটি হয় না যে কোনও পি-ভ্যালুর মতো কোনও এফেক্ট মাপটি একটি এলোমেলো পরিবর্তনশীল এবং একই পরীক্ষার পুনরাবৃত্তি করা হলে নমুনা থেকে নমুনায় পরিবর্তিত হতে পারে? অন্য কথায়, আমি জিজ্ঞেস করছি কি পরিসংখ্যানগত বৈশিষ্ট্য করতে (যেমন, প্রভাব আকার কম পরিবর্তনশীল নমুনা থেকে নমুনা চেয়ে P-মান) প্রভাব মাপ P-মান বেশী ভালো তথ্যপ্রমাণ পরিমাপ সূচকের?

আমার অবশ্য একটি গুরুত্বপূর্ণ তথ্য উল্লেখ করা উচিত যা একটি পি-মানকে প্রভাবের আকার থেকে পৃথক করে। এটি হ'ল একটি এফেক্ট সাইজ এমন কিছু অনুমান করা যায় কারণ এর জনসংখ্যার প্যারামিটার রয়েছে তবে একটি পি-মান অনুমান করার মতো কিছু নয় কারণ এর কোনও জনসংখ্যার প্যারামিটার নেই।

আমার কাছে, এফেক্ট সাইজটি কেবলমাত্র একটি মেট্রিক যা গবেষণার নির্দিষ্ট কিছু ক্ষেত্রে (যেমন, মানব গবেষণা) বিভিন্ন গবেষক-বিকাশিত পরিমাপ সরঞ্জাম থেকে প্রাপ্ত সাধারণ অভিজ্ঞতাগুলিকে একটি সাধারণ মেট্রিকে রূপান্তরিত করতে সহায়তা করে (এই মেট্রিকের মানব গবেষণাটি ব্যবহার করে বলার চেয়ে ভাল) কোয়ান্ট রিসার্চ ক্লাব)।

হতে পারে যদি আমরা একটি কার্যকর আকার হিসাবে একটি সাধারণ অনুপাত গ্রহণ করি, নিম্নলিখিত (আরে) কি পি-মানগুলির তুলনায় প্রভাব আকারের আধিপত্য দেখায়? (পি-মান পরিবর্তন হয় তবে এফেক্ট আকারটি দেয় না)

binom.test(55, 100, .5)  ## p-value = 0.3682  ## proportion of success 55% 

binom.test(550, 1000, .5) ## p-value = 0.001731 ## proportion of success 55%

নোট করুন যে বেশিরভাগ এফেক্ট মাপগুলি পরীক্ষার পরিসংখ্যানের সাথে লিনিয়ার সাথে সম্পর্কিত। সুতরাং, প্রভাব আকারগুলি ব্যবহার করে নাল-কল্পনা পরীক্ষা করা সহজ পদক্ষেপ is

উদাহরণস্বরূপ, প্রাক-পোস্ট ডিজাইনের ফলে প্রাপ্ত টি স্ট্যাটিস্টিকগুলি সহজেই কোনও সম্পর্কিত কোহেনের ডি এফেক্ট আকারে রূপান্তর করা যায়। এর মতো, কোহেনের ডি বিতরণ করা সহজভাবে বিতরণের স্কেল-লোকেশন সংস্করণ।

উদ্ধৃতি:

যেহেতু পি-মানগুলি বিভ্রান্ত সূচকগুলি হয়, তত্ত্ব অনুসারে বিভিন্ন নমুনার আকার এবং 100 টি বিভিন্ন প্রভাবের আকারের 100 টি অধ্যয়নগুলির প্রতিটি একই একক পি-মান থাকতে পারে এবং একই একক প্রভাব আকারের 100 টি স্টাডিতে প্রতিটি পি-মানের জন্য 100 টি আলাদা মান থাকতে পারে ।

অথবা

পি-মান হ'ল একটি এলোমেলো পরিবর্তনশীল যা নমুনা থেকে নমুনায় পরিবর্তিত হয়। । । । ফলস্বরূপ, দুটি স্বতন্ত্র পরীক্ষা-নিরীক্ষার থেকে বা একই পরীক্ষায় পরিমাপ করা দুটি ভেরিয়েবলের পরীক্ষাগুলি থেকে পি-মানগুলি তুলনা করা উপযুক্ত নয় এবং ঘোষণা করা হয় যে একটি অন্যটির তুলনায় আরও গুরুত্বপূর্ণ?

উদ্ধৃতিসমূহ:

থম্পসন, বি। (2006) আচরণগত পরিসংখ্যানের ভিত্তি: একটি অন্তর্দৃষ্টি ভিত্তিক পদ্ধতির। নিউ ইয়র্ক, এনওয়াই: গিলফোর্ড প্রেস।

ভাল, পিআই, এবং হার্ডিন, জেডাব্লু (2003)। পরিসংখ্যানগুলিতে সাধারণ ত্রুটি (এবং কীভাবে সেগুলি এড়ানো যায়)। নিউ ইয়র্ক: উইলে


12
আমি উদ্ধৃতিগুলি থেকে একই সিদ্ধান্তে টানছি না (এফেক্ট মাপগুলি "উচ্চতর" বা পি-মানগুলির পরিবর্তে প্রতিবেদন করা উচিত)। আমি সচেতন কিছু লোক এ জাতীয় বিবৃতি দিয়ে (যেমন পি-ভ্যালুগুলিতে বিএএসপি নিষেধাজ্ঞার) দ্বারা অত্যধিক আচরণ করেছেন। এটি এক-বা-অন্য পরিস্থিতি নয়: এটি পি-ভ্যালু এবং এফেক্ট আকারগুলি বিভিন্ন ধরণের দরকারী তথ্য দেয় poin সাধারণত অন্যের প্রসঙ্গে বিবেচনা না করে একজনকে পরীক্ষা করা উচিত নয়।
হোবার

1
আমি ব্যক্তিগতভাবে মনে করি একটি আত্মবিশ্বাসের ব্যবধানের সাথে একটি অনুমানের প্রতিবেদন করা যথেষ্ট। এটি একই সাথে প্রভাবের আকার (ব্যবহারিক তাত্পর্য) এবং হাইপোথিসিস টেস্টিং (পরিসংখ্যানিক তাত্পর্য) দেয়।
জিরাপত সমরণবেদ্যা

1
পি মান বা প্রভাবের আকারগুলি 'উচ্চতর' আপনার দৃষ্টিভঙ্গির উপর নির্ভর করে। প্রাক্তনটি ফিশেরিয়ান এনএইচএসটি traditionতিহ্য অনুসারে অনুসরণ করেন, আর পরেরটি নেইমন-পিয়ারসন fromতিহ্য থেকে আসে। কিছু ক্ষেত্রে (জৈবিক বিজ্ঞান, মানবিক), প্রভাব আকারগুলি খুব সামান্য থাকে, পি মানগুলি আকর্ষণীয় করে তোলে। বিপরীতে, অন্যরা যেমন খেয়াল করে, পি-ভ্যালুগুলি ডিজাইনের পরিবর্তনের মাধ্যমে 'জোর করে' ছোট করা যেতে পারে, যেমন এন
হাইটজ

3
একটি স্ক্রু ড্রাইভার একটি হাতুড়ি চেয়ে উচ্চতর?
কেজেটিল বি হালওয়ারসেন

বাদাম কি বল্টের চেয়ে উচ্চতর?
সেক্সটাস এম্পেরিকাস

উত্তর:


21

পি-মানগুলির চেয়ে এফেক্ট মাপ সরবরাহ করার পরামর্শটি একটি ভ্রান্ত দ্বৈতত্ত্বের উপর ভিত্তি করে এবং নির্বোধ। দুজনকেই কেন উপস্থাপন করবেন না?

বৈজ্ঞানিক উপসংহার উপলব্ধ প্রমাণ এবং তত্ত্বের যৌক্তিক মূল্যায়নের ভিত্তিতে হওয়া উচিত। পি-মান এবং পর্যবেক্ষণ প্রভাব আকারগুলি একা বা একসাথে যথেষ্ট নয়।

আপনার সরবরাহিত উদ্ধৃত অনুচ্ছেদগুলির কোনওটিই সহায়ক নয়। অবশ্যই পি-মানগুলি পরীক্ষা-নিরীক্ষায় পরিবর্তিত হয়, ডেটাতে প্রমাণের শক্তি পরীক্ষা-নিরীক্ষার থেকে পরিবর্তিত হয়। পি-মানটি পরিসংখ্যানের মডেলটির মাধ্যমে সেই প্রমাণের কেবল একটি সংখ্যাসূচক নিষ্কাশন। পি-মানটির প্রকৃতি দেওয়া, একটি পি-মানকে অন্যের সাথে তুলনা করা বিশ্লেষণাত্মক উদ্দেশ্যে খুব কমই প্রাসঙ্গিক, তাই সম্ভবত উদ্ধৃতি লেখক এই কথাই প্রকাশ করার চেষ্টা করছেন।

যদি আপনি নিজেকে পি-মানগুলির তুলনা করতে চান বলে মনে করেন তবে আপনার আগ্রহের প্রশ্নের সংবেদনশীলতার উত্তর দেওয়ার জন্য আপনার সম্ভবত ডেটার বিভিন্ন ব্যবস্থাতে একটি তাত্পর্য পরীক্ষা করা উচিত ছিল। এই প্রশ্নগুলি দেখুন: পি-মানগুলির জন্য পি-মানগুলি? এবং যদি একটি গ্রুপের গড়টি শূন্যের থেকে পৃথক হয় তবে অন্যটি না হয়, তবে আমরা কি সিদ্ধান্ত নিতে পারি যে গ্রুপগুলি আলাদা?

সুতরাং, আপনার প্রশ্নের উত্তর জটিল। আমি পি-ভ্যালু বা এফেক্ট মাপের উপর ভিত্তি করে ডেটাতে দ্বিধাত্বিক প্রতিক্রিয়া খুঁজে পাচ্ছি না, ফলস্বরূপ আকারগুলি কি পি-মানের তুলনায় উচ্চতর? হ্যাঁ, না, কখনও কখনও, হতে পারে, এবং এটি আপনার উদ্দেশ্য উপর নির্ভর করে।


আমি মনে করি যে প্রভাবের আকার এবং এটির আত্মবিশ্বাসের ব্যবধানটি উপস্থাপন করা ভাল provided তবে বিশ্লেষক সঠিকভাবে বলতে সক্ষম হবেন যে হাতে থাকা গবেষণার জন্য অর্থবহ প্রভাবের আকারটি কী। আত্মবিশ্বাসের ব্যবধান, পি-মানের বিপরীতে পাঠককে অনুমানের নির্ভুলতার পাশাপাশি এর চূড়া উভয়ই উপলব্ধি করে।
আদম

1
@ অ্যাডামো হ্যাঁ, আমি বেশিরভাগ ক্ষেত্রে একমত, কিন্তু পি-মানটির দুটি জিনিস দেওয়া আছে এবং এটি বাদ দেওয়া উচিত নয়। এটি শূন্যের বিরুদ্ধে প্রমাণের শক্তির একটি সূচক, এমন কিছু যা খুব অভিজ্ঞ চোখের দ্বারা আস্থা অন্তর থেকে পাওয়া যায় এবং সঠিক পি-মানটি ভিতরে / বাহ্যিক দ্বিধাবিভঙ্গিকে সরাসরি আখ্যায়িত করে না যা আত্মবিশ্বাসের ব্যবধানটি করে । অবশ্যই, একটি সম্ভাবনা ফাংশন উভয়ের চেয়ে সুবিধা দেয়।
মাইকেল লিউ

14

প্রয়োগিত গবেষণার প্রসঙ্গে, ফলাফলগুলির ব্যবহারিক তাত্পর্য (পরিসংখ্যানগত তাত্ত্বিকতার বিপরীতে) ব্যাখ্যার জন্য প্রভাব আকারগুলি প্রয়োজনীয়। সাধারণভাবে, পি-মানগুলি প্রভাব মাপের চেয়ে নমুনা আকারের চেয়ে অনেক বেশি সংবেদনশীল। যদি কোনও পরীক্ষার দ্বারা প্রভাবের আকারটি নির্ভুলভাবে পরিমাপ করা হয় (যেমন এটি অনুমান করা জনসংখ্যার প্যারামিটারের নিকটবর্তী) তবে তারপরে একটি অ-উল্লেখযোগ্য পি-মান পাওয়া যায়, সমস্ত জিনিস সমান হয়, নমুনার আকার বাড়ানো একই প্রভাবের আকারে ফলত তবে একটি কম পি মান। পাওয়ার বিশ্লেষণ বা সিমুলেশন দিয়ে এটি প্রদর্শিত হতে পারে।

এর আলোকে, কার্যকর আকারের যেগুলির ব্যবহারিক তাত্পর্য নেই তার জন্য অত্যন্ত গুরুত্বপূর্ণ পি-মান অর্জন করা সম্ভব। বিপরীতে, কম শক্তি সহ অধ্যয়ন ডিজাইনগুলি দুর্দান্ত ব্যবহারিক গুরুত্বের আকারের জন্য অ-উল্লেখযোগ্য পি-মান উত্পাদন করতে পারে।

নির্দিষ্ট রিয়েল-ওয়ার্ল্ড অ্যাপ্লিকেশন ব্যতীত পরিসংখ্যানগত তাত্পর্য সম্পর্কিত ধারণা সম্পর্কিত আলোচনা করা কঠিন effect উদাহরণস্বরূপ, এমন একটি পরীক্ষা বিবেচনা করুন যা শিক্ষার্থীদের গ্রেড পয়েন্ট গড়ের (জিপিএ) উপর নতুন অধ্যয়ন পদ্ধতির প্রভাবের মূল্যায়ন করে। আমি যুক্তি দিয়ে বলব যে 0.01 গ্রেড পয়েন্টের একটি প্রভাব আকারের ব্যবহারিক তাত্পর্য খুব সামান্য (যেমন 2.5.5 এর তুলনায় 2.50) রয়েছে। উভয় চিকিত্সা এবং নিয়ন্ত্রণ গ্রুপে ২,০০০ শিক্ষার্থীর একটি নমুনা আকার এবং 0.5 জন গ্রেড পয়েন্টের জনসংখ্যার মান বিচ্যুতি:

set.seed(12345)
control.data <- rnorm(n=2000, mean = 2.5, sd = 0.5)
set.seed(12345)
treatment.data <- rnorm(n=2000, mean = 2.51, sd = 0.5)
t.test(x = control.data, y = treatment.data, alternative = "two.sided", var.equal = TRUE) 

চিকিত্সা নমুনা গড় = 2.51

নিয়ন্ত্রণ নমুনা গড় = 2.50

প্রভাব আকার = 2.51 - 2.50 = 0.01

পি = 0.53

20,000 শিক্ষার্থীর কাছে নমুনার আকার বাড়িয়ে দেওয়া এবং অন্য সব কিছু স্থির রাখার ফলে একটি উল্লেখযোগ্য পি-মান পাওয়া যায়:

set.seed(12345)
control.data <- rnorm(n=20000, mean = 2.5, sd = 0.5)
set.seed(12345)
treatment.data <- rnorm(n=20000, mean = 2.51, sd = 0.5)
t.test(x = control.data, y = treatment.data, alternative = "two.sided", var.equal = TRUE)  

চিকিত্সা নমুনা গড় = 2.51

নিয়ন্ত্রণ নমুনা গড় = 2.50

প্রভাব আকার = 2.51 - 2.50 = 0.01

পি = 0.044

স্পষ্টতই আকারের ক্রম দ্বারা নমুনার আকার বাড়ানো কোনও তুচ্ছ জিনিস নয়! যাইহোক, আমি মনে করি আমরা সকলেই একমত হতে পারি যে এই অধ্যয়ন পদ্ধতির দ্বারা প্রদত্ত ব্যবহারিক উন্নতি নগণ্য। আমরা যদি কেবলমাত্র পি-মানের উপর নির্ভর করি তবে আমরা n = 20,000 ক্ষেত্রে অন্যথায় বিশ্বাস করতে পারি।

ব্যক্তিগতভাবে আমি পি-ভ্যালু এবং এফেক্ট মাপ উভয়ই প্রতিবেদন করার পক্ষে কথা বলছি। এবং টি- বা এফ-পরিসংখ্যানগুলির জন্য বোনাস পয়েন্টস, স্বাধীনতার ডিগ্রি এবং মডেল ডায়াগনস্টিকস!


2
ড্যারেন, দয়া করে আপনার আর বা ঠিক PO এর মতো কিছু বোঝাতে চাইছেন show
ব্যবহারকারী 138773

7
@ ড্যারেন্ট জেমস পি = 0.065 এবং পি = 0.043 এর মধ্যে পার্থক্যের কোনও বাস্তব গুরুত্ব নেই যে পি = 0.05 একটি উজ্জ্বল রেখা যা সম্মান করা উচিত। কোনওটিই পি-মান নিজে থেকে কোনও কিছুর পক্ষে বা বিপক্ষে জোরালো প্রমাণের প্রতিনিধিত্ব করে না।
মাইকেল লিউ

@ মিশেল লেও হ্যাঁ, আমি রাজি!
ড্যারেন জেমস

1
জেমস, আপনার কোড এবং ব্যাখ্যা প্রদত্ত, আপনি মনে করছেন যে ওপির বক্তব্যটি পুরোপুরি ভুল বুঝেছেন। আপনার আর কোডও ভুল! কারণ আপনার সমান সমান হওয়ার var.equal = TRUEসময় আপনি সেট করে নেই sd। এই জাতীয় ব্যাকগ্রাউন্ড সহ, আপনি কেন এমন প্রতিক্রিয়া পোস্ট করেছেন তা আমি নিশ্চিত নই। ওপি এমন একটি প্রশ্ন জিজ্ঞাসা করছে যা কমপক্ষে বর্তমান সময়ে সহজ উত্তর নেই!
ব্যবহারকারী 138773

1
আমি কোডটিতে var.equal = TRUE যুক্ত করেছি। তবে এই ক্ষেত্রে এটি অপ্রয়োজনীয়। একই পি-মানগুলি উভয়ই var.equal = TRUE এবং ডিফল্ট var.equal = FALSE সহ প্রাপ্ত হয়।
ড্যারেন জেমস

5

আমি বর্তমানে ডেটা সায়েন্সের ক্ষেত্রে কাজ করি এবং এর আগে আমি শিক্ষা গবেষণায় কাজ করেছি। প্রতিটি "ক্যারিয়ারে" আমি এমন লোকদের সাথে সহযোগিতা করেছি যারা পরিসংখ্যানগুলিতে একটি আনুষ্ঠানিক পটভূমি থেকে আসে নি এবং যেখানে পরিসংখ্যানগত (এবং ব্যবহারিক) তাত্পর্যকে জোর দিয়ে পি-ভ্যালুতে রাখা হয় । আমি আমার বিশ্লেষণগুলিতে প্রভাব আকারগুলিকে অন্তর্ভুক্ত এবং জোর দেওয়া শিখেছি কারণ পরিসংখ্যানগত তাত্পর্য এবং ব্যবহারিক তাত্পর্যগুলির মধ্যে পার্থক্য রয়েছে।

সাধারণত, আমি যাদের সাথে কাজ করেছি তাদের একটি জিনিস সম্পর্কে যত্নশীল "কী আমাদের প্রোগ্রাম / বৈশিষ্ট্যটি প্রভাবিত করে, হ্যাঁ বা না?" এই জাতীয় প্রশ্নের মতো, আপনি টি-টেস্টের মতো সাধারণ কিছু করতে পারেন এবং তাদের কাছে "হ্যাঁ, আপনার প্রোগ্রাম / বৈশিষ্ট্যটি একটি পার্থক্য তৈরি করে" প্রতিবেদন করতে পারেন। তবে এই "পার্থক্য" কত বড় বা ছোট?

প্রথমত, আমি এই বিষয়ে আগ্রহ প্রকাশের আগে, আমি প্রভাব আকারগুলির কথা বলার সময় আমরা কী উল্লেখ করি তা সংক্ষেপে বলতে চাই

প্রভাবের আকারটি কেবল দুটি গ্রুপের মধ্যে পার্থক্যের আকারের পরিমাণ নির্ধারণের একটি উপায়। [...] কিছু তুলনার সাথে তুলনামূলকভাবে একটি নির্দিষ্ট হস্তক্ষেপের কার্যকারিতা পরিমাপের জন্য এটি বিশেষভাবে মূল্যবান। এটি আমাদের সরলতার বাইরে চলে যাওয়ার অনুমতি দেয়, 'এটি কাজ করে বা না?' আরও পরিশীলিতের কাছে, 'এটি কতটা প্রাসঙ্গিক ক্ষেত্রে কাজ করে?' তদুপরি, একটি হস্তক্ষেপের সবচেয়ে গুরুত্বপূর্ণ দিক - প্রভাবের আকার - এর পরিসংখ্যানগত তাত্পর্য (যা প্রভাবের আকার এবং নমুনার আকারকে সংযুক্ত করে) এর চেয়ে জোর দিয়ে, এটি জ্ঞানের জমে আরও বৈজ্ঞানিক পদ্ধতির প্রচার করে। এই কারণগুলির জন্য, কার্যকারিতা রিপোর্টিং এবং ব্যাখ্যা করার কার্যকর প্রভাব একটি গুরুত্বপূর্ণ সরঞ্জাম।

এটি এফেক্ট সাইজ, বোকা: এফেক্ট সাইজ কী এবং এটি কেন গুরুত্বপূর্ণ

এর পরে, পি-মান কী এবং এটি আমাদের কোন তথ্য সরবরাহ করে? ঠিক আছে, পি-ভ্যালু , যতটা সম্ভব কম কথায়, একটি সম্ভাবনা যা নাল বন্টন থেকে পর্যবেক্ষণ করা পার্থক্য খাঁটি সুযোগ দ্বারা। সুতরাং যখন এই পি-মানটি একটি প্রান্তিক ( চেয়ে ছোট হয় তখন আমরা নাল অনুমানকে বাতিল (বা স্বীকার করতে ব্যর্থ হই) rejectα

পি মান যথেষ্ট হয় না কেন?

পরিসংখ্যানগত তাত্পর্য হ'ল সম্ভাবনা যা দুটি গ্রুপের মধ্যে লক্ষ্য করা পার্থক্য সুযোগের কারণে। যদি পি মানটি বেছে নেওয়া আলফা স্তরের চেয়ে বড় হয় (যেমন, .05), কোনও পর্যবেক্ষণ করা পার্থক্য নমুনা পরিবর্তনশীলতার দ্বারা ব্যাখ্যা করা বলে ধরে নেওয়া হয়। পর্যাপ্ত পরিমাণে নমুনা সহ, একটি পরিসংখ্যানগত পরীক্ষা প্রায় সর্বদা একটি তাত্পর্যপূর্ণ পার্থক্য প্রদর্শন করে, যদি কোনও প্রভাব না ঘটে, অর্থাত্, যখন প্রভাবটির আকার হুবুহ হয়; তবুও খুব সামান্য পার্থক্য, তাৎপর্যপূর্ণ হলেও, প্রায়শই অর্থহীন। সুতরাং, বিশ্লেষণের জন্য কেবলমাত্র উল্লেখযোগ্য পি মানের প্রতিবেদন করা পাঠকদের পক্ষে ফলাফলগুলি পুরোপুরি বোঝার পক্ষে পর্যাপ্ত নয়।

এবং বৃহত্তর নমুনা মাপের বিষয়ে @ ড্যারেনজেমসের মন্তব্যগুলি সংবিধানিত করতে

উদাহরণস্বরূপ, যদি কোনও নমুনার আকার 10 000 হয়, তবে গ্রুপগুলির মধ্যে ফলাফলের পার্থক্য নগণ্য এবং অন্যের জন্য ব্যয়বহুল বা সময়সাপেক্ষে হস্তক্ষেপকে ন্যায্যতা না জানালেও একটি উল্লেখযোগ্য পি মান পাওয়া যায়। নিজেই তাত্পর্যপূর্ণ স্তরটি প্রভাবের আকারের পূর্বাভাস দেয় না। তাত্পর্য গুরুত্বের তুলনায়, প্রভাব আকার নমুনা আকার থেকে স্বতন্ত্র। অন্যদিকে পরিসংখ্যানগত তাত্পর্য, নমুনার আকার এবং প্রভাবের আকার উভয়ের উপর নির্ভর করে। এই কারণে, পি মানগুলি নমুনার আকারের উপর নির্ভরতার কারণে বিভ্রান্তিকর বলে মনে করা হয়। কখনও কখনও একটি পরিসংখ্যানগতভাবে উল্লেখযোগ্য ফলাফলের অর্থ কেবলমাত্র বিশাল আকারের নমুনা ব্যবহার করা হত। [একটি ভুল ধারণা রয়েছে যে এই আচরণটি নাল অনুমানের বিরুদ্ধে পক্ষপাতিত্ব করে।কেন পর্যাপ্ত বড় নমুনাগুলি দ্বারা নাল অনুমানকে প্রত্যাখ্যান করার দিকে ঘন ঘনবাদী হাইপোথিসিস টেস্টিং পক্ষপাতদুষ্ট হয়ে যায়? ]

এফেক্ট সাইজ Using বা পি মানটি কেন পর্যাপ্ত নয় তা ব্যবহার করে

পি-মান এবং প্রভাব উভয় আকারের প্রতিবেদন করুন

এখন প্রশ্নের উত্তর দিতে, প্রভাব মাপগুলি পি-মানের তুলনায় উচ্চতর হয় ? আমি যুক্তি দিয়ে বলব যে এগুলি প্রতিটি পরিসংখ্যান বিশ্লেষণে গুরুত্বপূর্ণ উপাদান হিসাবে কাজ করে যা এই জাতীয় পদগুলির সাথে তুলনা করা যায় না এবং তাদের একসাথে রিপোর্ট করা উচিত should P-মান পরিসংখ্যানগত তাৎপর্য (নাল বন্টন থেকে পার্থক্য) চিহ্নিত করার জন্য একটি পরিসংখ্যাত, শব্দ মধ্যে প্রভাব আকার রাখে নেই একটি পার্থক্য কত কোথায়।

উদাহরণস্বরূপ, আপনার তত্ত্বাবধায়ক বলুন, বব, যিনি খুব পরিসংখ্যান-বান্ধব নন, তা দেখার আগ্রহী যে ডাব্লুটি ডাব্লু (ওজন) এবং এমপিজি (গ্যালন প্রতি মাইল ) এর মধ্যে কোনও উল্লেখযোগ্য সম্পর্ক ছিল কিনা seeing আপনি অনুমান দিয়ে বিশ্লেষণ শুরু করুন

এইচ0:βমিপি=0 বনাম এইচএকজন:βমিপি0

পরীক্ষিত হচ্ছে α=0.05

> data("mtcars")
> 
> fit = lm(formula = mpg ~ wt, data = mtcars)
> 
> summary(fit)

Call:
lm(formula = mpg ~ wt, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5432 -2.3647 -0.1252  1.4096  6.8727 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
wt           -5.3445     0.5591  -9.559 1.29e-10 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.046 on 30 degrees of freedom
Multiple R-squared:  0.7528,    Adjusted R-squared:  0.7446 
F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

summaryআউটপুট থেকে আমরা দেখতে পাচ্ছি যে একটি খুব ছোট পি-মান সহ আমাদের একটি টি স্ট্যাটিস্টিক রয়েছে । আমরা আরামে নাল অনুমানকে প্রত্যাখ্যান করতে পারি এবং এটি রিপোর্ট করতে পারিβমিপি0। যাইহোক, আপনার বস জিজ্ঞাসা করুন, ভাল, এটি কতটা আলাদা? আপনি বব বলতে পারেন, "ভাল, দেখে মনে হচ্ছে একটি আছে মত নেতিবাচক মধ্যে সম্পর্ক রৈখিক MPG এবং WT । এছাড়াও, সংক্ষিপ্ত করা যেতে পারে প্রতিটি বর্ধিত ইউনিট জন্য যে WT সেখানে 5,3445 একটি হ্রাস MPG "

সুতরাং, আপনি সিদ্ধান্তটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ বলে উপসংহারে সক্ষম হয়েছিলেন এবং ব্যবহারিক দিক দিয়ে তাৎপর্যটি জানান।

আমি আশা করি এটি আপনার প্রশ্নের উত্তর দেওয়ার ক্ষেত্রে কার্যকর ছিল।


জন, ধন্যবাদ, অনেক ধূসর অঞ্চল রয়েছে যেগুলি সম্পর্কে আমি আরও শোনার আশা করছিলাম কিন্তু আমি তা পাই নি। প্রচুর পরিস্থিতিতে প্রভাব আকার এবং p- মান সম্মত হয় না। অনেকগুলি বিশ্বাসের প্রভাবগুলি এমন পরিস্থিতিতে মাপ দেয় যা আমি জানতে চাই। আমি সিমুলেশনগুলি সম্পর্কে আরও শুনার আশা করছিলাম যা গুরুত্বপূর্ণ পয়েন্টগুলি প্রদর্শন করতে পারে। আপনি যে বিষয়টি উত্থাপিত করেছেন তা সম্পর্কিত অর্থাত্, এফেক্টের আকারটি ছোট হতে পারে তবে ঠিক শূন্য নয়; সমতা পরীক্ষা করার পদ্ধতিগুলি বেশ কয়েক বছর ধরে রয়েছে। আমি আরও বেশি বায়সিয়ান সমতুল্য পরীক্ষা পছন্দ করি। যাইহোক, আমি সম্ভবত আমার প্রশ্নটি যথেষ্ট পরিষ্কারভাবে জিজ্ঞাসা করিনি। - ধন্যবাদ
rnorouzian

বিটিডব্লিউ, একজন সহকর্মী মন্তব্য করেছিলেন যে ডারেনের আর কোডটি ভুল, মনে হচ্ছে এটি সঠিক / সঠিক। সে রাখেনি var.equal = TRUE
rnorouzian

* প্রচুর পরিস্থিতিতে আকারের আকার এবং পি-মান সম্মত হয় না * * - আপনি কি এই বিষয়ে আরও তথ্য সরবরাহ করতে পারেন? একটি উদাহরণ? আপনি যে বিষয়টি নিয়ে এসেছেন অর্থাৎ এই প্রভাবটির আকার ছোট হতে পারে তবে একেবারে শূন্য নয় - এই অবস্থার ফলে বড় আকারের নমুনা আকার হতে পারে। সুতরাং যদি প্রভাবের আকারটি প্রায় শূন্য হয়, তবে সুদের পরিবর্তনশীলগুলি ফলাফলটিকে উল্লেখযোগ্যভাবে প্রভাবিত করতে পারে না, বা সম্পর্কটি ভুলভাবে নির্দিষ্ট করা যেতে পারে (যেমন লিনিয়ার বনাম ননলাইনার)।
জন

এই সরঞ্জামটি চেষ্টা করে দেখুন । আরো দেখুন এই দস্তাবেজটি । স্পষ্টতার জন্য কিছু কোড ব্যবহার করে পরবর্তী সময়ে আমাকে আরও একটি প্রশ্ন জিজ্ঞাসা করতে হবে বলে মনে হচ্ছে। -- ধন্যবাদ.
rnorouzian

@ আরনোরৌজিয়ান, ঠিক আছে, আমি আপনার কোডটি চালিয়েছি। তুমি কি বলতে চাও?
জন

4

পি-মানগুলির সাথে সম্পর্কিত আকারের ব্যবহারের (পাশাপাশি পরিসংখ্যানগত অনুক্রমের অন্যান্য মেট্রিক্স) নিয়মিতভাবে আমার ক্ষেত্র-মনোবিজ্ঞান deb এ বিতর্ক হয় এবং আপনার প্রশ্নের সাথে প্রাসঙ্গিক কারণগুলির জন্য বিতর্কটি বর্তমানে "গরম" হয়। এবং যদিও আমি নিশ্চিত যে মনোবিজ্ঞান অগত্যা সর্বাধিক পরিসংখ্যানগতভাবে পরিশীলিত বৈজ্ঞানিক ক্ষেত্র নয়, এটি সহজেই আলোচনা করেছে, অধ্যয়ন করেছে — এবং কখনও কখনও প্রদর্শিত হয়েছে। পরিসংখ্যানগত অনুক্রমের বিভিন্ন পদ্ধতির সীমাবদ্ধতা বা কমপক্ষে কীভাবে সেগুলি মানুষের ব্যবহারের দ্বারা সীমাবদ্ধ। ইতিমধ্যে পোস্ট করা উত্তমগুলিতে ভাল অন্তর্দৃষ্টি অন্তর্ভুক্ত রয়েছে তবে আপনি যদি প্রতিটিটির পক্ষে এবং তার বিপরীতে কারণগুলির আরও বিস্তৃত তালিকা (এবং উল্লেখগুলি) করতে আগ্রহী হন তবে নীচে দেখুন।

পি-মানগুলি অনাকাঙ্ক্ষিত কেন?

  • ড্যারেন জেমস নোট হিসাবে (এবং তাঁর সিমুলেশন শো), পি-মানগুলি আপনার পর্যবেক্ষণের সংখ্যার উপর নির্ভর করে (কির্ক, ২০০৩ দেখুন)
  • জনের নোট হিসাবে, পি-মানগুলি নাল কল্পনাটি সত্য বলে এই তথ্যকে চরম বা আরও চরম হিসাবে ডেটা পর্যবেক্ষণের শর্তাধীন সম্ভাবনা উপস্থাপন করে। যেহেতু বেশিরভাগ গবেষক গবেষণার অনুমানের পরিবর্তে এবং / অথবা নাল-অনুমানের সম্ভাবনা থাকতে পারে , পি-মানগুলি সম্ভাব্যতার সাথে কথা বলেন না যেখানে গবেষকরা সবচেয়ে বেশি আগ্রহী (যেমন, নাল বা গবেষণা অনুমানের, ডায়েনস দেখুন, ২০০৮)
  • যারা পি-ভ্যালু ব্যবহার করেন তারা কী বোঝাতে বা বোঝাতে চান না তা বোঝেন না (শ্মিট ও হান্টার, 1997)। মাইকেল লিউর গেলম্যান অ্যান্ড স্টারনের (২০০)) গবেষণাপত্রের রেফারেন্স পি-ভ্যালু থেকে কে কী ব্যাখ্যা করতে পারে (বা না পারে) সে সম্পর্কে গবেষকদের ভুল বোঝাবুঝির বিষয়টি আরও নির্দেশ করে। এবং ফাইভ থার্টিইট-এ তুলনামূলকভাবে সাম্প্রতিক গল্প হিসাবেপ্রমাণিত হয়েছে, এটি এখনও অবিরত থাকে।
  • পি-মানগুলি পরবর্তী পি-মানগুলির পূর্বাভাস দেওয়ার ক্ষেত্রে দুর্দান্ত নয় (কামিং, ২০০৮)
  • পি-মানগুলি প্রায়শই ভুল রেকর্ড করা হয় (প্রায়শই স্ফীত তাত্পর্যপূর্ণ তাত্পর্য) এবং তথ্য সরবরাহের জন্য অনাকাঙ্ক্ষিততার সাথে ভুল তথ্য সরবরাহ করা হয় (বাকের অ্যান্ড উইচার্টস, ২০১১; নিউইজেন এট অ্যাল।, ২০১ W; উইচার্স এট আল, ২০১১)
  • পি-মানগুলি বিশ্লেষণাত্মক নমনীয়তার মাধ্যমে সক্রিয়ভাবে বিকৃত হতে পারে (এবং historতিহাসিকভাবে, হতে পারে) এবং তাই অবিশ্বাস্য (জন এট।, 2012; সিমন্স এট আল।, ২০১১)
  • পি-মানগুলি অপ্রয়োজনীয়ভাবে তাত্পর্যপূর্ণ, কারণ একাডেমিক ব্যবস্থা বৈজ্ঞানিক নির্ভুলতার চেয়ে পরিসংখ্যানিক তাত্পর্য হিসাবে বিজ্ঞানীদের পুরস্কৃত করে (ফানেলি, ২০১০; নোজেক এট আল।, ২০১২; রোজেনথাল, 1979)

প্রভাব আকারগুলি কেন আকাঙ্ক্ষিত?

নোট করুন যে আমি আপনার প্রশ্নটি বিশেষত প্রমিত আকারের নির্দিষ্ট করে উল্লেখ করছি, কারণ আপনি বলছেন যে তারা গবেষকদের তাদের ফলাফলগুলিকে "একটি সাধারণ মেট্রিকের মধ্যে" রূপান্তর করতে দেয়।

  • জোন এবং ড্যারেন জেমস যেমন ইঙ্গিত করেছেন, প্রভাব আকারগুলি পর্যবেক্ষণের সংখ্যার চেয়ে আলাদা একটি প্রভাবের মাত্রা নির্দেশ করে আছে কিনা তা দ্বিধাত্বক সিদ্ধান্ত গ্রহণের বিরোধিতা হিসাবে (আমেরিকান সাইকোলজিকাল অ্যাসোসিয়েশন ২০১০; কামিং, ২০১৪) ।
  • এফেক্ট মাপগুলি মূল্যবান কারণ তারা মেটা-বিশ্লেষণগুলি সম্ভব করে তোলে এবং মেটা-বিশ্লেষণ संचयी জ্ঞান চালায় (বোরেনস্টাইন এট আল।, ২০০৯; চ্যান অ্যান্ড আরভে, ২০১২)
  • প্রভাব আকারগুলি অগ্রাধিকার শক্তি বিশ্লেষণের মাধ্যমে নমুনা আকারের পরিকল্পনাকে সহায়তা করতে সহায়তা করে এবং তাই গবেষণায় দক্ষ সংস্থান বরাদ্দ (কোহেন, 1992)

পি-মানগুলি কেন কাম্য?

যদিও সেগুলি প্রায়শই কম স্পষ্ট করা হয়, পি-মানগুলির অনেকগুলি পার্ক থাকে। কিছু সুপরিচিত এবং দীর্ঘস্থায়ী, অন্যরা তুলনামূলকভাবে নতুন।

  • পি-মানগুলি পরিসংখ্যানের মডেল নাল অনুমানের বিরুদ্ধে প্রমাণের শক্তির একটি সুবিধাজনক এবং পরিচিত সূচক সরবরাহ করে।

  • সঠিকভাবে গণনা করা হলে, পি-মানগুলি দ্বিধাদায়ক সিদ্ধান্ত নেওয়ার একটি মাধ্যম সরবরাহ করে (যা কখনও কখনও প্রয়োজনীয় হয়), এবং পি-মানগুলি দীর্ঘমেয়াদে মিথ্যা-ইতিবাচক ত্রুটি হারকে একটি গ্রহণযোগ্য পর্যায়ে রাখতে সহায়তা করে (ডায়েনেস, ২০০৮; সাকালুক, ২০১)) [এটি দ্বিধাত্বক সিদ্ধান্ত নেওয়ার জন্য পি-মানগুলি প্রয়োজন তা বলা শক্তভাবে সঠিক নয়। সেগুলি প্রকৃতপক্ষে সেভাবে ব্যাপকভাবে ব্যবহৃত হয়, তবে নেইমন ও পিয়ারসন সেই উদ্দেশ্যে পরীক্ষার পরিসংখ্যান ব্যবস্থায় 'সমালোচনামূলক অঞ্চলগুলি' ব্যবহার করেছিলেন। দেখুন এই প্রশ্নের এবং তার উত্তর]

  • পি-মানগুলি ধারাবাহিকভাবে দক্ষ নমুনা আকারের পরিকল্পনার সুবিধার্থে ব্যবহার করা যেতে পারে (কেবলমাত্র এককালীন শক্তি-বিশ্লেষণ নয়) (লাকেন্স, ২০১৪)
  • পি-ভ্যালুগুলি মেটা-বিশ্লেষণের সুবিধার্থে এবং প্রজ্ঞাপূর্ণ মানটি মূল্যায়নের জন্য ব্যবহার করা যেতে পারে (সিমোনসোহান এট আল।, 2014 এ; সিমোনসোহান এট আল।, 2014 বি)। এই ফ্যাশনে পি-ভ্যালুগুলির বিতরণ কীভাবে এই সিভি পোস্টে ব্যবহার করা যেতে পারে তার অ্যাক্সেসযোগ্য আলোচনার জন্য এই ব্লগপোস্টটি দেখুন সেই সাথে সম্পর্কিত আলোচনার জন্য ।
  • প্রশ্নোত্তর গবেষণা অনুশীলন ব্যবহার করা হয়েছে কি না, এবং কীভাবে প্রতিরূপ ফলস্বরূপ ফলাফল হতে পারে তা নির্ধারণের জন্য পি-মানগুলি ব্যবহার করা যেতে পারে (শিমম্যাক, ২০১৪; এছাড়াও শানব্রোডের অ্যাপ্লিকেশন, ২০১৫ দেখুন)

কেন প্রভাব আকারগুলি অযাচিত (বা ওভাররেটেড) হয়?

অনেকের কাছে সম্ভবত সবচেয়ে পাল্টা-স্বজ্ঞাত অবস্থান; মানকীয় প্রভাবের আকারগুলি কেন রিপোর্ট করা অনাকাঙ্ক্ষিত হবে বা খুব কমপক্ষে, ওভাররেটেড হবে?

  • কিছু ক্ষেত্রে স্ট্যান্ডার্ডাইজড এফেক্ট মাপগুলি সেগুলি ক্র্যাক করা সমস্ত কিছু নয় (যেমন, গ্রিনল্যান্ড, শ্লেসেলম্যান এবং ক্রিকুই, 1986)। কাগা / অ-স্ট্যান্ডার্ডাইজড এফেক্ট মাপগুলি আরও আকাঙ্ক্ষিত হতে পারে এমন কয়েকটি কারণগুলির বিশেষত ব্যাগুয়ালি (২০০৯) এর সুন্দর বর্ণনা রয়েছে।
  • অগ্রাধিকার শক্তি বিশ্লেষণের জন্য তাদের ইউটিলিটি সত্ত্বেও দক্ষ নমুনা-আকারের পরিকল্পনার সুবিধার্থে এফেক্ট মাপগুলি নির্ভরযোগ্যভাবে ব্যবহৃত হয় না (ম্যাক্সওয়েল, 2004)
  • এমনকি যখন আকারের নমুনা আকারের পরিকল্পনায় প্রভাব আকারগুলি ব্যবহার করা হয়, কারণ এগুলি প্রকাশনা পক্ষপাতের মাধ্যমে স্ফীত হয় (রোসেন্টাল, 1979) প্রকাশিত প্রভাব আকারগুলি নির্ভরযোগ্য নমুনা-আকারের পরিকল্পনার জন্য প্রশ্নবিদ্ধ উপযোগী হয় (সাইমনসোহান, 2013)
  • পরিমাপের আকারের প্রাক্কলনটি পরিসংখ্যান সংক্রান্ত সফ্টওয়্যারগুলিতে পদ্ধতিগতভাবে ভুলভাবে গণনা করা যেতে পারে এবং এটি করা যেতে পারে (লেভাইন এবং হুললেট, ২০০২)
  • এফেক্ট মাপগুলি ভুলভাবে নিষ্কাশন করা হয় (এবং সম্ভবত ভুল প্রতিবেদন করা হয়) যা মেটা-বিশ্লেষণগুলির বিশ্বাসযোগ্যতাকে ক্ষুন্ন করে (গ্যাটস্কে এবং আল।, 2007)
  • শেষ অবধি, আকার আকারে প্রকাশনার পক্ষপাতিত্বের জন্য সংশোধন করা অকার্যকর থেকে যায় (কার্টার এট আল।, 2017 দেখুন), আপনি যদি বিশ্বাস করেন যে প্রকাশনা পক্ষপাত বিদ্যমান, তবে মেটা-বিশ্লেষণ কম কার্যকর করে।

সারসংক্ষেপ

মাইকেল লিউ দ্বারা তৈরি পয়েন্টটি প্রতিধ্বনি করা, পি-মান এবং প্রভাব আকারগুলি পরিসংখ্যানগত প্রমাণের দুটি টুকরা; অন্যান্য বিবেচনা মূল্য আছে। তবে পি-ভ্যালু এবং এফেক্ট মাপগুলির মতো, প্রজ্ঞাপনীয় মানের অন্যান্য মেট্রিকগুলিও ভাগ করে নিয়েছে এবং অনন্য সমস্যাও। গবেষকরা সাধারণত আত্মবিশ্বাসের ব্যবধানগুলি ভুলভাবে প্রয়োগ ও ভুল ব্যাখ্যা করেন (উদাহরণস্বরূপ, হাইকস্ট্রা এট আল।, ২০১৪; মোরে এট আল।, ২০১)), উদাহরণস্বরূপ, এবং বায়সিয়ান বিশ্লেষণগুলির ফলাফল গবেষকরা বিকৃত করতে পারেন ঠিক যেমন পি-মান ব্যবহার করার সময় (যেমন, সিমোনসোহান) , 2014)।

প্রমাণের সমস্ত মেট্রিকগুলি জিতেছে এবং সকলের অবশ্যই পুরস্কার থাকতে হবে।

তথ্যসূত্র

আমেরিকান মনস্তাত্ত্বিক এসোসিয়েশন. (2010)। আমেরিকান সাইকোলজিকাল অ্যাসোসিয়েশনের প্রকাশনা ম্যানুয়াল (ation ষ্ঠ সংস্করণ)। ওয়াশিংটন, ডিসি: আমেরিকান সাইকোলজিকাল অ্যাসোসিয়েশন।

বাগুলে, টি। (২০০৯) মানক বা সহজ প্রভাব আকার: কি রিপোর্ট করা উচিত ?. মনস্তত্ত্বের ব্রিটিশ জার্নাল, 100 (3), 603-617।

বেকার, এম।, এবং উইচার্টস, জেএম (২০১১)। মনোবিজ্ঞান জার্নালে পরিসংখ্যানগত ফলাফলের (ভুল) রিপোর্টিং। আচরণ গবেষণা পদ্ধতি, 43 (3), 666-678।

বোরেনস্টাইন, এম।, হেজেস, এলভি, হিগিনস, জে।, এবং রোথস্টেইন, এইচআর (২০০৯)। মেটা-বিশ্লেষণের ভূমিকা। পশ্চিম সাসেক্স, যুক্তরাজ্য: জন উইলি অ্যান্ড সন্স, লি।

কার্টার, ইসি, শানব্রোড, এফডি, গ্রাওয়াইস, ডাব্লুএম, এবং হিলগার্ড, জে। (2017, 12 আগস্ট)। মনোবিজ্ঞানের পক্ষপাতের জন্য সংশোধন: মেটা-অ্যানালিটিক পদ্ধতির একটি তুলনা। Osf.io/preprints/psyarxiv/9h3nu থেকে প্রাপ্ত

চ্যান, এমই, এবং আরভে, আরডি (2012)। মেটা-বিশ্লেষণ এবং জ্ঞানের বিকাশ। মনস্তাত্ত্বিক বিজ্ঞানের উপর দৃষ্টিভঙ্গি, 7 (1), 79-92।

কোহেন, জে। (1992)। একটি পাওয়ার প্রাইমার মনস্তাত্ত্বিক বুলেটিন, 112 (1), 155-159। 

কামিং, জি। (২০০৮) প্রতিলিপি এবং পি ব্যবধান: পি ভবিষ্যতেরটিকে কেবল অস্পষ্টভাবেই মূল্য দেয় তবে আত্মবিশ্বাসের ব্যবধানগুলি আরও ভাল করে। মনোবিজ্ঞান বিজ্ঞানের উপর দৃষ্টিভঙ্গি, 3, 286 28 300।

ডায়েনেস, ডি (২০০৮) মনোবিজ্ঞানকে বিজ্ঞান হিসাবে বোঝা: বৈজ্ঞানিক এবং পরিসংখ্যানগত অনুক্রমের একটি ভূমিকা introduction নিউ ইয়র্ক, এনওয়াই: পালগ্রাভ ম্যাকমিলান।

ফানেলি, ডি (২০১০)। "ইতিবাচক" ফলাফলগুলি বিজ্ঞানের শ্রেণিবিন্যাসকে বাড়িয়ে তোলে। PloS এক, 5 (4), e10068।

গেলম্যান, এ।, এবং স্টার্ন, এইচ। (2006) "উল্লেখযোগ্য" এবং "উল্লেখযোগ্য নয়" এর মধ্যে পার্থক্য নিজেই পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ নয়। আমেরিকান পরিসংখ্যানবিদ, 60 (4), 328-331।

গট্শে, পিসি, হ্রবাজার্টসন, এ।, মারি, কে।, এবং টেন্ডাল, বি। (2007)। মেটা-বিশ্লেষণে ডেটা নিষ্কাশন ত্রুটিগুলি মানকৃত গড় পার্থক্যগুলি ব্যবহার করে। জামা, 298 (4), 430-437।

গ্রিনল্যান্ড, এস, শ্লেসেলম্যান, জেজে, এবং ক্রিকুই, এমএইচ (1986)। কার্যকর পদক্ষেপ হিসাবে মানযুক্ত রেগ্রেশন সহগ এবং পারস্পরিক সম্পর্ক নিয়োগের ভ্রান্তি। আমেরিকান জার্নাল অফ এপিডেমিওলজি, 123 (2), 203-208।

Hoekstra, আর।, মোরি, আরডি, রাউডার, JN, এবং Wagenmakers, EJ (2014)। আত্মবিশ্বাসের অন্তরগুলির শক্তিশালী ভুল ব্যাখ্যা সাইকোনমিক বুলেটিন এবং পর্যালোচনা, 21 (5), 1157-1164।

জন, এলকে, লোয়েস্টেন, জি।, এবং প্রলেক, ডি (২০১২)। সত্য বলার জন্য উত্সাহ দিয়ে প্রশ্নবিদ্ধ গবেষণা পদ্ধতির প্রসার পরিমাপ করা। মনস্তাত্ত্বিক বিজ্ঞান, 23 (5), 524-532।

কર્ક, আরই (2003) প্রভাবের পরিমাণের গুরুত্ব। এসএফ ডেভিস (এডি।) তে পরীক্ষামূলক মনোবিজ্ঞানের গবেষণা পদ্ধতিগুলির হ্যান্ডবুক (পৃষ্ঠা 83-105)। ম্যালডেন, এমএ: ব্ল্যাকওয়েল।

লাকেন্স, ডি (২০১৪)। অনুক্রমিক বিশ্লেষণগুলির সাথে দক্ষতার সাথে উচ্চ-শক্তিযুক্ত অধ্যয়ন সম্পাদন করা। ইউরোপীয় জার্নাল অফ সোশ্যাল সাইকোলজি, 44 (7), 701-710।

লেভাইন, টিআর, এবং হুললেট, সিআর (2002)। এটা স্কোয়ারড, আংশিক এটা স্কোয়ারড এবং যোগাযোগের গবেষণায় প্রভাবের আকারের ভুল তথ্য সরবরাহ করা। মানব যোগাযোগ গবেষণা, 28 (4), 612-625।

ম্যাক্সওয়েল, এসই (2004)। মনস্তাত্ত্বিক গবেষণায় নিম্ন বিদ্যুতের অধ্যয়নের জেদ: কারণ, পরিণতি এবং প্রতিকার। মানসিক পদ্ধতি, 9 (2), 147।

মোরে, আরডি, হোইকস্ট্রা, আর।, রাউডার, জেএন, লি, এমডি, এবং ওয়াগেনমেকারস, ইজে (২০১ 2016)। আত্মবিশ্বাসের বিরতিতে আস্থা রাখার মিথ্যাচার। সাইকোনমিক বুলেটিন এবং পর্যালোচনা, 23 (1), 103-123।

নোসেক, বিএ, স্পাইস, জেআর, এবং মোটাইল, এম (২০১২)। বৈজ্ঞানিক ইউটোপিয়া: II। প্রকাশের উপর সত্য প্রচার করার জন্য প্রণোদনা এবং অনুশীলনের পুনর্গঠন। মনস্তাত্ত্বিক বিজ্ঞানের উপর দৃষ্টিভঙ্গি, 7 (6), 615-631।

নিউইজটেন, এমবি, হার্টগারিংক, সিএইচ, ভ্যান অ্যাসেন, এমএ, অ্যাপসক্যাম্প, এস, এবং উইচার্টস, জেএম (২০১ 2016)। মনোবিজ্ঞানে স্ট্যাটিস্টিকাল রিপোর্টিং ত্রুটির বিস্তার (1985–2013)। আচরণ গবেষণা পদ্ধতি, 48 (4), 1205-1226।

রোসানথাল, আর। (1979) নাল ফলাফলের জন্য ফাইল ড্রয়ারের সমস্যা এবং সহনশীলতা। মনস্তাত্ত্বিক বুলেটিন, 86 (3), 638-641।

সাকালুক, জে কে (২০১ 2016)। ছোট অন্বেষণ, বড় নিশ্চিতকরণকারী: সংশ্লেষক এবং প্রতিরূপযোগ্য মনস্তাত্ত্বিক গবেষণা অগ্রগতির জন্য নতুন পরিসংখ্যানগুলির একটি বিকল্প ব্যবস্থা। পরীক্ষামূলক সামাজিক মনোবিজ্ঞান জার্নাল, 66, 47-54।

শিমম্যাক, ইউ। (2014)। পরিসংখ্যান গবেষণা ইন্টিগ্রিটি পরিমাণে: প্রতিরূপ-সূচক। Http://www.r-index.org থেকে প্রাপ্ত 

শ্মিট, এফএল, এবং হান্টার, জেই (1997)। গবেষণা তথ্য বিশ্লেষণে তাত্পর্যপূর্ণ পরীক্ষা বন্ধ করার বিষয়ে আটটি সাধারণ তবে মিথ্যা আপত্তি। এলএল হারলো, এস এ মুলাইক, এবং জেএইচ স্টিগার (এড।), তেমন কোনও তাত্পর্য না থাকলে কী হবে? (পৃষ্ঠা 37-64)। মাহওয়াহ, এনজে: এরলবাউম।

শানব্রোড, এফডি (2015)। পি-পরীক্ষক: একক জন্য সমস্ত পি মান বিশ্লেষক। Http://shinyapps.org/apps/p-checker/ থেকে প্রাপ্ত । 

সিমন্স, জেপি, নেলসন, এলডি, এবং সিমোনসোহন, ইউ। (2011)। মিথ্যা-ইতিবাচক মনোবিজ্ঞান: ডেটা সংগ্রহ এবং বিশ্লেষণে অপ্রকাশিত নমনীয়তা যে কোনও কিছুকে উল্লেখযোগ্য হিসাবে উপস্থাপন করতে দেয় allows মনস্তাত্ত্বিক বিজ্ঞান, 22 (11), 1359-1366।

সিমোনসোহন, মার্কিন যুক্তরাষ্ট্র (2013)। পর্যবেক্ষিত প্রভাবের আকারের উপর ভিত্তি করে প্রতিরূপে শক্তি প্রয়োগের বোকামি। থেকে পুনরুদ্ধার http://datacolada.org/4

সিমোনসোহন, মার্কিন যুক্তরাষ্ট্র (2014)। অবর হ্যাকিংয়ের। Http://datacolada.org/13 থেকে প্রাপ্ত ।

সিমোনসোহন, মার্কিন যুক্তরাষ্ট্র, নেলসন, এলডি, এবং সিমন্স, জেপি (২০১৪)। পি-কার্ভ: ফাইল-ড্রয়ারের একটি কী। পরীক্ষামূলক মনোবিজ্ঞানের জার্নাল: সাধারণ, 143 (2), 534-547।

সিমোনসোহন, মার্কিন যুক্তরাষ্ট্র, নেলসন, এলডি, এবং সিমন্স, জেপি (২০১৪)। পি-কার্ভ এবং এফেক্ট আকার: কেবলমাত্র উল্লেখযোগ্য ফলাফল ব্যবহার করে প্রকাশনা পক্ষপাতের জন্য সংশোধন করা। মনোবিজ্ঞান বিজ্ঞানের উপর দৃষ্টিভঙ্গি, 9 (6), 666-681।

উইচার্টস, জেএম, বাকার, এম।, এবং মোলেনার, ডি (২০১১)। গবেষণামূলক তথ্য ভাগ করে নেওয়ার ইচ্ছা প্রমাণের শক্তি এবং পরিসংখ্যানগত ফলাফলের প্রতিবেদনের মানের সাথে সম্পর্কিত। PloS এক, 6 (11), e26828।


2
ধারণা এবং রেফারেন্সগুলির খুব সুন্দর সংগ্রহ। যারা আরও কিছুটা খনন করতে চান তাদের পক্ষে এটি সহায়ক হওয়া উচিত তবে নোট করুন যে অনেকগুলি পয়েন্টের এই সাইটে প্রাসঙ্গিক প্রশ্নোত্তর রয়েছে। এগুলির লিঙ্কগুলিও সহায়তা করবে।
মাইকেল লিউ

@ মিশেললাইউ ধন্যবাদ আমি পরে সময় পেলে কিছু লিঙ্ক যুক্ত করার বিষয়ে দেখতে পাব - এই প্রতিক্রিয়াটি খসড়া করতে, এবং রেফারেন্সগুলিকে একত্রিত করতে আমার বিকেলের আরও ভাল সময় লাগল। আপনার সম্পাদনা সম্পর্কে, আমি মনে করি যে আপনার বক্তব্যটি যথাযথভাবে গ্রহণ করা হয়েছে, তবে সংশোধনের বিপরীতে সম্ভবত আরও একটি সংযোজন? আমি বলেছিলাম পি-মানগুলি দ্বিধাদায়ক সিদ্ধান্ত নেওয়ার একটি মাধ্যম সরবরাহ করে (তারা "প্রয়োজনীয়" বা এগুলি করার একমাত্র উপায় নয়)। আমি সম্মত হই যে এনপি সমালোচনামূলক অঞ্চলগুলি অন্য একটি উপায়, তবে পি-মানগুলি বনাম মানযুক্ত আকারের আকারের আকারের প্রসঙ্গে আমি ওপিতে সাড়া দিয়েছি।
jsakaluk

1
জাসাকালুক, হ্যাঁ আমি দেখতে পাচ্ছি যে আপনি উত্তরে একটি দীর্ঘ সময় ব্যয় করতে পারতেন এবং এটি আপনার প্রচেষ্টার জন্য খুব দরকারী এবং উপযুক্ত। আমি পি-মানগুলির সুবিধার জন্য আইটেমটি সম্পাদনা করেছি কারণ আপনি লিখেছেন "সঠিকভাবে ব্যবহৃত হলে" সেগুলি দ্বি-নকশাকৃত করা যেতে পারে, যদিও বাস্তবতাটি হ'ল এই জাতীয় ব্যবহার পি-ভ্যালুতে এনকোড থাকা তথ্যের অনেকটিকে উপেক্ষা করে এবং তর্কসাপেক্ষভাবে (এবং আমার মতে) একটি ভুল ব্যবহার। আমি আপনার উদ্দেশ্যটি হস্তান্তরিত করতে চাইনি এবং তাই আমি "ব্যবহৃত "টিকে" গণনা করা "হিসাবে পরিবর্তন করেছি।
মাইকেল লিউ

3

একজন এপিডেমিওলজিস্টের দৃষ্টিকোণ থেকে, কেন আমি পি-মানগুলির তুলনায় প্রভাব আকারগুলি পছন্দ করি (যদিও কিছু লোক উল্লেখ করেছে যে এটি একটি মিথ্যা দ্বিবিজ্ঞানের কিছু):

  1. এফেক্টের আকারটি আমাকে জানায় আমি আসলে কী চাই, পি-মানটি আমাকে জানায় যে এটি শূন্য থেকে পৃথকযোগ্য। 1.0001, 1.5, 5 এবং 50 এর আপেক্ষিক ঝুঁকিগুলির সাথে তাদের একই পি-ভ্যালু যুক্ত থাকতে পারে তবে জনসংখ্যা পর্যায়ে আমাদের কী কী প্রয়োজন হতে পারে তার পরিপ্রেক্ষিতে বিস্তৃত ভিন্ন জিনিস বোঝাতে পারে।
  2. একটি পি-মানের উপর নির্ভর করা এই ধারণাটিকে আরও শক্তিশালী করে তোলে যে তাত্পর্য-ভিত্তিক অনুমানের পরীক্ষাটি সব শেষে, সমস্ত প্রমাণ হতে হবে। নিম্নলিখিত দুটি বক্তব্য বিবেচনা করুন: "চিকিত্সকরা রোগীদের দিকে হাসতে হাসতে হাসপাতালে থাকার সময় কোনও প্রতিকূল ফলাফলের সাথে উল্লেখযোগ্যভাবে জড়িত ছিলেন না।" বনাম। "যেসব রোগীর চিকিত্সকের হাসি ছিল তাদের প্রতিকূল পরিণতি হওয়ার সম্ভাবনা 50% কম ছিল (পি = 0.086)।" আপনি কি এখনও, সম্ভবত একেবারে কোনও ব্যয় না করে চিকিত্সকরা তাদের রোগীদের দিকে হাসি দেওয়ার পরামর্শটি বিবেচনা করবেন?
  3. আমি প্রচুর স্টোকাস্টিক সিমুলেশন মডেল নিয়ে কাজ করি, যেখানে নমুনা আকারটি কম্পিউটিং শক্তি এবং ধৈর্যশীলতার একটি ফাংশন এবং পি-মানগুলি মূলত অর্থহীন। আমি ক্লিনিকাল বা জনস্বাস্থ্যের সাথে একেবারেই প্রাসঙ্গিকতা নেই এমন জিনিসের জন্য পি <0.05 ফলাফল পেতে পরিচালিত করেছি।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.