গড় পার্থক্য প্রায় 0 হলে টি-টেস্ট কীভাবে পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হতে পারে?


10

চিকিত্সার মধ্যে পার্থক্যটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ কিনা তা জানাতে আমি 2 জনসংখ্যার থেকে ডেটা তুলনা করার চেষ্টা করছি। ডেটা সেটগুলি সাধারণত দুটি সেটের মধ্যে খুব কম পার্থক্য সহ বিতরণ করা হয় বলে মনে হয়। গড় পার্থক্য 0.00017। আমি একটি জোড় করা টি-টেস্ট করলাম, এই আশা করে যে আমি অর্থগুলির মধ্যে কোনও পার্থক্যের নাল অনুমানকে বাতিল করতে ব্যর্থ হব, তবে, আমার গণনা করা টি-মান আমার সমালোচনামূলক টি-মানের চেয়ে অনেক বেশি।


আপনি কি সম্পর্কে পরামর্শ চান? আপনার এন এর কি?
গুং - মনিকা পুনরায়

হাই, আমি কীভাবে এগিয়ে যাব ঠিক তেমন নিশ্চিত নই, যদি ডেটা একেবারে অন্যরকম বলে মনে হয় না এমনটা দেখার সাথে যদি আমি কিছু ভুল করি। উভয় গ্রুপের 335 টি পর্যবেক্ষণ রয়েছে
Kscicc26

5
এর মধ্যে পার্থক্যের স্ট্যান্ডার্ড ত্রুটি হ'ল স্ট্যান্ডার্ড বিচ্যুতি এবং নমুনা আকারগুলির একটি ফাংশন। কোনও চমক নিবন্ধিত করার আগে এই সমস্ত টুকরো আপনার প্রশ্নের মধ্যে থাকা দরকার।
গ্লেন_বি -রিনস্টেট মনিকা

7
প্রতিটি পার্থক্য "প্রায় 0"! যদি ফলাফলের পরিবর্তনশীলগুলি লোকেদের দ্বারা প্রাপ্ত ওজনের হয় এবং এটি পাউন্ডে পরিমাপ করা হয় তবে 0.00017 প্রকৃতপক্ষে ছোট তবে এটি যদি কয়েক মিলিয়ন পাউন্ডে পরিমাপ করা হয় তবে 0.00017 প্রচুর। প্রতিক্রিয়াতে কী পরিমাপ করা হচ্ছে - এবং পরিমাপের একক সরবরাহ করা হয় - সুতরাং এই প্রশ্নের কোনও প্রসঙ্গ অবধি কোনও অর্থ নেই has
whuber

1
পরিসংখ্যানগত তাত্পর্য বৃহত্তর ইংরেজি তাত্পর্যতে "তাত্পর্য" বোঝায় না doesn't
ডেভিড 25272

উত্তর:


9

আমি পার্থক্যটি খুব সামান্য হলেও, পরীক্ষাটি গুরুত্বপূর্ণ ছিল বলে আপনি বিশ্বাস করার কোনও কারণ দেখছি না। জোড়যুক্ত টি-টেস্টে তাত্পর্যটি তিনটি বিষয় দ্বারা পরিচালিত হবে:

  1. গড় পার্থক্যের দৈর্ঘ্য
  2. আপনার কাছে থাকা পরিমাণের পরিমাণ
  3. পার্থক্যগুলির আদর্শ বিচ্যুতি

স্বীকার করা, আপনার গড় পার্থক্য খুব খুব সামান্য। অন্যদিকে, আপনার কাছে যথেষ্ট পরিমাণে ডেটা রয়েছে (এন = 335)। সর্বশেষ কারণটি হ'ল পার্থক্যগুলির মানক বিচ্যুতি। এটি কী তা আমি জানি না, তবে যেহেতু আপনি একটি উল্লেখযোগ্য ফলাফল পেয়েছেন, তাই আপনার কাছে থাকা ডেটার পরিমাণের সাথে সামান্য গড় পার্থক্যটি কাটিয়ে উঠতে এটি যথেষ্ট ছোট বলে মনে করা নিরাপদ। একটি অন্তর্দৃষ্টি তৈরি করার স্বার্থে, কল্পনা করুন যে আপনার অধ্যয়নের প্রতিটি পর্যবেক্ষণের জোড়যুক্ত পার্থক্য ছিল 0.00017, তারপরে পার্থক্যের আদর্শ বিচ্যুতি 0 হবে। অবশ্যই, এই সিদ্ধান্তে যুক্তিযুক্ত হওয়া উচিত যে চিকিত্সা হ্রাস পেয়েছে (তবুও) একটি ক্ষুদ্র একটি)।

নীচের মন্তব্যগুলিতে @ শুভর নোট হিসাবে, এটি উল্লেখ করা উচিত যে 0.00017 খুব কম সংখ্যার কোয়া সংখ্যার মতো মনে হলেও এটি অর্থবোধক পদে অগত্যা ছোট নয়। এটি জানার জন্য আমাদের কয়েকটি বিষয় জানতে হবে, প্রথমত ইউনিটগুলি কী। ইউনিটগুলি যদি খুব বড় হয় (যেমন, বছর, কিলোমিটার, ইত্যাদি), যা ছোট বলে মনে হয় তা অর্থপূর্ণভাবে বড় হতে পারে, অন্যদিকে ইউনিটগুলি যদি ছোট হয় (যেমন, সেকেন্ড, সেন্টিমিটার ইত্যাদি) তবে এই পার্থক্যটি আরও ছোট বলে মনে হয়। দ্বিতীয়ত, এমনকি একটি ছোট পরিবর্তনও গুরুত্বপূর্ণ হতে পারে: এমন এক ধরণের চিকিত্সা (উদাহরণস্বরূপ, ভ্যাকসিন) কল্পনা করুন যা খুব সস্তা, পুরো জনসাধারণকে পরিচালনা করা সহজ, এবং এর কোনও পার্শ্ব প্রতিক্রিয়াও ছিল না। এটি খুব সামান্য কিছু জীবন বাঁচালেও এটি করার উপযুক্ত হতে পারে।


প্রতিক্রিয়ার জন্য আপনাকে ধন্যবাদ! আমি পরিসংখ্যান সম্পর্কে খুব পারদর্শী নই, সুতরাং আমি যে উত্তরটি পাব বলে প্রত্যাশা করছিলাম সে উত্তরটি আমি যখন পাইনি তখনই আমাকে হতাশ করা হয়েছিল। মাধ্যমের মধ্যে পার্থক্যের মানগত ত্রুটি: 7.36764E-05। এর প্রাসঙ্গিকতা কী তা আমি নিশ্চিত নই, তবে আমি নিশ্চিত আপনি হাহাহা করবেন। আবার আপনার সাহায্যের জন্য ধন্যবাদ
Kscicc26

আপনাকে স্বাগতম, @ Kscicc26। পার্থক্যের স্ট্যান্ডার্ড ত্রুটি , এবং পার্থক্যের আদর্শ বিচ্যুতি একই জিনিস নয়। (ট্র্যাজিক্যালি এগুলি তাদের মতো হওয়া উচিত। এটা আপনি এসইএস আমার বিবরণ পড়তে সাহায্য করতে পারে এখানে
গুং - মনিকা পুনরায়

আমি এটি যাচাই করে নেব এবং সকালে এই সুতায় ফিরে আসব!
Kscicc26

2
এর অর্থ পার্থক্যটি ছোট বা বড় নয়: আপনার আকারটির মূল্যায়ন করার কোনও ভিত্তি নেই।
whuber

@ হুবুহু, এটি একটি ভাল পয়েন্ট - এই সংখ্যাগুলি কী বলে আমি জানি না। তবে ওপি সম্ভবত এটি করে এবং এটি খুব ছোট বলে মনে করে। আমি সেই তথ্য দিয়ে যাচ্ছি।
গুং - মনিকা পুনরায়

9

কোনও পার্থক্যটি সত্যই বড় বা ছোট কিনা তা জানতে কিছু মাপকাঠির প্রয়োজন, স্ট্যান্ডার্ড বিচ্যুতি স্কেলের এক পরিমাপ এবং সেই স্কেলের অংশ হিসাবে অ্যাকাউন্টে অংশ নেওয়া টি-টেস্ট সূত্রের অংশ।

আপনি যদি 5 বছরের বাচ্চাদের উচ্চতা 20 বছর বয়সের (মানব, একই ভৌগলিক অঞ্চল ইত্যাদি) এর সাথে তুলনা করছেন তবে বিবেচনা করুন। অন্তর্দৃষ্টি আমাদের জানায় যে সেখানে একটি ব্যবহারিক পার্থক্য রয়েছে এবং উচ্চতাগুলি যদি ইঞ্চি বা সেন্টিমিটারে পরিমাপ করা হয় তবে পার্থক্যটি অর্থবহ দেখাচ্ছে। তবে আপনি যদি উচ্চতাগুলিকে কিলোমিটারে রূপান্তর করেন? বা আলোক বছর? তারপরে পার্থক্যটি একটি খুব অল্প সংখ্যক (তবে এখনও পৃথক) হবে, তবে (রাউন্ড-অফ ত্রুটি ব্যতীত) টি-পরীক্ষা একই ফলাফল দেবে যে উচ্চতাটি ইঞ্চি, সেন্টিমিটার বা কিলোমিটারে পরিমাপ করা হয়।

সুতরাং পরিমাপের স্কেলের উপর নির্ভর করে 0.00017 এর পার্থক্য বিশাল হতে পারে।


4

যদি আপনার সমালোচনামূলক আপনি গণনা করেন তার চেয়ে কম হয় এবং ধরে নেওয়া হয় যে পরীক্ষাটি আপনার নির্দিষ্ট ধরণের ডেটা (একটি গুরুত্বপূর্ণ "যদি") জন্য উপযুক্ত ছিল তবে মনে হয় আপনার পার্থক্যটি পরিসংখ্যানগত দিক থেকে গুরুত্বপূর্ণ । উপযুক্ত প্রসঙ্গে একটি তাৎপর্যপূর্ণ অর্থ সাধারণত আপনার পর্যবেক্ষণ করা পার্থক্যটি নাল অনুমানকে সমর্থন করার জন্য খুব নির্ভরযোগ্যভাবে শূন্য নয় যে ডেটা "মোটেই আলাদা নয়"। এমনকি প্রতিটি পর্যবেক্ষণের পার্থক্য .00015 – .00020 এর মধ্যে থাকলে শূন্য থেকে পার্থক্যটিও পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হতে পারে। পালন!t 17tunlikely to emerge at least as large in another, similar pair of samples selected randomly from the same populations if the null hypothesis of no difference is literally true of those populationst17100,000

pop1=rep(15:20* .00001, 56);pop2=rep(0,336) #Some fake samples of sample size = 336
t.test(pop1,pop2,paired=T)                #Paired t-test with the following output...

t(335)=187.55,p<2.2×1016

এই নমুনাগুলি খুব ধারাবাহিকভাবে পৃথক হওয়ার কারণে, পার্থক্যটি পরিসংখ্যানগত তাত্পর্য অর্জন করে, যদিও সেগুলি আমাদের অনেকের তুলনায় স্বল্প পরিমাণে, দৈনন্দিন সংখ্যায় দেখা অভ্যস্ত। আসলে, আপনি .00001আমার গণনা আর কোডের প্রথম লাইনের সামনের দিকে যতটা জিরো হ্যান্ডেল করতে পারবেন তত পরিমাণ জিরো ট্যাক করে আপনি যতটা ডেটা স্কেল করতে পারবেন scale এটি তফাতগুলির প্রমিত বিচ্যুতিও কমিয়ে দেবে; অর্থাৎ, আপনার পার্থক্য ঠিক ততটাই সামঞ্জস্যপূর্ণ থাকবে, আপনার ঠিক একই থাকবে এবং এর তাত্পর্যও তত থাকবে।t

নাল অনুমানের তাৎপর্য পরীক্ষার এই আক্ষরিক অর্থে চেয়ে আপনি ব্যবহারিক তাত্পর্যটিতে আরও আগ্রহী হতে পারেন। ব্যবহারিক তাত্পর্য পরিসংখ্যানগত তাত্পর্য তুলনায় আপনার ডেটার অর্থের উপর অনেক বেশি নির্ভর করবে; এটি নিখুঁত পরিসংখ্যানগত বিষয় নয়। আমি এখানে একটি জনপ্রিয় প্রশ্নের উত্তরে এই নীতিটির একটি দরকারী উদাহরণ উদ্ধৃত করেছি , পি-মানগুলির সংযুক্ত দৃষ্টিভঙ্গি সমন্বিত :

কেউ একা আকারে সিদ্ধান্ত নিতে পারে না যে একটি যদি তা জীবন ও মৃত্যুর সাথে সম্পর্কিত হয় তবে তা গুরুত্বহীন [[(রোসানথাল, রুবিন, এবং রোসনো, ২০০০)]r=.03

এই "জীবন ও মৃত্যুর বিষয়টি" হৃৎপিণ্ডের আক্রমণে অ্যাসপিরিনের প্রভাবের আকার ছিল মূলত - সংখ্যার দিক থেকে ছোট, কার্যত গুরুত্বপূর্ণ অর্থের সাথে অনেক কম সামঞ্জস্যপূর্ণ পার্থক্যের একটি শক্তিশালী উদাহরণ। দৃ answers় উত্তর সহ আরও অনেক প্রশ্ন যা থেকে আপনি এখানে লিঙ্কগুলি প্রাপ্য হতে পারেন, সহ:

উল্লেখ

রোসান্থাল, আর।, রোসনো, আরএল, এবং রুবিন, ডিবি (2000)। আচরণগত গবেষণায় বৈপরীত্য এবং প্রভাবের আকার: একটি পারস্পরিক সম্পর্কযুক্ত পদ্ধতির । ক্যামব্রিজ ইউনিভার্সিটি প্রেস.


0

এখানে আর এর একটি উদাহরণ যা তাত্ত্বিক ধারণাগুলিকে কার্যকরভাবে দেখায়। ১০০০ বার একটি মুদ্রা উল্টানোর 10,000 ট্রায়াল যা .0001 এর মাথা হওয়ার সম্ভাবনা রয়েছে 10,000 টাকার একটি মুদ্রা উল্টানোর 10,000 ট্রায়ালের তুলনায় 10,000 বার যা .00011 এর মাথা হওয়ার সম্ভাবনা রয়েছে

t.test (rbinom (10000, 10000, .0001), rbinom (10000, 10000, .00011))

t = -8.0299, df = 19886.35, p-value = 1.03e-15 বিকল্প অনুমান: গড় পার্থক্য 0 95 শতাংশ আস্থা ব্যবধানের সমান নয়: -0.14493747 -0.08806253 নমুনা অনুমান: x এর গড় গড় 0.9898 1.1063

মানুষের পার্থক্য হিসাবে গড়ের পার্থক্যটি তুলনামূলকভাবে 0 এ বন্ধ হয়ে যায়, তবে এটি 0 এর চেয়ে পরিসংখ্যানগতভাবে পৃথক।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.