তাত্পর্য হিসাবে তাত্পর্য হিসাবে প্রভাব আকার


37

আজ, ক্রস ভ্যালিডেটেড জার্নাল ক্লাবে (আপনি সেখানে ছিলেন না কেন?), @ এমবিকিউ জিজ্ঞাসা করেছেন:

আপনি কি ভাবেন যে আমরা (আধুনিক তথ্য বিজ্ঞানীরা) তাৎপর্য বলতে কী বোঝে? এবং এটি কীভাবে আমাদের ফলাফলের প্রতি আমাদের আত্মবিশ্বাসের সাথে সম্পর্কিত?

@ মিশেল কিছু (সাধারণত আমাকে) সাধারণত উত্তর দেয়:

আমি আমার ক্যারিয়ারে চালিয়ে যাওয়ায় তাত্পর্য (পি-মানগুলির উপর ভিত্তি করে) ধারণাটি কম এবং কম সহায়ক খুঁজে পাচ্ছি। উদাহরণস্বরূপ, আমি অত্যন্ত বড় ডেটাসেটগুলি ব্যবহার করতে পারি তাই সমস্ত কিছু পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ( )p<.01

এটি সম্ভবত একটি মূ ?় প্রশ্ন, তবে অনুমানটি পরীক্ষা করা সমস্যা নয়? যদি আপনি নাল অনুমানটি "A সমান B হয়" পরীক্ষা করেন তবে আপনি জানেন উত্তরটি "না" know বড় ডেটা সেটগুলি আপনাকে কেবল এই অনিবার্য সত্য উপসংহারের নিকটে নিয়ে আসে। আমি বিশ্বাস করি এটি ডেমিংই ছিলেন যিনি একবার এই হাইপোথিসিসের সাথে উদাহরণ দিয়েছিলেন "" একটি ভেড়ার ডানদিকে চুলের সংখ্যা তার বাম দিকে চুলের সংখ্যার সমান। " ঠিক আছে, অবশ্যই না।

আরও ভাল অনুমান হবে "A এর চেয়ে বি এর চেয়ে আলাদা নয়"। অথবা, মেষশাবকের উদাহরণে, "একটি ভেড়ার পাশের চুলের সংখ্যা X% এর বেশি আলাদা হয় না"।

এটা কোনো কিছু হলো?


1) গড় সমতুল্যতার পরীক্ষা (এটি যা আপনি চান তা ধরে নিলে) কিছু ক্ষেত্রে তাদের গড় পার্থক্যের তাত্পর্যটির তাত্পর্যকে সহজতর করা যেতে পারে। এই পার্থক্য অনুমানের জন্য একটি স্ট্যান্ডার্ড ত্রুটি সহ, আপনি "আরও বি এর চেয়ে আলাদা না ..." ধরণের পরীক্ষার সব ধরণের করতে পারেন। ২) নমুনা আকারের জন্য - হ্যাঁ, বৃহত্তর এসএসের জন্য তাত্পর্যটির গুরুত্ব হ্রাস পায় তবে এটি এখনও ছোট নমুনাগুলির জন্য গুরুত্বপূর্ণ, যেখানে আপনি কেবল অতিরিক্ত মান তৈরি করতে পারবেন না।
ওন্দ্রেজ

11
পুনরায় "অবশ্যই না।" একটি অনুমান হিসাবে, প্রতিটি পাশের চুলের ক্রম অনুসারে একটি মেষশাবক থাকে । যদি এই জাতীয় চুলগুলির একটি সমান সংখ্যক থাকে এবং এগুলি উভয় পক্ষের সমান সম্ভাবনা সহ এলোমেলোভাবে বিতরণ করা হয় এবং পক্ষগুলি স্পষ্টভাবে বর্ণিত হয়, তবে উভয় সংখ্যা হুবহু সমান হওয়ার সম্ভাবনা 0.178%। কয়েক শতাধিক বিশাল ঝাঁকড়ায়, আপনি প্রতি দশকে কমপক্ষে একবারে এমন এক নিখুঁত সুষম ভেড়ার জন্মের আশা করতে হবে (ধরে নিই যে প্রায় 50% সময়ের কেশ হয়)। বা: প্রায় প্রতিটি পুরানো মেষ কৃষকের এমন মেষশাবক রয়েছে! 105
whuber

1
@ শুভ এটি বিশ্লেষণের উদ্দেশ্য দ্বারা নির্ধারিত হয়। একটি ভাল উপমাটি হ'ল ন্যূনতম প্রভাবের আকারের যা কোনও পরীক্ষার পরে ওষুধে আরও বিনিয়োগকে ন্যায়সঙ্গত করে তোলে। কেবলমাত্র একটি পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ প্রভাবের অস্তিত্বই যথেষ্ট নয়, কারণ কোনও ওষুধ বিকাশ ব্যয়বহুল এবং এর পার্শ্ব-প্রতিক্রিয়াও হতে পারে যা বিবেচনা করা দরকার। এটি কোনও পরিসংখ্যানগত প্রশ্ন নয়, তবে একটি ব্যবহারিক প্রশ্ন।
ডিকরান মার্সুপিয়াল

2
@ যেহেতু আমি সন্দেহ করি যে বেশিরভাগ অ্যাপ্লিকেশনগুলিতে যেখানে সুদের ন্যূনতম প্রভাবের আকার নির্ধারণের জন্য কোনও ব্যবহারিক তথ্য নেই, তবে আদর্শ অনুমানের পরীক্ষাটি ঠিক আছে, উদাহরণস্বরূপ স্বাভাবিকতার জন্য পরীক্ষা করা। বায়েশিয়ান হিসাবে আমি হাইপোথিসিস টেস্টিং সমস্যার পরিবর্তে অপটিমাইজেশন সমস্যা হিসাবে এই দৃষ্টিভঙ্গির সাথে একমত হব। হাইপোথিসিস পরীক্ষার সমস্যাগুলির অংশটি পরিসংখ্যান কুকবুকের পদ্ধতির ফলাফল থেকে প্রাপ্ত, যেখানে অনুশীলনের উদ্দেশ্য, বা ফলাফলের সত্যিকার অর্থ (অবশ্যই সমস্ত আইএমএইচও) বিবেচনা না করে পরীক্ষাগুলি traditionতিহ্য হিসাবে সম্পাদিত হয়।
ডিকরান মার্শুপিয়াল

1
@ ডিক্রানমারসুপিয়াল কী সেই চাবিকাঠি নয় যে ভাল পড়াশুনার ডিজাইনের গুরুত্বের চেয়ে নীচে গাং দ্বারা চিহ্নিত করা হিসাবে শিক্ষার্থীরা রট দিয়ে পরীক্ষা শেখানো হচ্ছে? অধ্যয়ন ডিজাইনের উপর জোর দেওয়া কি আরও কিছু সমস্যার সমাধান করতে সহায়তা করবে - অগত্যা বড় ডেটা সেট সহ?
মিশেল

উত্তর:


25

যতদূর তাত্পর্য পরীক্ষা হয় (বা অন্য কিছু যা মূলত তাত্পর্য পরীক্ষার মতো একই কাজ করে ), আমি দীর্ঘদিন ধরেই ভেবেছিলাম যে বেশিরভাগ পরিস্থিতিতে সেরা পদ্ধতির সম্ভাব্যতা সম্পর্কে একটি 95% আত্মবিশ্বাসের ব্যবধানের সাথে একটি মানযুক্ত প্রভাব আকারের অনুমান করা যায় প্রভাব আকার। সত্যিকার অর্থে এখানে নতুন কিছু নেই - গাণিতিকভাবে আপনি তাদের মধ্যে পিছনে পিছনে পরিবর্তন করতে পারেন - যদি কোনও 'শূন্য' শূন্যের জন্য p- মান <.05 হয়, তবে 0 টি 95% CI এর বাইরে থাকবে এবং এর বিপরীতে। এটির সুবিধাটি আমার মতে মনস্তাত্ত্বিক; এটি হ'ল এটি বিদ্যমান গুরুত্বপূর্ণ তথ্য তৈরি করে যা কেবলমাত্র প-মানগুলির প্রতিবেদন করার পরে লোকেরা দেখতে পায় না। উদাহরণস্বরূপ, এটি সহজেই দেখতে পাওয়া যায় যে একটি প্রভাব বন্যভাবে 'তাৎপর্যপূর্ণ' তবে হাস্যকরভাবে ছোট; বা 'অ-তাত্পর্যপূর্ণ', তবে কেবল ত্রুটি বারগুলি বিশাল হওয়ায় অনুমানিত প্রভাবটি আপনার প্রত্যাশার চেয়ে কম বা কম। এগুলি কাঁচা মান এবং তাদের সিআই এর সাথে যুক্ত করা যায়।

এখন, অনেক ক্ষেত্রে কাঁচা মানগুলি অন্তর্নিহিত অর্থবহ, এবং আমি স্বীকার করেছি যে আমাদের কাছে ইতিমধ্যে উপায় এবং opালু জাতীয় মান রয়েছে তা প্রদত্ত ইফেক্ট আকার আকারগুলি গণনা করা এখনও সার্থক কিনা এই প্রশ্নটি উত্থাপন করে। একটি উদাহরণ স্তম্ভিত বৃদ্ধি খুঁজছেন হতে পারে; আমরা জানি যে 20 বছর বয়সী, সাদা পুরুষের 6 +/- 2 ইঞ্চি সংক্ষিপ্ত হওয়া (যার অর্থ 15 +/- 5 সেমি) হবে তার অর্থ কী, অন্যথায় তাদের তুলনায়, তাই কেন উল্লেখ ? আমি মনে করি যে এখনও উভয়ই রিপোর্টিংয়ের মূল্য থাকতে পারে, এবং এগুলি গণনা করার জন্য ফাংশনগুলি রচনা করা যায় যাতে এটি খুব সামান্য অতিরিক্ত কাজ হয় তবে আমি স্বীকার করি যে মতামতগুলি পৃথক হবে। যে কোনও হারে, আমি যুক্তি দিয়েছি যে আত্মবিশ্বাসের অন্তরগুলির সাথে পয়েন্টের অনুমানগুলি আমার প্রতিক্রিয়ার প্রথম অংশ হিসাবে পি-মানগুলিকে প্রতিস্থাপন করে। d=1.6±.5

অন্যদিকে, আমি মনে করি একটি বড় প্রশ্ন হচ্ছে 'তাত্পর্যপূর্ণ পরীক্ষা যা আমরা সত্যই তা চাই তা করি?' আমি মনে করি আসল সমস্যাটি হ'ল বেশিরভাগ লোকেরা বিশ্লেষণ করে ডেটা (যেমন, অনুশীলনকারীরা পরিসংখ্যানবিদ নয়), তাত্পর্য পরীক্ষাটি বিশ্লেষণের সম্পূর্ণতা হয়ে উঠতে পারে। আমার কাছে মনে হয় যে সর্বাধিক গুরুত্বপূর্ণ বিষয়টি হল আমাদের ডেটা নিয়ে কী চলছে সে সম্পর্কে চিন্তাভাবনা করার মূলত উপায় এবং নাল অনুমানের তাত্পর্য পরীক্ষা করা, সর্বোপরি, এটির একটি খুব ছোট অংশ। আমাকে একটি কাল্পনিক উদাহরণ দেই (আমি স্বীকার করি যে এটি একটি ক্যারিকেচার, তবে দুর্ভাগ্যক্রমে, আমি ভয় করি যে এটি কিছুটা প্রশংসনীয়):

বব একটি অধ্যয়ন পরিচালনা করে, কিছু বা অন্য কোনও বিষয়ে ডেটা সংগ্রহ করে। তিনি আশা করেন যে তথ্যগুলি সাধারণত বিতরণ করা হবে, কিছু মানকে ঘিরে দৃ tight়ভাবে ক্লাস্টারিং করা হবে এবং তার ডেটা কিছু পূর্বনির্ধারিত মান থেকে 'উল্লেখযোগ্যভাবে পৃথক' আছে কিনা তা দেখার জন্য একটি নমুনা টি-পরীক্ষা করার ইচ্ছা করে। তার নমুনা সংগ্রহ করার পরে, তিনি তার ডেটাগুলি সাধারণত বিতরণ করা হয় কিনা তা পরীক্ষা করে দেখেন যে সেগুলি নেই are পরিবর্তে, তাদের কেন্দ্রে একটি উচ্চারিত পিণ্ড নেই তবে একটি নির্দিষ্ট ব্যবধানের তুলনায় তুলনামূলকভাবে বেশি এবং তারপরে লম্বা বাম লেজের সাহায্যে ট্রেল করা যায়। বব তার পরীক্ষা বৈধ কিনা তা নিশ্চিত করার জন্য তার কী করা উচিত তা নিয়ে উদ্বেগ প্রকাশ করেছেন। তিনি কিছু করে শেষ করেন (যেমন, রূপান্তর, একটি নন-প্যারাম্যাট্রিক পরীক্ষা ইত্যাদি), এবং তারপরে একটি পরীক্ষার পরিসংখ্যান এবং একটি পি-মান রিপোর্ট করে।

আমি আশা করি এটি কদর্য হিসাবে না আসে। আমি কারও সাথে বিদ্রূপ করা বলতে চাইছি না তবে আমি মনে করি এরকম কিছু ঘটনা মাঝে মধ্যে ঘটে। যদি এই দৃশ্যটি দেখা দেয় তবে আমরা সকলেই সম্মতি জানাতে পারি যে এটি হ'ল ডেটা বিশ্লেষণ। তবে সমস্যাটি এই নয় যে পরীক্ষার পরিসংখ্যান বা পি-ভ্যালুটি ভুল; আমরা প্রতিক্রিয়া জানাতে পারি যে ডেটা সেই ক্ষেত্রে সঠিকভাবে পরিচালিত হয়েছিল। আমি যুক্তি দিয়ে বলব যে সমস্যাটি বব ক্লিভল্যান্ডকে "রোট ডেটা অ্যানালাইসিস" বলে ডাকাতে ব্যস্ত। তিনি বিশ্বাস করেন বলে মনে হয় যে একমাত্র পয়েন্টটি সঠিক প-মান পাওয়া এবং এটি লক্ষ্য অনুসরণ করার বাইরে তার ডেটা সম্পর্কে খুব কম চিন্তা করে। তিনি এমনকি উপরে আমার পরামর্শটি সরিয়ে যেতে পারতেন এবং 95% আত্মবিশ্বাসের ব্যবধানের সাথে একটি প্রমিত আকারের প্রতিবেদন করতে পারতেন এবং আমি বৃহত্তর সমস্যা হিসাবে যা দেখি তা পরিবর্তিত হত না (মূলত একই জিনিসটি করার দ্বারা আমি এটি বোঝাতে চাইছিলাম) "ভিন্ন উপায়ে) এই নির্দিষ্ট ক্ষেত্রে, তথ্যটি তার প্রত্যাশার মতো দেখেনি (যেমন, স্বাভাবিক ছিল না) আসল তথ্য, এটি আকর্ষণীয়, এবং খুব সম্ভবত গুরুত্বপূর্ণ, কিন্তু সেই তথ্যটি মূলত কেবল ফেলে দেওয়া হয়। তাত্পর্য পরীক্ষার উপর ফোকাস দেওয়ার কারণে বব এটিকে চিনতে পারে না। আমার মনে, তাত্পর্যপূর্ণ পরীক্ষার ক্ষেত্রে এটিই আসল সমস্যা।

আমাকে উল্লেখ করা কয়েকটি অন্যান্য দৃষ্টিভঙ্গি সম্বোধন করা যাক এবং আমি খুব স্পষ্ট করে বলতে চাই যে আমি কারও সমালোচনা করছি না।

  1. প্রায়শই উল্লেখ করা হয় যে অনেক লোক সত্যই পি-মানগুলি বুঝতে পারে না (উদাহরণস্বরূপ, তারা নাল সত্য বলে মনে করে) ইত্যাদি। কখনও কখনও যুক্তিযুক্ত যে, যদি কেবল লোকেরা বেয়েশিয়ার পদ্ধতিকেই ব্যবহার করে, তবে এই সমস্যাগুলি ঘটত চলে যাও. আমি বিশ্বাস করি যে লোকেরা বায়েশিয়ান ডেটা বিশ্লেষণকে এমনভাবে উপস্থাপন করতে পারে যা ঠিক ততটাই দুষ্টু এবং যান্ত্রিক। তবে আমি মনে করি যে পি-মানগুলির অর্থের ভুল বোঝাবুঝি কম ক্ষতিকারক হবে যদি কেউ ভাবেন না যে পি-মান পাওয়ার লক্ষ্য ছিল।
  2. 'বিগ ডেটা'র অস্তিত্ব সাধারণত এই সমস্যার সাথে সম্পর্কিত নয়। বড় ডেটা কেবল এটি সুস্পষ্ট করে তোলে যে 'তাত্পর্য' প্রায় ডেটা বিশ্লেষণ সংগঠিত করা সহায়ক সাহায্যকারী নয় helpful
  3. হাইপোথিসিস পরীক্ষা করার সাথে সমস্যাটি রয়েছে বলে আমি বিশ্বাস করি না। লোকেরা যদি কেবলমাত্র এটি দেখতে চেয়েছিল যে আনুমানিক মানটি কোনও বিরতির বাইরে নয়, এটি বিন্দু মানের সমান হওয়ার চেয়ে, একই সমস্যাগুলির অনেকগুলি উত্থিত হতে পারে। (আবারও, আমি পরিষ্কার হতে চাই আমি জানি আপনি 'বব' নন ))
  4. রেকর্ডের জন্য, আমি উল্লেখ করতে চাই যে প্রথম অনুচ্ছেদ থেকে আমার নিজের পরামর্শটি, বিষয়টি উল্লেখ করে না , যেমন আমি উল্লেখ করার চেষ্টা করেছি।

আমার কাছে এটি মূল বিষয়: আমরা যা চাই তা হল যা ঘটেছিল তা চিন্তা করার মূলত উপায় । কোনও প্রদত্ত পরিস্থিতিতে এর অর্থ কী কেটে শুকানো হয় না। কোনও পদ্ধতি শ্রেণিতে শিক্ষার্থীদের এটি কীভাবে প্রেরণ করা যায় তা পরিষ্কার বা সহজ নয়। গুরুত্বের পরীক্ষার পিছনে প্রচুর জড়তা এবং traditionতিহ্য রয়েছে। একটি পরিসংখ্যান শ্রেণিতে, এটি কী শেখানো প্রয়োজন এবং কীভাবে তা স্পষ্ট। ছাত্র এবং অনুশীলনকারীদের পক্ষে উপাদান বোঝার জন্য একটি ধারণামূলক স্কিমা এবং বিশ্লেষণ পরিচালনা করার জন্য একটি চেকলিস্ট / ফ্লোচার্ট (আমি কিছু দেখেছি!) বিকাশ করা সম্ভব হয়। গুরত্বপূর্ণ বা অলস বা খারাপ কাউকে ছাড়াই গুরুত্ব পরীক্ষার প্রাকৃতিকভাবে রোট ডেটা বিশ্লেষণে বিকশিত হতে পারে। এটাই সমস্যা।


আমি আত্মবিশ্বাসের ব্যবধানগুলি পছন্দ করি :) একটি প্রশ্ন: আপনি কি বোঝাতে চেয়েছিলেন যে প্রভাবের আকারের এই পোস্ট গণনা ঠিক আছে?
মিশেল

@ মিশেল, আপনি "পোস্ট হক" বলতে কী বোঝায় তা পুরোপুরি নিশ্চিত নই, তবে সম্ভবত। উদাহরণস্বরূপ, আপনি কিছু ডেটা সংগ্রহ করেন, , এবং , তারপরে গণনা । এখন, এটি পক্ষপাতদুষ্ট এবং সহজ পরিস্থিতি, তবে আপনি ধারণাটি পাবেন। ˉ এক্স 2=14এসডি=6=.67x¯1=10x¯2=14SD=6d=.67
গুং - মনিকা পুনরায়

হ্যাঁ আমি মনে করি আমরা এখানে একমত হচ্ছি।
মিশেল

+1 বব এর গল্প আমাকে এটার
কার্লোস অ্যাকোলি

+1 আমি নিজের থেকে বিশ্বাসযোগ্য অন্তর পছন্দ করি। পয়েন্ট 1 সম্পর্কিত আমি যুক্তি দেব যে বায়েসিয়ান বিকল্পগুলির ফলে রোট ডেটা বিশ্লেষণের ফলস্বরূপ কম সম্ভাবনা রয়েছে, কারণ সম্ভাবনার সংজ্ঞাটি এতটা স্বতঃস্ফূর্ত নয়, যা আপনি আসলে একটি পরিসংখ্যানগত পদ্ধতিতে জিজ্ঞাসা করতে চান এমন প্রশ্নটি তৈরি করা আরও সহজ করে তোলে makes । আসল সমস্যাটি নিহিত রয়েছে যে পরীক্ষাটি সম্পাদন করার জন্য আন্তঃবিভাজন প্রয়োজন, যা এই জাতীয় পদ্ধতিগুলি ব্যাপকভাবে গ্রহণ করা খুব কঠিন। আশা করা যায় যে সফ্টওয়্যারটি সেই বিন্দুতে বিকশিত হবে যেখানে ব্যবহারকারী প্রশ্ন গঠনের ক্ষেত্রে মনোনিবেশ করতে পারে এবং বাকীটি কম্পিউটারে রেখে দিতে পারে।
ডিকরান মার্সুপিয়াল

18

আমরা পরিসংখ্যানগুলিতে কোনও ধরণের হাইপোথিসি পরীক্ষার জন্য কেন জোর দিই ?

প্রিন্সিপাল আর্গুমেন্ট রবার্ট অ্যাবেলসন স্ট্যাটিসটিকস হিসাবে একটি দুর্দান্ত বইয়ে যুক্তি দিয়েছেন যে পরিসংখ্যান বিশ্লেষণ প্রশ্নবিদ্ধ বিষয়টি সম্পর্কে মূলত যুক্তির অংশ। তিনি বলেছিলেন যে প্রত্যাখাত বা প্রত্যাখ্যানযোগ্য বা প্রত্যাখ্যানযোগ্য (বা এমনকি স্বীকৃত !?!)) অনুমান হিসাবে মূল্যায়ন করার পরিবর্তে আমাদের সেটিকে MAGIC মানদণ্ডের ভিত্তিতে মূল্যায়ন করা উচিত:

বিশালতা - এটি কত বড়? বক্তব্য - এটি ব্যতিক্রম পূর্ণ? এটা কি পরিস্কার? সাধারণতা - এটি সাধারণত প্রয়োগ হয় কীভাবে? আকর্ষণীয়তা - আমরা ফলাফল সম্পর্কে যত্নশীল? বিশ্বাসযোগ্যতা - আমরা কি এটি বিশ্বাস করতে পারি?

আমার ব্লগে আমার বইটির পর্যালোচনা


4
সমস্যাটি কিছু অধ্যাপক দ্বারা উদ্বেগিত হয়। আমার পিএইচডি সাইকোমেট্রিক্সে রয়েছে, যা মনোবিজ্ঞান বিভাগে রয়েছে। আমি শুনেছি বিভাগের অন্যান্য অংশের অধ্যাপকরা "কেবলমাত্র পি-ভ্যালু রিপোর্ট করুন, এটিই গুরুত্বপূর্ণ"। আমার কাজটি বেশিরভাগ ক্ষেত্রে স্নাতক শিক্ষার্থী এবং সামাজিক, আচরণগত, শিক্ষামূলক এবং চিকিত্সা ক্ষেত্রে গবেষকদের সাথে পরামর্শ করে। ডক্টরাল কমিটিগুলি যে পরিমাণ ভুল তথ্য দিয়েছে তা অবাক করার মতো।
পিটার ফ্লুম - মনিকা পুনরায়

1
"কেন ..." এর জন্য +1, আমি আমার উত্তরটি পেতে যা চেষ্টা করেছিলাম তার একটি বড় অংশ।
গুং - মনিকা পুনরায়

আমার উত্তরে আমি যা পেতে চেষ্টা করছিলাম তার আরেকটি অংশ হ'ল আমি মনে করি এটি প্রাকৃতিকভাবে ঘটেছিল। বিটিডব্লিউ, কোনও ন্যায্য দুটি উপগ্রহ পাচ্ছে না ;-), আপনি এগুলি একত্রিত করতে পারেন।
গুং - মনিকা পুনরায়

13

আপনার শেষ প্রশ্নটি কেবল না: আজকাল বুদ্ধিমান শিল্প পরিসংখ্যানবিদরা উল্লেখযোগ্য পার্থক্যের জন্য নয় তবে তাৎপর্যপূর্ণ সমতার জন্য, যা form ফর্মের একটি নাল অনুমানের পরীক্ষা করছেন do যেখানে ব্যবহারকারীর দ্বারা সেট করা হয় এবং প্রকৃতপক্ষে "প্রভাবের আকার" ধারণার সাথে সম্পর্কিত। সর্বাধিক সাধারণ সমতুল্য পরীক্ষা হ'ল তথাকথিত টোস্ট । তবুও টোস্ট কৌশলটি প্রমাণ করে যে দুটি অর্থ এবং উল্লেখযোগ্য significantly , উদাহরণস্বরূপ কিছু পরিমাপ পদ্ধতির গড় মূল্য এবংH0:{|μ1μ2|>ϵ}ϵμ1μ2ϵμ1μ2অন্য পরিমাপের পদ্ধতির জন্য, এবং অনেক পরিস্থিতিতে পর্যবেক্ষণের মধ্যে না হয়ে উপায়ের তুলনায় সমতা মূল্যায়ন করা আরও বোধগম্য। এটি করার জন্য আমরা পরিমাণের উপর অনুমানের পরীক্ষা করতে পারি , এবং এই জাতীয় অনুমান পরীক্ষাটি সহনশীলতার অন্তরগুলির সাথে সম্পর্কিত।Pr(|X1X2|>ϵ)


(+1) এবং, 1000 খ্যাতিতে আপনাকে স্বাগতম। চিয়ার্স।
কার্ডিনাল

6

Effectতিহ্যগত হাইপোথিসিস পরীক্ষাগুলি আপনাকে বলে যে কোনও অস্তিত্বের অস্তিত্বের জন্য পরিসংখ্যানগতভাবে উল্লেখযোগ্য প্রমাণ রয়েছে কিনা, তবে আমরা প্রায়শই যা জানতে চাই তা কার্যত গুরুত্বপূর্ণ প্রভাবের প্রমাণের অস্তিত্ব।

বেইসিয়ান "হাইপোথিসিস টেস্টস" ন্যূনতম প্রভাবের আকারের সাথে গঠন করা সম্ভব (আইআইআরসি "ইনফরমেশন থিওরি, ইনফারেন্সেশন এবং লার্নিং অ্যালগরিদমস" এর ডেভিড ম্যাকের বইতে এর উদাহরণ রয়েছে, আমি যখন আমি একটি মুহূর্ত থাকি তখন এটি সন্ধান করব) ।

সাধারণতা পরীক্ষা করা আরও একটি ভাল উদাহরণ, আমরা সাধারণত জানি যে তথ্যগুলি সত্যিকার অর্থে সাধারণত বিতরণ করা হয় না, আমরা কেবল এটি পরীক্ষা করার জন্য এটি প্রমাণ করছি যে এটি কোনও যুক্তিসঙ্গত অনুমান নয়। বা মুদ্রার পক্ষপাতদুষ্টের জন্য পরীক্ষা করা, আমরা জানি এটি অসিমেট্রিক হওয়ায় এটি সম্পূর্ণ পক্ষপাতদুষ্ট হওয়ার সম্ভাবনা নেই।


6

এর মধ্যে অনেকটাই নেমে আসে আপনি আসলে কোন প্রশ্নটি জিজ্ঞাসা করছেন, আপনি কীভাবে আপনার অধ্যয়নকে ডিজাইন করেন, এমনকি আপনি সমান দ্বারা কী বোঝাতে চেয়েছিলেন তাও আসে।

আমি একবার ব্রিটিশ মেডিকেল জার্নালে একটি আকর্ষণীয় ছোট্ট প্রবেশ করানোর জন্য দৌড়ে গিয়েছিলাম যা লোকেরা নির্দিষ্ট কয়েকটি পর্যায়ের অর্থ কী বোঝাতে চেয়েছিল সে সম্পর্কে কথা বলেছিল। দেখা যাচ্ছে যে "সর্বদা" এর অর্থ হতে পারে যে সময়ের 90% হিসাবে কিছুটা কম ঘটে (বিএমজে ভলিউম 333 26 আগস্ট 2006 পৃষ্ঠা 445)। সুতরাং সমান এবং সমতুল্য (বা এক্স এর কিছু মানের জন্য X% এর মধ্যে) একই জিনিসটিকে বোঝাতে পারে বলে মনে করা যেতে পারে। এবং কম্পিউটারকে আর ব্যবহার করে একটি সাধারণ সমতা জিজ্ঞাসা করুন:

> (1e+5 + 1e-50) == (1e+5 - 1e-50)
[1] TRUE

এখন একটি খাঁটি গণিতবিদ অসীম নির্ভুলতার সাথে বলতে পারেন যে এই 2 টি মান সমান নয়, তবে আর বলেছেন যে তারা হ'ল এবং বেশিরভাগ ব্যবহারিক ক্ষেত্রে তারা হবে (আপনি যদি আমাকে (1e + 5 + 1e-50) দেওয়ার প্রস্তাব দেন তবে) পরিমাণটি হিসাবে শেষ হয়েছিল (1e + 5 - 1e-50) আমি অর্থ প্রত্যাখ্যান করব না কারণ এটি প্রতিশ্রুতি দেওয়া থেকে পৃথক ছিল)।$$

আমাদের বিকল্প অনুমানটি যদি আমরা প্রায়শই হিসাবে যদিও প্রযুক্তিগতভাবে আসল তবে আমরা সমতা নিয়ে নাল হিসাবে কাজ করি যেহেতু যদি আমরা দেখাতে পারি যে চেয়ে বড়, তবে আমরা আরও জানি যে এটি চেয়ে কম মানগুলির চেয়ে বড় । এবং একটি দ্বি-পুচ্ছ পরীক্ষা সত্যই মাত্র 2 টি-লেজযুক্ত পরীক্ষা নয়? সর্বোপরি, আপনি কি সত্যই say of কোন দিকে আছেন তা বলতে অস্বীকার করবেন ? আংশিক কারণেই যখন সম্ভব হয় তখন পি-মানগুলির জায়গায় আত্মবিশ্বাসের ব্যবধানগুলি ব্যবহার করার দিকে ঝোঁক থাকে, যদি আমার আত্মবিশ্বাসের ব্যবধানHa:μ>μ0H0:μ=μ0H0:μμ0μμ0μ0μμ0μ0 μμ অন্তর্ভুক্ত তারপর যখন আমি বিশ্বাস করতে চাই যে ইচ্ছুক নাও হতে পারে করতে সমান ঠিক , আমি নির্দিষ্ট করে বলতে পারি না যার পাশ উপর মিথ্যা সেগুলিও এর সাথে সাথে ব্যবহারিক উদ্দেশ্যে সমান হতে হতে পারে মানে ।μ0μμ0μ0 μ

এর অনেক কিছুই সঠিক প্রশ্ন জিজ্ঞাসা করতে এবং সেই প্রশ্নের জন্য সঠিক অধ্যয়নের নকশা তৈরি করতে আসে। আপনি যদি ব্যবহারিকভাবে অর্থহীন পার্থক্যটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ তা দেখানোর জন্য পর্যাপ্ত ডেটা শেষ করেন তবে আপনি এতগুলি ডেটা পাওয়ার সংস্থানগুলি নষ্ট করেছেন। অর্থবোধক পার্থক্য কী হবে তা সিদ্ধান্ত নেওয়া এবং অধ্যয়নটি আপনাকে সেই পার্থক্যটি সনাক্ত করার জন্য যথেষ্ট শক্তি দেওয়ার চেয়ে কম নয় তবে এটির চেয়েও ভাল হত।

এবং যদি আমরা সত্যিই কেশকে আলাদা করতে চাই, তবে আমরা কীভাবে সংজ্ঞা দেব যে মেষশাবকের কোন অংশটি ডানদিকে এবং কোনটি বামে রয়েছে? যদি আমরা এটি একটি লাইনের দ্বারা সংজ্ঞায়িত করি যে সংজ্ঞা অনুসারে প্রতিটি পাশে সমান সংখ্যক চুল রয়েছে তবে উপরের প্রশ্নের উত্তরটি "অফ কোর্স এটি" হয়ে যায়।


আমি সন্দেহ করি যে আপনি আর এর কাছ থেকে পেয়েছেন উত্তর হ'ল কিছু ভাসমান পয়েন্ট গণিত সমস্যার ফল, অপ্রাসঙ্গিক পার্থক্য উপেক্ষা করার সচেতন সিদ্ধান্ত নয়। ক্লাসিক উদাহরণ বিবেচনা করুন (.1 + .2) == .3 একটি "খাঁটি গণিতবিদ" আপনাকে বলবে যে তারা যথাযথতার যে কোনও স্তরে সমান, তবুও R মিথ্যা প্রত্যাবর্তন করে।
গালা

@ গ্যাললরানস, আমার বক্তব্যটি হ'ল গোল করার কারণে (মানুষের দ্বারা নির্ধারিত হোক বা কম্পিউটারের দ্বারা) পর্যাপ্ত ছোট এক্স এর জন্য ঠিক সমান এবং এক্স% এর মধ্যে ধারণাগুলি কার্যত একই রকম।
গ্রেগ স্নো

5

সাংগঠনিক দৃষ্টিকোণ থেকে, নীতিগত বিকল্পগুলির সাথে সরকার হোক বা কোনও সংস্থা কোনও নতুন প্রক্রিয়া / পণ্য রোল করানোর জন্য সন্ধান করবে, সাধারণ ব্যয়-বেনিফিট বিশ্লেষণের ব্যবহারও সহায়তা করতে পারে। আমি অতীতে যুক্তি দিয়েছি যে (রাজনৈতিক কারণগুলি উপেক্ষা করে) একটি নতুন উদ্যোগের পরিচিত ব্যয়টি দেওয়া, সেই উদ্যোগের দ্বারা ইতিবাচকভাবে প্রভাবিত হওয়া সংখ্যক লোকের বিরতি এমনকি কী? উদাহরণস্বরূপ, নতুন উদ্যোগটি যদি আরও বেশি বেকার লোককে কাজে লাগাতে হয় এবং এই উদ্যোগের ব্যয় হয় $100,000তবে এটি $100,000কি কমপক্ষে বেকার স্থানান্তর হ্রাস পেতে পারে ? যদি তা না হয় তবে উদ্যোগের প্রভাবটি কার্যত তাৎপর্যপূর্ণ নয়।

স্বাস্থ্যগত ফলাফলের জন্য, একটি পরিসংখ্যান জীবনের মূল্য গুরুত্ব গ্রহণ করে। এর কারণ হ'ল স্বাস্থ্য বেনিফিটগুলি আজীবন উপার্জিত হয় (এবং তাই বেনিফিটগুলি ছাড়ের হারের উপর ভিত্তি করে নীচে অভিযোজিত হয় )। সুতরাং পরিসংখ্যানগত তাত্পর্য পরিবর্তে, একজন কীভাবে একটি পরিসংখ্যান জীবনের মূল্য নির্ধারণ করতে হবে এবং কোন ছাড়ের হারটি প্রয়োগ করা উচিত সে সম্পর্কে তর্ক পাওয়া যায়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.