"বিজ্ঞানীরা পরিসংখ্যানগত তাত্পর্যের বিরুদ্ধে উঠেছেন" এর অর্থ কী? (প্রকৃতিতে মন্তব্য)


61

প্রকৃতি বিজ্ঞানীদের মন্তব্যে শিরোনামটি পরিসংখ্যানগত তাত্পর্যগুলির বিরুদ্ধে উঠে আসে :

ভ্যালেন্টিন আমরহেইন, স্যান্ডার গ্রিনল্যান্ড, ব্লেক ম্যাকশেন এবং ৮০০ এরও বেশি স্বাক্ষরকারীরা হাইপড দাবির অবসান এবং সম্ভবত গুরুত্বপূর্ণ প্রভাবগুলি বরখাস্ত করার আহ্বান জানিয়েছেন।

এবং পরে বিবৃতি ধারণ করে:

আবার, আমরা পি মান, আত্মবিশ্বাসের ব্যবধান বা অন্যান্য পরিসংখ্যানমূলক পদক্ষেপের উপর নিষেধাজ্ঞার পক্ষে পরামর্শ দিচ্ছি না - কেবল আমাদের এগুলি স্পষ্টভাবে আচরণ করা উচিত নয়। এর মধ্যে পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ বা না হিসাবে দ্বিকোটোমাইজেশন পাশাপাশি বেইস ফ্যাক্টরের মতো অন্যান্য পরিসংখ্যানমূলক ব্যবস্থাগুলির উপর ভিত্তি করে শ্রেণিবিন্যাস অন্তর্ভুক্ত রয়েছে।

আমি মনে করি আমি বুঝতে পারি যে নীচের চিত্রটি এটি বলে না যে দুটি অধ্যয়নের সাথে একমত হয় না কারণ একটি "কার্যকর" করে যখন অন্যটি তা করে না। তবে নিবন্ধটি আমি বুঝতে পারছি তার চেয়ে অনেক বেশি গভীরতায় চলেছে বলে মনে হচ্ছে।

শেষের দিকে মনে হয় চারটি পয়েন্টে একটি সংক্ষিপ্তসার রয়েছে। আমরা যারা পরিসংখ্যান লেখার চেয়ে পড়ি তাদের পক্ষে কি আরও সরল পদে এগুলি সংক্ষিপ্ত করা সম্ভব ?

সামঞ্জস্য অন্তর সম্পর্কে কথা বলার সময়, চারটি বিষয় মনে রাখবেন।

  • প্রথমত, অন্তর্নিহিত মানগুলি ডেটার সাথে সর্বাধিক সামঞ্জস্যপূর্ণ দেয় বলে অনুমানগুলি দেওয়া হয়, এর অর্থ এই নয় যে এর বাইরে মানগুলি অসম্পূর্ণ; তারা কেবল কম সামঞ্জস্যপূর্ণ ...

  • দ্বিতীয়ত, অনুমানগুলি দিয়ে সমস্ত মান মানের সাথে ডেটার সাথে সমানভাবে সামঞ্জস্য হয় না ...

  • তৃতীয়, 0.05 থ্রেশহোল্ডের মতো এটি এসেছিল, ডিফল্ট 95% অন্তরগুলি গণনা করার জন্য ব্যবহৃত হয় তা নিজেই একটি স্বেচ্ছাসেবী সম্মেলন ...

  • সর্বশেষ এবং সর্বোপরি, নম্র হোন: সামঞ্জস্যতা মূল্যায়নের ব্যবধান গণনা করতে ব্যবহৃত পরিসংখ্যানগত অনুমানগুলির যথার্থতার উপর জড়িত ...


প্রকৃতি: বিজ্ঞানীরা পরিসংখ্যানগত তাৎপর্যের বিরুদ্ধে উঠেছেন


13
মূলত, তারা গবেষণামূলক কাগজপত্রগুলি আরও বেশি ভুয়া পজিটিভ দিয়ে পূরণ করতে চায়!
ডেভিড

12
গেলম্যানের ব্লগে আলোচনাটি দেখুন: statmodeling.stat.columbia.edu/2019/03/20/… । স্পষ্টতই নিবন্ধটি কিছু বৈধ পয়েন্ট উত্থাপন করেছে, তবে জেলম্যানের উদ্ধৃতি হিসাবে এই নিবন্ধটির বিরুদ্ধে (এবং পৃথকভাবে পৃথকভাবে এর "আবেদনের" দিকের বিরুদ্ধেও) আয়নানিডিস কর্তৃক উত্থাপিত মন্তব্যগুলি দেখুন ।
অ্যামিবা বলেছেন

3
যদিও এটি কোনও নতুন ধারণা নয়। মেটা-বিশ্লেষণ 50 বছরের উন্নত অংশের জন্য একটি জিনিস হয়ে দাঁড়িয়েছে, এবং কোচরান গত 25 বছর ধরে চিকিত্সা / স্বাস্থ্যসেবা স্টাডিজের (যেখানে লক্ষ্য এবং ফলাফলগুলি মানীকরণ করা সহজ) এর মেটা-বিশ্লেষণ করে চলেছে।
গ্রাহাম

4
মূলত সমস্যাটি "অনিশ্চয়তা" হ্রাস করার চেষ্টা করছে যা একক সংখ্যায় বহুমাত্রিক সমস্যা।
ম্যাক্সডাব্লু

4
মূলত লোকেরা যদি খুঁজে বের করার সময় "X এবং Y এর সাথে সম্পর্কিত নয়" এর পরিবর্তে "আমরা X এবং Y এর মধ্যে কোনও মিল থাকার প্রমাণ পাইনি this তবে এই নিবন্ধটি সম্ভবত উপস্থিত থাকবে না। p>α
ফায়ারব্যাগ

উত্তর:


65

প্রথম তিনটি পয়েন্ট, যতদূর আমি বলতে পারি, একক যুক্তিতে ভিন্নতা।

বিজ্ঞানীরা প্রায়শই অনিশ্চয়তা পরিমাপ ( উদাহরণস্বরূপ, ,) সম্ভাব্যতা বন্টন হিসাবে দেখায় যা হিসাবে দেখায়:12±1

অভিন্ন সম্ভাব্যতা বিতরণ

যখন আসলে তারা আরো অনেক কিছু দেখতে কেমন করার সম্ভাবনা বেশি এই : এখানে চিত্র বর্ণনা লিখুন

একজন প্রাক্তন রসায়নবিদ হিসাবে, আমি নিশ্চিত করতে পারি যে অ-গাণিতিক ব্যাকগ্রাউন্ড (প্রাথমিকভাবে অ-শারীরিক রসায়নবিদ এবং জীববিজ্ঞানীদের) অনেক বিজ্ঞানী সত্যই বুঝতে পারেন না যে অনিশ্চয়তা (বা ত্রুটি, কারণ তারা এটি বলে) কাজ করার কথা। তারা আন্ডারগ্রাড পদার্থবিজ্ঞানের এমন একটি সময় স্মরণ করে যেখানে তাদের সম্ভবত তাদের ব্যবহার করতে হয়েছিল, সম্ভবত বিভিন্ন মাপের মাধ্যমে কোনও যৌগিক ত্রুটিও গণনা করতে হয়েছিল, তবে তারা সত্যই সেগুলি কখনই বুঝতে পারে নি। আমিও এর জন্য দোষী ছিলাম এবং ধরে নিয়েছিলাম সমস্ত পরিমাপ ব্যবধানের মধ্যে আসতে হবে । কেবলমাত্র (এবং বাইরে একাডেমিয়ার বাইরে), আমি কী খুঁজে পেয়েছি যে ত্রুটি পরিমাপ সাধারণত একটি নির্দিষ্ট মান বিচ্যুতিকে বোঝায়, পরম সীমা নয়।±

সুতরাং নিবন্ধে সংখ্যাযুক্ত পয়েন্টগুলি ভাঙ্গতে:

  1. সিআই-এর বাইরের পরিমাপগুলি এখনও হওয়ার সম্ভাবনা রয়েছে, কারণ আসল (সম্ভবত গাউসিয়ান) সম্ভাবনা সেখানে অ-শূন্য (বা যে কোনও জায়গাতেই, যদিও আপনি যখন খুব দূরে সরে আসেন তখন এগুলি অদৃশ্যভাবে ছোট হয়ে যায়)। যদি after পরে মানগুলি সত্যই একটি এসডির প্রতিনিধিত্ব করে তবে তারপরেও কোনও ডাটা পয়েন্টের 32% সম্ভাবনা রয়েছে।±

  2. বিতরণটি অভিন্ন নয় (সমতল শীর্ষে, প্রথম গ্রাফের মতো), এটি শীর্ষে রয়েছে। আপনি প্রান্তের চেয়ে মাঝখানে কোনও মান পাবেন। এটি একক ডাইয়ের পরিবর্তে একগুচ্ছ ডাইস ঘূর্ণায়মানের মতো।

  3. 95% হ'ল একটি স্বেচ্ছাসেবী কাট অফ, এবং প্রায় দুটি স্ট্যান্ডার্ড বিচ্যুতির সাথে মিলিত হয়।

  4. এই বিষয়টি সাধারণভাবে একাডেমিক সততা সম্পর্কে একটি মন্তব্য বেশি। আমার পিএইচডি করার সময় আমার একটি উপলব্ধি হ'ল বিজ্ঞান কিছু বিমূর্ত শক্তি নয়, এটি বিজ্ঞান করার চেষ্টা করা লোকদের সম্মিলিত প্রচেষ্টা। এই লোকেরা যারা মহাবিশ্ব সম্পর্কে নতুন জিনিস আবিষ্কার করার চেষ্টা করছেন, কিন্তু একই সাথে তাদের বাচ্চাদের খাওয়ানো এবং তাদের চাকরি রাখার চেষ্টা করা হচ্ছে, যা দুর্ভাগ্যক্রমে আধুনিক সময়ে মানে প্রকাশিত বা ধ্বংসের কিছু রূপ রয়েছে । বাস্তবে, বিজ্ঞানীরা আবিষ্কার এবং সত্য এবং আকর্ষণীয় উভয় উপর নির্ভর করে , কারণ উদ্বেগমূলক ফলাফল প্রকাশনা হয় না।

মতো স্বেচ্ছাসেবী থ্রেশহোল্ডগুলি প্রায়শই স্ব-স্থায়ী হতে পারে, বিশেষত যারা পরিসংখ্যান পুরোপুরি বোঝেন না এবং তাদের ফলাফলের জন্য পাস / ব্যর্থ স্ট্যাম্পের প্রয়োজন। যেমন, লোকেরা মাঝে মধ্যে অর্ধ-কৌতুকপূর্ণভাবে 'আপনি পরীক্ষা ' না পাওয়া পর্যন্ত আবার পরীক্ষা চালানোর বিষয়ে কথা বলেন। এটি খুব লোভনীয় হতে পারে, বিশেষত যদি পিএইচডি / অনুদান / কর্মসংস্থান উপর নির্ভর করে থাকে তবে এই প্রান্তিক ফলাফলগুলি পেতে, বিশ্লেষণে কাঙ্ক্ষিত পর্যন্ত প্রদর্শিত না হওয়া অবধি ।p<0.05p<0.05p=0.0498

এই ধরনের অনুশীলনগুলি সামগ্রিকভাবে বিজ্ঞানের জন্য ক্ষতিকারক হতে পারে, বিশেষত যদি এটি ব্যাপকভাবে করা হয়, সমস্তই প্রকৃতির চোখে এমন একটি সংখ্যার অনুসরণে, অর্থহীন। কার্যত এই অংশটি বিজ্ঞানীদের তাদের ডেটা এবং কাজ সম্পর্কে সৎ হওয়ার জন্য পরামর্শ দিচ্ছে, এমনকি যদি সেই সততা তাদের ক্ষতির কারণ হয়।


26
" + এর জন্য " ... প্রকাশ করুন বা ধ্বংস হওয়া অবধারিত রয়েছে reality বাস্তবে বিজ্ঞানীরা আবিষ্কার এবং সত্য এবং আকর্ষণীয় উভয়ই আবিষ্কারের উপর নির্ভর করে কারণ উদ্বেগজনক ফলাফল প্রকাশনা দেয় না "" বছরখানেক আগে একটি আকর্ষণীয় কাগজ প্রকাশিত হয়েছিল যে এই "প্রকাশ বা বিনষ্ট" কীভাবে একাডেমিয়া জুড়ে জটিল ত্রুটি / পক্ষপাতের দিকে নিয়ে যায় সে সম্পর্কে আলোচনা করা হয়: কেন সর্বাধিক প্রকাশিত গবেষণা ফলাফলগুলি মিথ্যা হয় (আইওনানিডিস, 2005)
জে টেলর

4
আমি "সত্যিকারের (সম্ভবত গাউসিয়ান) অনিশ্চয়তার সাথে ..." - এর সাথে একমত নই - গাউসিয়ান হ'ল অন্যরকম একটি রূপরেখা। এটি কেন্দ্রীয় সীমাবদ্ধ উপপাদকে ধন্যবাদ বলে হার্ড-সীমাবদ্ধ মডেলের চেয়ে কিছুটা ন্যায়সঙ্গত, তবে আসল বিতরণটি সাধারণত এখনও কিছু আলাদা।
বাম দিকের বাইরে

1
@ বামফ্রাউন্ডাব্যাউট প্রকৃত বিতরণটি এখনও সম্ভবত আলাদা, তবে মানটি শারীরিকভাবে অসম্ভব না হলে সম্ভাবনাটি সম্ভবত গাণিতিকভাবে ননজারো।
জারিত

3
@ বামফ্রন্টবাউন্ড এই বলে যে অনিশ্চয়তা সম্ভবত গাউসীয় অন্তর্নিহিত সরলকরণ নয়। এটি একটি পূর্ববর্তী বিতরণকে বর্ণনা করে, যা সিএলটি অন্য সমর্থনকারী তথ্যের অভাবে সেরা পূর্ব হিসাবে ন্যায়সঙ্গত, তবে বিতরণটি সম্পর্কে অনিশ্চয়তা প্রকাশ করে যে বিতরণটি গাউসিয়ান ইতিমধ্যে থাকতে পারে না এই স্বীকৃতিটি প্রকাশ করে।
উইল

7
নিঃসন্দেহে আপনি খুব, খুব ভুল অনেক বৈজ্ঞানিক শাখা (যেমন আমি আগেই বলেছি রসায়ন এবং জীববিজ্ঞান) প্রায় শূন্য গণিত ব্যবহার করে, বেসিক পাটিগণিতের পাশে। অন্যথায় উজ্জ্বল বিজ্ঞানীরা আছেন যারা প্রায় গণিত নিরক্ষর, এবং আমি তাদের কয়েকজনের সাথে দেখা করেছি।
ইঙ্গোলিফস

19

আপনার নিবন্ধটি এবং চিত্রটি বেশিরভাগই একটি খুব সাধারণ বিষয় তৈরি করেছেন:

কোনও প্রভাবের জন্য প্রমাণের অভাব এটি প্রমাণ নয় যে এর অস্তিত্ব নেই।

উদাহরণ স্বরূপ,

"আমাদের গবেষণায়, সায়ানাইড প্রদত্ত ইঁদুর পরিসংখ্যানগতভাবে - উল্লেখযোগ্য পরিমাণে উচ্চ হারে মারা যায়নি" এই দাবির প্রমাণ নয় "সায়ানাইডের মাউসের মৃত্যুর উপর কোনও প্রভাব নেই"।

ধরা যাক আমরা দুটি ইঁদুরকে একটি ডোজ সায়ানাইড দিই এবং তার মধ্যে একটি মারা যায়। দুটি ইঁদুরের নিয়ন্ত্রণ গ্রুপে, কেউ মারা যায় না। যেহেতু নমুনার আকার এত ছোট ছিল, এই ফলাফলটি পরিসংখ্যানগত দিক থেকে তাৎপর্যপূর্ণ নয় ( )। সুতরাং এই পরীক্ষাটি মাউস জীবনকালীন উপর সায়ানাইডের একটি পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ প্রভাব প্রদর্শন করে না। আমাদের কি এই উপসংহারে আসা উচিত যে সায়ানাইডের ইঁদুরের কোনও প্রভাব নেই? অবশ্যই না.p>0.05

তবে এই ভুলটি লেখকরা দাবি করেন বিজ্ঞানীরা নিয়মিত করেন।

আপনার চিত্রের উদাহরণস্বরূপ, খুব কম ইঁদুরের উপরের গবেষণা থেকে লাল রেখা উঠতে পারে, অন্যদিকে নীল রেখাটি একই গবেষণায় উত্থিত হতে পারে তবে অনেকগুলি ইঁদুরের উপরে।

লেখকরা পরামর্শ দিয়েছেন যে, প্রভাবের আকার এবং পি-মানগুলি ব্যবহার না করে বিজ্ঞানীরা পরিবর্তনের সম্ভাবনাগুলির পরিসীমা বর্ণনা করেছেন যা তাদের অনুসন্ধানগুলির সাথে কম-বেশি সামঞ্জস্যপূর্ণ। আমাদের দ্বি-মাউসের পরীক্ষায়, আমাদের লিখতে হবে যে আমাদের অনুসন্ধানগুলি উভয়ই সায়ানাইড খুব বিষাক্ত হওয়ার সাথে সামঞ্জস্যপূর্ণ এবং এটি মোটেও বিষাক্ত নয়। একটি 100-মাউস পরীক্ষায় আমরা পয়েন্ট আনুমানিকের সাথে মৃত্যুর আত্মবিশ্বাসের ব্যবধানের পরিসীমা পেতে পারি[60%,70%]65%। তারপরে আমাদের লিখতে হবে যে আমাদের ফলাফলগুলি এই ধারণার সাথে সর্বাধিক সামঞ্জস্যপূর্ণ যে এই ডোজটি 65% ইঁদুরকে হত্যা করে, তবে আমাদের ফলাফলগুলি শতকরা 60 শতাংশের চেয়ে কম বা 70 এরও বেশি এর সাথে সামঞ্জস্যপূর্ণ হবে এবং আমাদের ফলাফলগুলি কম সামঞ্জস্যপূর্ণ হবে এই সীমার বাইরে সত্যের সাথে। (এই সংখ্যাগুলি গণনা করতে আমরা কী পরিসংখ্যানগত অনুমান করি তাও আমাদের বর্ণনা করা উচিত describe)


4
"প্রমাণের অনুপস্থিতি অনুপস্থিতির প্রমাণ নয়" এর কম্বল বক্তব্যের সাথে আমি একমত নই। পাওয়ার গণনাগুলি আপনাকে নির্দিষ্ট আকারের একটি নির্দিষ্ট আকারের প্রভাব বিবেচনা করার সম্ভাবনা নির্ধারণ করে। বড় প্রভাবের মাপগুলিকে শূন্যের তুলনায় আলাদাভাবে বিবেচনা করার জন্য কম ডেটা প্রয়োজন হয়, যখন ছোট প্রভাবগুলির জন্য বড় আকারের নমুনার আকার প্রয়োজন। যদি আপনার অধ্যয়নটি সঠিকভাবে চালিত হয়, এবং আপনি এখনও উল্লেখযোগ্য প্রভাব দেখতে পাচ্ছেন না, তবে আপনি যুক্তিসঙ্গতভাবে সিদ্ধান্তে নিতে পারেন যে প্রভাবটির অস্তিত্ব নেই। আপনার যদি পর্যাপ্ত ডেটা থাকে তবে অ-তাত্পর্য প্রকৃতপক্ষে কোনও প্রভাব নির্দেশ করতে পারে।
নিউক্লিয়ার ওয়াং

1
@ নিউক্লিয়ার ওয়াং সত্য, তবে কেবলমাত্র পাওয়ার বিশ্লেষণ যদি সময়ের আগে করা হয় এবং কেবলমাত্র এটি সঠিক অনুমানগুলি দিয়ে করা হয় এবং তারপরে সঠিক ব্যাখ্যা (যেমন, আপনার শক্তিটি আপনি যে প্রভাবের পূর্বাভাস দিয়েছেন তার মাত্রার সাথে প্রাসঙ্গিক ; "80% শক্তি "এর অর্থ এই নয় যে শূন্য প্রভাবটি সঠিকভাবে সনাক্ত করার জন্য আপনার 80% সম্ভাবনা রয়েছে )। অতিরিক্তভাবে, আমার অভিজ্ঞতায় "অ-তাত্পর্যপূর্ণ" এর অর্থ "কোনও প্রভাব নেই" বোঝার জন্য প্রায়শই গৌণ ফলাফল বা বিরল ঘটনাগুলির ক্ষেত্রে প্রয়োগ করা হয় , যা অধ্যয়নটি (যথাযথভাবে) কোনওভাবেই চালিত হয় না। অবশেষে, বিটা সাধারণত >> আলফা হয়।
ব্রায়ান ক্রাউস

9
@ নিউক্লিয়ার ওয়াং, আমি মনে করি না যে কেউ "প্রমাণের অনুপস্থিতি হওয়ায় অনুপস্থিতির প্রমাণ নেই", আমি মনে করি তারা যুক্তি দিচ্ছেন যে এটির স্বয়ংক্রিয়ভাবে এটি ব্যাখ্যা করা উচিত নয়, এবং লোকেরা যে দেখছেন এটাই এটাই ভুল।
usul

এটি প্রায় সমতুল্য বা কোনও কিছুর জন্য পরীক্ষাগুলিতে প্রশিক্ষণপ্রাপ্ত নয় like
অ্যালেক্সিস

19

আমি চেষ্টা করবো.

  1. আত্মবিশ্বাসের ব্যবধান (যা তারা সামঞ্জস্যতা অন্তরটির নামকরণ করে) তথ্যের সাথে সর্বাধিক সামঞ্জস্যপূর্ণ পরামিতির মানগুলি দেখায়। তবে এর অর্থ এই নয় যে বিরতির বাইরে মানগুলি ডেটার সাথে একেবারেই বেমানান।
  2. আত্মবিশ্বাসের (মধ্যবর্তীতা) ব্যবধানের মধ্যবর্তী নিকটবর্তী মানগুলি বিরতির শেষের কাছের মানের চেয়ে ডেটার সাথে আরও সুসংগত।
  3. 95% কেবল একটি সম্মেলন। আপনি 90% বা 99% বা যে কোনও% বিরতি গণনা করতে পারেন।
  4. আত্মবিশ্বাস / সামঞ্জস্যের অন্তরগুলি কেবল তখনই কার্যকর হয় যদি পরীক্ষাটি সঠিকভাবে করা হয়েছিল, যদি বিশ্লেষণটি একটি প্রিসেট পরিকল্পনা অনুসারে করা হয়েছিল এবং বিশ্লেষণ পদ্ধতিগুলির অনুমানের সাথে ডেটা মেনে চলতে পারে। আপনার যদি খারাপ ডেটা খারাপভাবে বিশ্লেষণ করা হয়ে থাকে, তবে সামঞ্জস্যের ব্যবধানটি অর্থবহ বা সহায়ক নয়।

10

দুর্দান্ত এক্সকেসিডি সমস্যাটি চিত্রিত করে কিছুক্ষণ আগে এই কার্টুনটি করেছিল। যদি এর ফলাফলগুলি সরলভাবে অনুমান হিসাবে প্রমাণিত হিসাবে গণ্য করা হয় - এবং সবগুলি প্রায়শই হয় - তবে ২০ টি অনুমানের মধ্যে ১ টি তাই প্রমাণিত সত্যই মিথ্যা হবে। একইভাবে, যদি হিসাবে নেওয়া হয় disproving তারপর 20 জনের মধ্যে 1 জন সত্য অনুমানের একটি অনুমানের ভুলভাবে বাতিল করা হবে। পি-মানগুলি আপনাকে কোনও হাইপোথিসিস সত্য বা মিথ্যা কিনা তা জানায় না, তারা আপনাকে বলে যে অনুমানটি সম্ভবত সত্য বা মিথ্যা। দেখে মনে হচ্ছে যে রেফারেন্সযুক্ত নিবন্ধটি খুব সাধারণ-সরল জ্ঞানীয় ব্যাখ্যার বিরুদ্ধে ফিরে এসেছে।P>0.05P<0.05


8
(-1) পি-মানগুলি আপনাকে কোনও হাইপোথিসিস সম্ভবত সত্য বা মিথ্যা কিনা তা দেখায় না । আপনার এটির জন্য পূর্বের বিতরণ দরকার। উদাহরণস্বরূপ, এই xkcd দেখুন । সমস্যাবিহীন হাত-তরঙ্গ যে এই বিভ্রান্তির দিকে পরিচালিত করে তা হ'ল আমাদের যদি বৃহত সংখ্যার অনুমানের জন্য একই রকম প্রিয়ার থাকে, তবে পি-মানটি সম্ভাবনার সাথে সমানুপাতিক হবে এটি সত্য বা মিথ্যা। তবে কোনও ডেটা দেখার আগে কিছু অনুমান অন্যদের চেয়ে অনেক বেশি সম্ভাব্য!
ক্লিফ এবি

3
যদিও এই প্রভাবটি এমন কিছু যা ছাড় দেওয়া উচিত নয়, এটি রেফারেন্সযুক্ত নিবন্ধটির একটি উল্লেখযোগ্য বিষয় হতে পারে।
আরএম

6

tl; dr - বিষয়গুলি সম্পর্কযুক্ত নয় তা প্রমাণ করা মূলত অসম্ভব; যখন বিষয়গুলিরসাথে সম্পর্কিত হয় তখনই পরিসংখ্যানগুলি প্রদর্শন করতে ব্যবহৃত হতে পারে। এই সুপ্রতিষ্ঠিত সত্য সত্ত্বেও লোকেরা সম্পর্কের অভাবকে বোঝাতে পরিসংখ্যানগত তাত্পর্যটির ঘাটতি প্রায়শই ভুল ব্যাখ্যা করে।


একটি ভাল এনক্রিপশন পদ্ধতিতে একটি সিফারেক্সট তৈরি করা উচিত যা আক্রমণকারী যতদূর বলতে পারে, সুরক্ষিত বার্তার সাথে কোনও পরিসংখ্যানের সম্পর্ক বহন করে না। কারণ যদি কোনও আক্রমণকারী কোনও প্রকারের সম্পর্ক নির্ধারণ করতে পারে, তবে তারা কেবল সুরক্ষিত দর্শনগুলি দেখে আপনার সুরক্ষিত বার্তাগুলি সম্পর্কে তথ্য পেতে পারে - এটি একটি খারাপ জিনিস টিএম

তবে সিফারেক্সটেক্স এবং এর সাথে সম্পর্কিত প্লেইনেক্সটেক্স 100% একে অপরকে নির্ধারণ করে। সুতরাং এমনকি বিশ্বের সেরা গণিতবিদরা যত তাড়াতাড়ি চেষ্টা করেও কোনও উল্লেখযোগ্য সম্পর্ক খুঁজে না পান, আমরা এখনও স্পষ্টতই জানি যে সম্পর্কটি ঠিক সেখানে নেই, তবে এটি সম্পূর্ণ এবং সম্পূর্ণ নির্মূলবাদী। এই নির্ধারণবাদটি তখনও বিদ্যমান থাকতে পারে যখন আমরা জানি যে কোনও সম্পর্ক খুঁজে পাওয়া অসম্ভব

এটি সত্ত্বেও, আমরা এখনও এমন লোকদের পাই যারা এই জাতীয় জিনিসগুলি করবে:

  1. তারা " অস্বীকার " করতে চান এমন কিছু সম্পর্ক চয়ন করুন ।

  2. এটি সম্পর্কে কিছু অধ্যয়ন করুন যা অভিযোগের সম্পর্কটি সনাক্ত করতে অপ্রতুল।

  3. একটি পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ সম্পর্কের অভাবকে রিপোর্ট করুন।

  4. এটিকে সম্পর্কের অভাবে মোচড় দিন।

এটি সমস্ত ধরণের " বৈজ্ঞানিক গবেষণার " দিকে পরিচালিত করে যা মিডিয়া (মিথ্যাভাবে) কিছু সম্পর্কের অস্তিত্বকে অস্বীকারকারী হিসাবে রিপোর্ট করবে।

আপনি যদি নিজের চারপাশে নিজের স্টাডি ডিজাইন করতে চান তবে আপনি এটি করতে পারেন এমন অনেকগুলি উপায় রয়েছে:

  1. অলস গবেষণা:
    সবচেয়ে সহজ উপায়, এটি সম্পর্কে অবিশ্বাস্যভাবে অলস হওয়া। : এটা ঠিক যে চিত্রে প্রশ্নে লিঙ্ক থেকে মত । আপনি সহজেই যে কেবলমাত্র ছোট ছোট নমুনা আকারের দ্বারা, প্রচুর শব্দ এবং অন্যান্য বিভিন্ন অলস জিনিসকে অনুমতি দেয় by বাস্তবে আপনি যদি অলস না হন তবে যে কোনও ডেটা সংগ্রহ করুন, তারপরে আপনি ইতিমধ্যে সম্পন্ন করেছেন!

    'Non-significant' study(high P value)"

  2. অলস বিশ্লেষণ:
    কিছু নিরীহ কারণে, কিছু লোক মনে পিয়ারসন পারস্পরিক সম্পর্কের সহগের এর মানে " কোন পারস্পরিক সম্পর্ক "। যা সত্য, খুব সীমিত অর্থে। কিন্তু here're কিছু ক্ষেত্রে পালন করা: । এটি, " লিনিয়ার " সম্পর্ক নাও থাকতে পারে , তবে স্পষ্টতই আরও জটিল সম্পর্ক থাকতে পারে। এবং এটি " এনক্রিপশন " - লেভেল জটিল হওয়ার দরকার নেই , বরং " এটি আসলে একটি স্কুইগ্লি লাইনের কিছুটা " বা " দুটি সম্পর্ক রয়েছে " বা যা কিছু হোক না কেন।0

  3. অলস জবাব:
    উপরের চেতনায় আমি এখানেই যাচ্ছি। তো, ইয়া জানো, অলস হও!

তবে, গুরুত্ব সহকারে, নিবন্ধটি এটিকে ভালভাবে যোগ করে:

কী থামতে হবে সে সম্পর্কে স্পষ্ট হয়ে উঠুন: আমাদের কখনই 'তফাত' বা 'কোনও সমিতি' থাকা উচিত নয় কারণ একটি পি মান একটি প্রান্তিকের চেয়ে বড় হয় যেমন 0.05 বা সমতুল্য, কারণ একটি আত্মবিশ্বাসের ব্যবধানে শূন্য থাকে।


আপনার লেখার জন্য +1 হ'ল সত্য এবং চিন্তাভাবনা উভয়ই প্ররোচিত। তবে, আমার নম্র মতামতে, আপনি প্রমাণ করতে পারেন যে দুটি পরিমাণগুলি নির্দিষ্ট অনুমানের অধীনে যুক্তিসঙ্গতভাবে অসম্পর্কিত। আপনাকে প্রথমে অফকোর্সটি শুরু করতে হবে উদাহরণস্বরূপ সেগুলি সম্পর্কে একটি নির্দিষ্ট বিতরণ মনে করে, তবে এটি পদার্থবিজ্ঞানের আইন বা পরিসংখ্যানের ভিত্তিতে তৈরি করা যেতে পারে (উদাহরণস্বরূপ কোনও ধারকটিতে একটি গ্যাসের অণুর গতি গাউসিয়ান হবে বলে আশা করা যায়)
এনটিজি

3
@ এনটিজি হ্যাঁ, এই স্টাফটির কয়েকটি কীভাবে বলা যায় তা জানা শক্ত, তাই আমি অনেক কিছু ফেলে রেখেছি। আমি বলতে চাইছি, সাধারণ সত্যটি হ'ল আমরা অস্বীকার করতে পারি না যে কিছু সম্পর্ক বিদ্যমান, যদিও আমরা সাধারণত প্রমাণ করতে পারি যে একটি নির্দিষ্ট সম্পর্কের অস্তিত্ব নেই। এর মতো, আমরা সেট করতে পারি না যে দুটি ডেটা সিরিজ সম্পর্কিত নয়, তবে আমরা প্রতিষ্ঠিত করতে পারি যে তারা কোনও সাধারণ রৈখিক ফাংশন দ্বারা নির্ভরযোগ্যভাবে সম্পর্কিত বলে মনে হয় না।
নাট

1
-1 "টিএল; ডাঃ- বিষয়গুলি সম্পর্কযুক্ত নয় তা প্রমাণ করা মূলত অসম্ভব": সমতা পরীক্ষাগুলি একটি স্বেচ্ছাসেবী প্রভাব আকারের মধ্যে কোনও প্রভাবের অভাবে প্রমাণ দেয়।
অ্যালেক্সিস

2
@ অ্যালেক্সিস আমি মনে করি আপনি সমতুল্য পরীক্ষার ভুল বোঝেন; আপনি নির্দিষ্ট সম্পর্কের অনুপস্থিতির প্রমাণ হিসাবে সমতুল্য পরীক্ষার ব্যবহার করতে পারেন, যেমন একটি লিনিয়ার সম্পর্ক, তবে কোনও সম্পর্কের অনুপস্থিতির প্রমাণ নেই।
নাট

1
@ অ্যালেক্সিস স্ট্যাটিস্টিকাল ইনফারেন্স আপনাকে কিছু মডেলের প্রেক্ষাপটে নির্দিষ্ট প্রভাব আকারের চেয়ে বড় কোনও অভাবের প্রমাণের যোগান দিতে পারে । সম্ভবত আপনি ধরে নিচ্ছেন যে মডেলটি সর্বদা জানা যাবে?
নাট

4

সমস্যার একটি ডিড্যাক্টিক পরিচয় দেওয়ার জন্য, অ্যালেক্স রেইনহার্ট সম্পূর্ণরূপে অনলাইনে উপলভ্য একটি বই লিখেছিলেন এবং নো স্টার্ট প্রেসে (আরও সামগ্রী সহ) সম্পাদিত: https://www.statisticdonewrong.com

এটি পরিশীলিত গণিত ছাড়াই সমস্যার মূল ব্যাখ্যা করে এবং সিমুলেটেড ডেটা সেট থেকে উদাহরণ সহ নির্দিষ্ট অধ্যায় রয়েছে:

https://www.statisticsdonewrong.com/p-value.html

https://www.statisticsdonewrong.com/regression.html

দ্বিতীয় লিঙ্কে, একটি গ্রাফিকাল উদাহরণ পি-মান সমস্যা চিত্রিত করে। পি-মান প্রায়শই ডেটাসেটের মধ্যে পরিসংখ্যানগত পার্থক্যের একক সূচক হিসাবে ব্যবহৃত হয় তবে এটি নিজের দ্বারা পরিষ্কারভাবে যথেষ্ট নয়।

আরও বিস্তারিত উত্তরের জন্য সম্পাদনা করুন :

অনেক ক্ষেত্রে অধ্যয়নের লক্ষ্য হ'ল একটি নির্দিষ্ট ধরণের ডেটা পুনরুত্পাদন করা হয়, হয় শারীরিক পরিমাপ (নির্দিষ্ট পরীক্ষার সময় একটি এক্সিলিটরে কণার সংখ্যা বলুন) বা পরিমাণগত সূচক (ওষুধ পরীক্ষার সময় নির্দিষ্ট লক্ষণগুলি বিকাশকারী রোগীর সংখ্যার মতো)। উভয় ক্ষেত্রেই এই পরিস্থিতিতে, অনেকগুলি কারণ ত্রুটি বা সিস্টেমের বৈচিত্রগুলি (একই ড্রাগের জন্য লোকেরা বিভিন্নভাবে প্রতিক্রিয়া দেখায়) এর মতো পরিমাপের প্রক্রিয়াতে হস্তক্ষেপ করতে পারে। এই কারণেই প্রায়শই যদি সম্ভব হয় তবে প্রায়শই কয়েকবার পরীক্ষাগুলি করা হয় এবং হাজার হাজার রোগীর সংখ্যায় আদর্শভাবে ওষুধ পরীক্ষা করা হয়।

ডেটা সেটটি তখন পরিসংখ্যানগুলি ব্যবহার করে এর সর্বাধিক সাধারণ মানগুলিতে হ্রাস করা হয়: মানে, স্ট্যান্ডার্ড বিচ্যুতি এবং অন্যান্য। মডেলগুলির সাথে তাদের গড়ের সাথে তুলনা করার ক্ষেত্রে সমস্যাটি হ'ল পরিমাপ করা মানগুলি কেবলমাত্র সঠিক মূল্যবোধের সূচক, এবং পৃথক পরিমাপের সংখ্যা এবং যথাযথতার উপর নির্ভর করে পরিসংখ্যানগতভাবেও পরিবর্তিত হয়। আমাদের কাছে একটি ভাল অনুমান করার উপায় রয়েছে যার উপর ভিত্তি করে ব্যবস্থাগুলি একই রকম হতে পারে এবং কোনটি হয় না তবে কেবলমাত্র একটি নির্দিষ্ট নিশ্চিততা সহ। সাধারণ প্রান্তিকতা বলতে হয় যে আমাদের যদি বিশটির মধ্যে একটিরও কম ভুল হওয়ার কথা থাকে তবে দুটি মান দুটি আলাদা হয়, আমরা তাদেরকে "পরিসংখ্যানগতভাবে আলাদা" বিবেচনা করি (এটি এর অর্থ ), অন্যথায় আমরা উপসংহারে যাই না।P<0.05

এটি প্রকৃতির নিবন্ধে চিত্রিত বিজোড় সিদ্ধান্তে নিয়ে যায় যেখানে দুটি একই পদক্ষেপ একই গড় মান দেয় তবে নমুনার আকারের কারণে গবেষকরা উপসংহারে পৃথক হন। এটি এবং পরিসংখ্যানগত শব্দভাণ্ডার এবং অভ্যাসগুলি থেকে অন্যান্য বিজ্ঞানগুলি বিজ্ঞানগুলিতে আরও বেশি গুরুত্বপূর্ণ হয়ে উঠছে। সমস্যার অন্য দিকটি হ'ল লোকেরা ভুলে যায় যে তারা পরিসংখ্যান সংক্রান্ত সরঞ্জামগুলি ব্যবহার করে এবং তাদের নমুনাগুলির পরিসংখ্যানিক শক্তির যথাযথ যাচাইকরণ ছাড়াই কার্যকরভাবে সিদ্ধান্তে পৌঁছে।

অন্য একটি উদাহরণের জন্য, সম্প্রতি সামাজিক এবং জীবন বিজ্ঞানগুলি সত্যিকারের প্রতিরূপণ সঙ্কটের মধ্য দিয়ে যাচ্ছে যে কারণে বিখ্যাত গবেষণার যথাযথ পরিসংখ্যানের শক্তি পরীক্ষা করে না এমন লোকেরা দ্বারা প্রচুর পরিমাণে প্রভাব নেওয়া হয়েছিল (অন্যরা তথ্যগুলিকে মিথ্যা বলে উল্লেখ করেছেন) তবে এটি অন্য সমস্যা)।


3
কেবল একটি লিঙ্ক নয়, এই উত্তরের একটি " লিঙ্ক কেবল উত্তর " এর সমস্ত স্পষ্ট বৈশিষ্ট্য রয়েছে । এই উত্তরটির উন্নতি করতে দয়া করে উত্তরের মূল পয়েন্টগুলি অন্তর্ভুক্ত করুন। আদর্শভাবে, আপনার উত্তরটি উত্তর হিসাবে কার্যকর হওয়া উচিত এমনকি লিঙ্কগুলির বিষয়বস্তু অদৃশ্য হয়ে গেলেও।
আরএম

2
পি-মান এবং বেসের হারের ত্রুটি সম্পর্কে (আপনার লিঙ্কে উল্লিখিত), ভেরিটাসিয়াম এই ভিডিওটি বেইসিয়ান ট্র্যাপ বলে প্রকাশ করেছে ।
jjmontes

2
তবে দুঃখিত, আমি যত তাড়াতাড়ি সম্ভব উত্তরটি উন্নত ও বিকাশের চেষ্টা করব। আমার ধারণাটিও আগ্রহী পাঠকের জন্য দরকারী উপাদান সরবরাহ করা ছিল।
জি ক্লেভিয়ার

1
@ জি.ক্লেভিয়ার এবং স্ব-বর্ণিত পরিসংখ্যান নবাগত এবং কৌতূহলী পাঠক এটির প্রশংসা করে!
আহো

1
@ uhoh খুশি এটি পড়তে। :)
জি ক্লেভিয়ার

4

আমার জন্য, সবচেয়ে গুরুত্বপূর্ণ অংশটি ছিল:

... [আমরা] লেখকদের বিন্দু অনুমানটি নিয়ে আলোচনা করার আহ্বান জানাই, এমনকি যখন তাদের একটি বড় পি মান বা বিস্তৃত ব্যবধান থাকে, তবুও সেই ব্যবধানের সীমাটি নিয়ে আলোচনা করা হয়।

অন্য কথায়: প্রাক্কলন (কেন্দ্র এবং আত্মবিশ্বাসের ব্যবধান) নিয়ে আলোচনা করার উপর আরও বেশি জোর দিন এবং "নাল-হাইপোথিসিস টেস্টিং" এর উপর কম জোর দিন।

এটি বাস্তবে কীভাবে কাজ করে? প্রভাবের আকারগুলি পরিমাপ করতে প্রচুর গবেষণা ফোটে, উদাহরণস্বরূপ "আমরা ১.২০ এর ঝুঁকি অনুপাত পরিমাপ করেছি, ৯৯% সিআই এর সাথে 0.97 থেকে 1.33 রয়েছে"। এটি একটি গবেষণার উপযুক্ত সংক্ষিপ্তসার। আপনি তাত্ক্ষণিকভাবে সবচেয়ে সম্ভাব্য প্রভাবের আকার এবং পরিমাপের অনিশ্চয়তা দেখতে পাবেন। এই সংক্ষিপ্তসারটি ব্যবহার করে, আপনি দ্রুত এই অধ্যয়নের তুলনায় এটির মতো অন্যান্য অধ্যয়নের সাথে তুলনা করতে পারেন এবং আদর্শভাবে আপনি সমস্ত অনুসন্ধানগুলি একটি ওজনযুক্ত গড়ের সাথে একত্রিত করতে পারেন।

দুর্ভাগ্যক্রমে, এই ধরনের গবেষণাগুলি প্রায়শই সংক্ষিপ্তসারিত হয় "" আমরা ঝুঁকি অনুপাতের পরিসংখ্যানগতভাবে উল্লেখযোগ্য বৃদ্ধি পাইনি "। এটি উপরের অধ্যয়নের বৈধ উপসংহার। তবে এটি অধ্যয়নের উপযুক্ত সংক্ষিপ্তসার নয় , কারণ আপনি এই ধরণের সংক্ষিপ্তসারগুলি ব্যবহার করে সহজেই অধ্যয়নের তুলনা করতে পারবেন না। আপনি জানেন না কোন গবেষণায় সুনির্দিষ্ট পরিমাপ ছিল এবং আপনি মেটা-স্টাডির সন্ধানটি কী হতে পারে তা অনুধাবন করতে পারবেন না। এবং অধ্যয়নগুলি "অ-উল্লেখযোগ্য ঝুঁকি অনুপাত বৃদ্ধি" দাবি করার সাথে সাথে আপনি তত্ক্ষণাত্ উপস্থিত হন না যে এত বড় আত্মবিশ্বাসের ব্যবধান থাকলে আপনি তাদের মধ্যে একটি হাতি লুকিয়ে রাখতে পারেন।


এটি কারও নাল অনুমানের উপর নির্ভর করে। উদাহরণস্বরূপ, প্রত্যাখ্যান করা একটি নির্বিচারে ছোট চেয়ে বড় প্রভাবের অনুপস্থিতির প্রমাণ সরবরাহ করে । H0:|θ|ΔΔ
অ্যালেক্সিস

1
হ্যাঁ, তবে এমন হাইপোথিসিস নিয়ে আলোচনা করে কেন বিরক্ত করবেন? আপনি কেবল পরিমাপকৃত প্রভাবের আকার size এবং তারপরে সবচেয়ে ভাল / নিকৃষ্টতম মামলার র্যামফিকেশনগুলি কী তা নিয়ে আলোচনা করতে পারেন। এটি সাধারণত ফিজিক্সে করা হয়, উদাহরণস্বরূপ যখন প্রোটন এবং অ্যান্টিপ্রোটনের মধ্যে ভর-থেকে-চার্জ পার্থক্য পরিমাপ করা হয় । লেখকরা একটি নাল অনুমান তৈরি করতে বেছে নিতে পারতেন (সম্ভবত, আপনার উদাহরণ অনুসরণ করতে, যে পরম পার্থক্যটি কিছুটা চেয়ে বেশি ) এটি পরীক্ষা করার জন্য এগিয়ে গেছে, তবে এ জাতীয় আলোচনায় সামান্য যোগ হওয়া মূল্য নেই। θ±δθΔ
মার্টিন জেএইচ

3

এটি "তাৎপর্যপূর্ণ" যে পরিসংখ্যানবিদরা , কেবল বিজ্ঞানীরা নয়, উঠে এসে "তাত্পর্য" এবং মানগুলির looseিলে .ালা ব্যবহারের বিষয়ে আপত্তি তুলছেন । আমেরিকান পরিসংখ্যানবিদদের সাম্প্রতিকতম বিষয়টি পুরোপুরি এই বিষয়ে নিবেদিত। ওয়াসারম্যান, শিরম এবং লাজারের প্রধানত সম্পাদকীয় দেখুন। P


লিঙ্ক করার জন্য আপনাকে ধন্যবাদ! এটি চোখ খোলা; আমি বুঝতে পারি না যে এ সম্পর্কে এত চিন্তাভাবনা এবং বিতর্ক রয়েছে।
আহো

2

এটি একটি সত্য যে বিভিন্ন কারণে, পি-মানগুলি সত্যই একটি সমস্যায় পরিণত হয়েছে।

তবে, তাদের দুর্বলতা সত্ত্বেও, সরলতা এবং স্বজ্ঞাত তত্ত্বের মতো তাদের গুরুত্বপূর্ণ সুবিধা রয়েছে। সুতরাং, সামগ্রিকভাবে আমি প্রকৃতিতে থাকা মন্তব্যের সাথে একমত হয়েছি বলে আমি মনে করি যে পরিসংখ্যানগত তাত্পর্য পুরোপুরি খনন করার পরিবর্তে আরও সুষম সমাধানের প্রয়োজন। এখানে কয়েকটি বিকল্প রয়েছে:

১. " নতুন আবিষ্কারের দাবির জন্য পরিসংখ্যানগত তাৎপর্যের জন্য ডিফল্ট পি-মান প্রান্তিক পরিবর্তন "। আমার দৃষ্টিতে, বেঞ্জামিন এট আল একটি উচ্চ মানের প্রমাণ গ্রহণের বিরুদ্ধে সবচেয়ে জোরালো যুক্তিগুলিকে খুব ভালভাবে সম্বোধন করেছিলেন।

২. দ্বিতীয়-প্রজন্মের পি-মান গ্রহণ করাএগুলি শাস্ত্রীয় পি-মানগুলিকে প্রভাবিত বেশিরভাগ সমস্যার একটি যুক্তিসঙ্গত সমাধান বলে মনে হয় । ব্লুম এট আল এখানে যেমন বলেছিলেন , দ্বিতীয়-প্রজন্মের পি-মানগুলি "পরিসংখ্যান বিশ্লেষণে কঠোরতা, প্রজননযোগ্যতা এবং স্বচ্ছতা উন্নত করতে সহায়তা করতে পারে।"

3. redefining P-মান হিসাবে "নিশ্চিতভাবে একটি পরিমাণগত পরিমাপ - একটি" আস্থা সূচক "- এটা একটা পর্যবেক্ষিত সম্পর্ক, বা দাবি সত্য।" এটি বিশ্লেষণের লক্ষ্যটিকে তাত্পর্য অর্জন থেকে শুরু করে এই আত্মবিশ্বাসের যথাযথ অনুমান করাতে সহায়তা করতে পারে।

গুরুত্বপূর্ণভাবে, " পরিসংখ্যানগত তাত্পর্য বা " আত্মবিশ্বাস " (যা-ই হোক না কেন) এর ফলাফল দ্বারপ্রান্তে পৌঁছায় না এমন ফলাফলগুলি যদি কঠোর পদ্ধতিতে গুরুত্বপূর্ণ গবেষণামূলক প্রশ্নগুলি সম্বোধন করে তবে নেতৃস্থানীয় জার্নালে গুরুত্বপূর্ণ এবং যোগ্যতা প্রকাশনা হতে পারে।"

আমি মনে করি যে সাহায্য করতে পারে সঙ্গে আবেশ প্রশমিত P-মান নেতৃস্থানীয় পত্রিকা দ্বারা, যার মধ্যে অপব্যবহার পেছনে P-মান


আপনার উত্তরের জন্য ধন্যবাদ, এটি সহায়ক। আমি ব্লুম এট আল পড়তে কিছু সময় ব্যয় করব। সম্পর্কে দ্বিতীয় প্রজন্মের P-মান , এটা বেশ পাঠযোগ্য মনে করা হয়।
আহো

1
@ উহহ, খুশী যে আমার উত্তরটি আপনার প্রশ্নের পক্ষে সহায়ক।
ক্র্যান্টজ

1

একটি জিনিস যা উল্লেখ করা হয়নি তা হ'ল ত্রুটি বা তাত্পর্য হ'ল পরিসংখ্যানগত অনুমান, প্রকৃত শারীরিক পরিমাপ নয়: এগুলি আপনার উপলব্ধ ডেটার উপর নির্ভর করে এবং আপনি কীভাবে এটি প্রক্রিয়াজাত করেন। আপনি যদি প্রতিটি সম্ভাব্য ইভেন্ট পরিমাপ করেন তবে আপনি ত্রুটি এবং তাত্পর্যগুলির সঠিক মূল্য প্রদান করতে পারেন। এটি সাধারণত এটি থেকে দূরে হয় না!

অতএব, ত্রুটি বা তাত্পর্য সম্পর্কিত প্রতিটি অনুমান, এক্ষেত্রে প্রদত্ত কোনও পি-মান সংজ্ঞা অনুসারে সঠিক এবং এটিকে অন্তর্নিহিত গবেষণাটি বর্ণনা করার জন্য বিশ্বাস করা উচিত নয় - একাকী ঘটনা! - সঠিকভাবে। আসলে, উপস্থাপন করা হচ্ছে কী, ত্রুটিটি কীভাবে অনুমান করা হয়েছিল এবং ডেটা মান নিয়ন্ত্রণে কী করা হয়েছিল সে সম্পর্কে জ্ঞান ছাড়াই ফলাফল সম্পর্কে কিছু জানাতে বিশ্বাস করা উচিত নয়। উদাহরণস্বরূপ, আনুমানিক ত্রুটি হ্রাস করার একটি উপায় হ'ল বিদেশী অপসারণ। যদি এটি অপসারণটিও পরিসংখ্যানগতভাবে করা হয়, তবে আপনি কীভাবে প্রকৃতপক্ষে জানতে পারবেন যে অপ্রত্যাশিতরা প্রকৃত ত্রুটিগুলি ত্রুটিতে অন্তর্ভুক্ত হওয়া উচিত নয় তার পরিবর্তে প্রকৃত পরিমাপের পরিবর্তে ছিল? কীভাবে হ্রাস করা ত্রুটি ফলাফলের তাত্পর্যটি উন্নত করতে পারে? অনুমানের কাছাকাছি ভুল পরিমাপ সম্পর্কে কী? তারা উন্নতি ত্রুটি এবং পরিসংখ্যানগত তাত্পর্য প্রভাবিত করতে পারে তবে ভুল সিদ্ধান্তে নিয়ে যেতে পারে!

এই বিষয়টির জন্য, আমি শারীরিক মডেলিং করি এবং নিজে নিজে এমন মডেল তৈরি করেছি যেখানে 3-সিগমা ত্রুটি সম্পূর্ণ অনিচ্ছুক। এটি হ'ল, পরিসংখ্যানগতভাবে হাজারে একটি ইভেন্টের প্রায় কাছাকাছি রয়েছে (ভাল ... এর চেয়ে অনেক বেশি বার, তবে আমি খনন করি) যার ফলে সম্পূর্ণ হাস্যকর মান হবে। আমার ক্ষেত্রে 3 অন্তর ত্রুটির তীব্রতা প্রায় 1 সেন্টিমিটারের সর্বোত্তম সম্ভাব্য অনুমানটি এখন এবং তার পরে প্রতি মিটার হিসাবে পরিণত হওয়ার সমান। যাইহোক, আমার ক্ষেত্রের শারীরিক, অভিজ্ঞতামূলক ডেটা থেকে গণনা করা পরিসংখ্যানগত +/- অন্তর অন্তর্ভুক্ত করার সময় এটি প্রকৃতপক্ষে একটি গ্রহণযোগ্য ফলাফল is অবশ্যই, অনিশ্চয়তার ব্যবধানের সংকীর্ণতা সম্মান করা হয় তবে নামমাত্র ত্রুটির ব্যবধানটি বৃহত্তর হলেও এমনকি প্রায়শই সেরা অনুমানের প্রাক্কলনটির মূল্য আরও কার্যকর ফলাফল হয়।

পার্শ্ব নোট হিসাবে, আমি একবার এক হাজার আউটলেয়ারের মধ্যে একজনের জন্য ব্যক্তিগতভাবে দায়বদ্ধ ছিলাম। আমি যখন একটি ইভেন্টটি পরিমাপ করার কথা বলেছিলাম তখন আমি একটি সরঞ্জাম ক্রমাঙ্কিত করার প্রক্রিয়াধীন ছিলাম। হায়, সেই ডেটা পয়েন্টটি সেই ১০০ ভাঁজ আউটলিয়ারের মধ্যে ঠিক একটি হত, সুতরাং এক অর্থে, তারা ঘটে এবং মডেলিং ত্রুটিতে অন্তর্ভুক্ত!


"আপনি কেবলমাত্র যথাযথ পরিমাপ সরবরাহ করতে পারবেন, যদি আপনি প্রতিটি সম্ভাব্য ইভেন্ট পরিমাপ করেন" " হুম। সুতরাং, নির্ভুলতা হতাশ? এবং অপ্রাসঙ্গিক? নির্ভুলতা এবং পক্ষপাতের মধ্যে পার্থক্যটি প্রসারিত করুন। ভুল অনুমান কি পক্ষপাতদুষ্ট বা পক্ষপাতহীন? তারা যদি পক্ষপাতহীন হয়, তবে তারা কি কিছুটা কার্যকর হয় না? "উদাহরণস্বরূপ, ত্রুটি হ্রাস করার একটি উপায় হ'ল বহিরাগতদের অপসারণ করা।" হুম। এটি নমুনার বৈকল্পিকতা হ্রাস করবে, তবে "ত্রুটি"? "... প্রায়শই সেরা অনুমানের প্রাক্কলনের মান আরও কার্যকর ফলাফল হয় এমনকি নামমাত্র ত্রুটির ব্যবধানটি আরও বড় হতে পারে" আমি অস্বীকার করি না যে খারাপ পরীক্ষার চেয়ে ভাল একটি ভাল আগে ভাল।
পিটার লিওপল্ড

আপনার মন্তব্যের ভিত্তিতে পাঠ্যটিকে কিছুটা সংশোধন করেছেন। আমি যা বোঝাতে চেয়েছি তা হল পরিসংখ্যানগত ত্রুটির পরিমাপ সর্বদা একটি অনুমান হিসাবে যদি না আপনার কাছে সমস্ত সম্ভাব্য পৃথক পরীক্ষা থাকে, সুতরাং কথা বলার জন্য, উপলব্ধ। এটি খুব কমই ঘটে থাকে, যখন উদাহরণস্বরূপ কোনও নির্দিষ্ট সংখ্যক লোককে ভোট দেওয়া (বৃহত ভিড় বা সাধারণ জনগণের নমুনা হিসাবে নয়)।
গিনিমেটসুরি

1
আমি একজন প্র্যাকটিশনার যিনি পরিসংখ্যানবিদদের চেয়ে পরিসংখ্যান ব্যবহার করেন। আমি মনে করি পি মানগুলির সাথে একটি প্রাথমিক সমস্যা হ'ল অনেকে যা তাদের সাথে যথেষ্ট তাৎপর্য সহ বিভ্রান্ত করছে তার সাথে তাদের পরিচিত নয়। সুতরাং আমাকে valuesালগুলি বড় কিনা তা নির্বিশেষে পি মানগুলি ব্যবহার করে কোন slালুগুলি গুরুত্বপূর্ণ তা নির্ধারণ করতে বলা হয়েছে। অনুরূপ সমস্যাটি ভেরিয়েবলের আপেক্ষিক প্রভাব নির্ধারণের জন্য তাদের ব্যবহার করছে (যা আমার কাছে গুরুত্বপূর্ণ, তবে যা রিগ্রেশন সাহিত্যে আশ্চর্যজনকভাবে খুব কম মনোযোগ পায়)।
ব্যবহারকারী54285
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.