এটিই কি পি-মান সমস্যার সমাধান?


67

ফেব্রুয়ারী ২০১ 2016 সালে, আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশন পরিসংখ্যানগত তাত্পর্য এবং পি-মানগুলির বিষয়ে একটি আনুষ্ঠানিক বিবৃতি প্রকাশ করেছে। এটি সম্পর্কে আমাদের থ্রেড এই বিষয়গুলি ব্যাপকভাবে আলোচনা করে। তবে এখন পর্যন্ত কোনও কর্তৃপক্ষ সর্বজনীনভাবে স্বীকৃত কার্যকর বিকল্প প্রস্তাব দেওয়ার জন্য সামনে আসে নি। আমেরিকান স্ট্যাটিস্টিকাল সোসাইটি (এএসএস) এর প্রতিক্রিয়া প্রকাশ করেছে, পি-মান: এর পরে কী?

"পি-মান খুব একটা ভাল নয়।"

আমরা মনে করি এএসএ খুব বেশি এগিয়ে যায় নি। এখন সময় স্বীকার করার যে পি-মানগুলির যুগ শেষ হয়ে গেছে। পরিসংখ্যানবিদরা এগুলিকে সফলভাবে আন্ডারগ্রাজুয়েটদের, কৌতুক বিজ্ঞানী এবং বোকা সম্পাদকদের সর্বত্র বিভ্রান্ত করার জন্য ব্যবহার করেছেন, তবে বিশ্বটি এই ব্যবহারের মধ্য দিয়ে দেখতে শুরু করেছে। সিদ্ধান্ত গ্রহণ নিয়ন্ত্রণের জন্য পরিসংখ্যানবিদদের দ্বারা আমাদের বিশ শতকের এই প্রারম্ভিকে ত্যাগ করতে হবে। আমাদের আসলে কী কাজ করে তা ফিরিয়ে নেওয়া উচিত

অফিসিয়াল এএসএস প্রস্তাবটি হ'ল:

পি-ভ্যালুগুলির স্থলে, এএসএস স্টপ (সিট-অফ-প্যান্ট পদ্ধতি) এর পক্ষে হয়। প্রাচীন গ্রীক, নবজাগরণ পুরুষ এবং সমস্ত বিজ্ঞানী রোনাল্ড ফিশার না এসে সমস্ত জিনিস নষ্ট না করা পর্যন্ত এই সময়ের সম্মানিত ও পরীক্ষিত পদ্ধতিটি ব্যবহার করেছিলেন। স্টপ সহজ, সরাসরি, ডেটা-চালিত এবং প্রামাণিক। এটি চালিয়ে যাওয়ার জন্য, একটি কর্তৃপক্ষের চিত্র (একজন প্রবীণ পুরুষ, পছন্দ অনুসারে) ডেটা পর্যালোচনা করে সিদ্ধান্ত নেয় যে তারা তার মতামতের সাথে একমত কিনা। যখন তিনি সিদ্ধান্ত নেন তারা করেন, ফলাফলটি "তাৎপর্যপূর্ণ" Otherwise অন্যথায় এটি হয় না এবং প্রত্যেককে পুরো জিনিসটি ভুলে যাওয়া দরকার।

মূলনীতি

প্রতিক্রিয়া এএসএর ছয়টি নীতিকে সম্বোধন করে।

  1. STOP নির্দিষ্ট পরিসংখ্যানের মডেলটির সাথে ডেটাটি কতটা বেমানান তা নির্দেশ করতে পারে।

    আমরা এই বাক্যাংশটি পছন্দ করি কারণ এটি স্টপ বলার মতো অভিনব উপায় হ্যাঁ বা না কোনও প্রশ্নের উত্তর দেবে। পি-মান বা অন্যান্য পরিসংখ্যান পদ্ধতির বিপরীতে এটি কোনও সন্দেহ রাখে না। এটি যারা তাদের পক্ষে নিখুঁত প্রতিক্রিয়া, "আমাদের কোনও দুর্গন্ধের 'নাল অনুমানের দরকার নেই! যাইহোক *?! @ এটি কি? এটি কী হওয়ার কথা তা কখনই কেউ বুঝতে পারেনি। "

  2. হাইপোথিসিসটি সত্য যে সম্ভাবনা তা স্টপ থামায় না: এটি আসলে এটি সত্য কিনা না তা সিদ্ধান্ত নেয়।

    সকলেই সম্ভাব্যতায় বিভ্রান্ত। সম্ভাব্যতাটিকে চিত্রের বাইরে নিয়ে গিয়ে, স্টপ কয়েক বছরের স্নাতক এবং স্নাতক অধ্যয়নের প্রয়োজনীয়তা সরিয়ে দেয়। এখন যে কেউ (যিনি পর্যাপ্ত বয়স্ক এবং পুরুষ) একক পরিসংখ্যান বক্তৃতা শোনার যন্ত্রণা ও নির্যাতন ছাড়াই পরিসংখ্যান বিশ্লেষণ করতে পারেন বা অনির্বচনীয় আউটপুটকে চালিত আরকেন সফটওয়্যারটি চালিয়ে যেতে পারেন।

  3. বৈজ্ঞানিক সিদ্ধান্ত এবং ব্যবসা বা নীতিগত সিদ্ধান্তগুলি সাধারণ জ্ঞান এবং প্রকৃত কর্তৃত্বের ব্যক্তিত্বের ভিত্তিতে তৈরি করা যেতে পারে।

    গুরুত্বপূর্ণ সিদ্ধান্তগুলি সর্বদা কর্তৃপক্ষের দ্বারা নেওয়া হয়েছে, যাইহোক, সুতরাং আসুন আমরা এটি স্বীকার করি এবং মধ্যস্থতাকারীদের কেটে ফেলি। স্টপ ব্যবহারের মাধ্যমে পরিসংখ্যানবিদরা তাদের পক্ষে সবচেয়ে বেশি উপযুক্ত তা করতে মুক্ত করবে: সত্যকে অস্পষ্ট করতে সংখ্যা ব্যবহার করা এবং ক্ষমতায় থাকা ব্যক্তিদের পছন্দগুলি পবিত্র করে c

  4. যথাযথ অনুমানের জন্য সম্পূর্ণ প্রতিবেদন এবং স্বচ্ছতা প্রয়োজন।

    স্টোপ হ'ল এখন পর্যন্ত উদ্ভাবিত সবচেয়ে স্বচ্ছ এবং স্ব-স্পষ্ট পরিসংখ্যান পদ্ধতি: আপনি ডেটাটি দেখেন এবং আপনি সিদ্ধান্ত নেন। এটি সমস্ত বিভ্রান্তিকর জেড-টেস্ট, টি-টেস্ট, চি-স্কোয়ার্ড টেস্ট এবং বর্ণমালার স্যুপ পদ্ধতি (আনোভা! জিএলএম! এমএলই!) এই তথ্যগুলি গোপন করার জন্য লোকেরা ব্যবহার করে যা তাদের ডেটা বলতে কী বোঝায় না তা মুছে ফেলে।

  5. স্টপ ফলাফলের গুরুত্ব পরিমাপ করে।

    এটি স্ব-স্পষ্ট: কর্তৃপক্ষের কোনও ব্যক্তি যদি স্টপকে নিয়োগ দেয়, তবে ফলাফল অবশ্যই গুরুত্বপূর্ণ।

  6. নিজে থেকেই, স্টোপ একটি মডেল বা অনুমানের বিষয়ে প্রমাণের একটি ভাল পরিমাপ সরবরাহ করে।

    আমরা কোনও কর্তৃপক্ষকে চ্যালেঞ্জ জানাতে চাই না, তাই না? গবেষকরা এবং সিদ্ধান্ত গ্রহণকারীরা স্বীকার করবে যে স্টপ তাদের প্রয়োজনীয় সমস্ত তথ্য সরবরাহ করে। এই কারণে, ডেটা বিশ্লেষণ স্টপ দিয়ে শেষ হতে পারে; পি-ভ্যালু, মেশিন লার্নিং বা জ্যোতিষের মতো বিকল্প পদ্ধতির দরকার নেই।

অন্যান্য পন্থা

কিছু পরিসংখ্যানবিদগণ তথাকথিত "বায়েশিয়ান" পদ্ধতিগুলি পছন্দ করেন, যেখানে 18 শতকের ধর্মগুরু দ্বারা মরণোত্তরভাবে প্রকাশিত একটি অস্পষ্ট উপপাদ্যকে প্রতিটি সমস্যার সমাধান করার জন্য মূর্খতা প্রয়োগ করা হয়। এর সর্বাধিক উল্লেখযোগ্য উকিলগণ নির্দ্বিধায় স্বীকৃতি দেয় যে এই পদ্ধতিগুলি "বিষয়ভিত্তিক" ”আমরা যদি বিষয়গত পদ্ধতি ব্যবহার করতে চলেছি তবে স্পষ্টতই সিদ্ধান্ত গ্রহণকারী যত বেশি অনুমোদনযোগ্য এবং জ্ঞানবান হন, ফলাফল তত ভাল better এরপরে স্টপ সমস্ত বেইস পদ্ধতির যৌক্তিক সীমা হিসাবে আবির্ভূত হয়েছিল। কেন আপনি এই গুরুতর গণনাগুলি কাজ করার চেষ্টা করছেন এবং এত বেশি কম্পিউটার সময় বেঁধেছেন, যখন আপনি কেবল দায়িত্বরত ব্যক্তিকে ডেটা প্রদর্শন করতে পারেন এবং তাকে জিজ্ঞাসা করতে পারেন যে তার মতামত কি? গল্পের শেষে.

পরিসংখ্যানবিদদের যাজকত্বকে চ্যালেঞ্জ জানাতে সম্প্রতি একটি সম্প্রদায় উঠে দাঁড়িয়েছে। তারা নিজেকে "মেশিন লার্নার" এবং "ডেটা বিজ্ঞানী" বলে ডাকে তবে তারা সত্যই কেবল উচ্চতর মর্যাদার সন্ধানকারী হ্যাকার। এটি এসএসের অফিসিয়াল অবস্থান যে লোকেরা তাদের গুরুত্ব সহকারে নিতে চায় যদি এই ছেলেরা তাদের নিজস্ব পেশাদার সংস্থা গঠন করা উচিত।


প্রশ্নটি

এএসএ পি-ভ্যালু এবং নাল হাইপোথিসিস পরীক্ষার সাহায্যে চিহ্নিত সমস্যার উত্তর? এটি কি সত্যই বায়েশিয়ান এবং ফ্রুয়ালিস্টবাদক দৃষ্টান্তগুলিকে একত্রিত করতে পারে (প্রতিক্রিয়া হিসাবে স্পষ্টভাবে দাবি করা হয়েছে)?


11
"সর্বোচ্চ স্টপ এএসএস বিচারকের পক্ষে ডোনাল্ড ট্রাম্প: পরিসংখ্যানকে আবার দুর্দান্ত করুন!"
অ্যালেক্স আর

14
স্পষ্টত স্টপ একটি suboptimal পদ্ধতি। আমি আশ্চর্য হয়েছি যে এটি এএসএস হিসাবে পন্ডিতদের এত সম্মানিত সংস্থার হাতছাড়া করেছে। বুদ্ধি করতে, কেন সময় নষ্ট করবেন ডেটা দিকে তাকিয়ে এ সব ? কেবল আপনার হ্যাঁ / কোনও প্রতিক্রিয়া জানায় না। এই পদ্ধতিটি ইতিমধ্যে দুর্দান্ত প্রভাবের জন্য ব্যবহৃত। কেস স্টাডি প্রচুর, বিশেষত যুক্তরাষ্ট্রে কয়েক বছর ধরে বিভাজ্য 4
কার্ডিনাল

4
আমি মনে করি যে এই পদ্ধতিগুলি গ্রহণ করে ব্যবসায়গুলিও প্রচুর উপকৃত হতে পারে, যেহেতু তাদের ডেটা বিশ্লেষণ করার জন্য লোকদের নিয়োগের ভারী ব্যয়কে আর কাটাতে হবে না।
dsaxton

4
@ হেনরি যেনো [এপ্রিল -২] ট্যাগটি আমাদের জানাননি?
Glen_b

9
@ হেনরি সিরিয়াসলি? গুগলের নাম গুগল করার সময় আপনি কী এমন কোনও নকল সংগঠন আমাদের দেখাতে পারেন যা চতুর্থাংশ মিলিয়ন হিট হয়?
whuber

উত্তর:


18

: আমি RADD নামক পরিসংখ্যানগত সিদ্ধান্ত আমার নিজস্ব নতুন পদ্ধতির সমর্থনে করে থাকেন আর oll একটি ডি amn ডি অর্থাত। এটি সমস্ত মূল বিষয়গুলিও সম্বোধন করে।

1) আরএডিডি সূচিত একটি পরিসংখ্যানের মডেলের সাথে ডেটা কতটা সামঞ্জস্যপূর্ণ তা নির্দেশ করতে পারে।

আপনি যদি একটি উচ্চ সংখ্যা রোল করেন, স্পষ্টতই প্রমাণগুলি আপনার মডেলের পক্ষে বেশি! একটি অতিরিক্ত সুবিধা হ'ল আমরা যদি আরও বেশি আত্মবিশ্বাসের ইচ্ছা করি তবে আমরা আরও বেশি দিক দিয়ে ডাই রোল করতে পারি। আপনি যদি যথেষ্ট অনুসন্ধান করেন তবে আপনি 100 পার্শ্বযুক্ত পাশাও পেতে পারেন!

2) আরএডিডি সিদ্ধান্ত নিতে পারে কোনও অনুমানটি সত্য কিনা।

আপনাকে কেবল ২ পার্শ্বযুক্ত ডাই রোল করতে হবে, অর্থাত, একটি কয়েন ফ্লিপ করতে হবে।

3) আরএডিডি ব্যবসায় বা নীতিগত সিদ্ধান্ত নিতে ব্যবহার করা যেতে পারে

একটি ঘরে নীতি নির্ধারকদের একগুচ্ছ পান এবং তাদের সমস্ত রোল ডাইস পান! সর্বোচ্চ জয়!

4) আরএডিডি হ'ল ট্রান্সপার্যান্ট।

ফলাফল রেকর্ড করা যেতে পারে, এবং ডাই নিজেই আরও গবেষণার জন্য রাখা যেতে পারে *

5) আরএডিডি ফলাফলের গুরুত্ব পরিমাপ করে।

স্পষ্টতই, উচ্চতর ঘূর্ণায়মান একটি গুরুত্বপূর্ণ ঘটনা ঘটেছে তা বোঝায়।

6) আরএডিডি প্রমাণের একটি ভাল পরিমাপ সরবরাহ করে।

আমরা কি বলিনি যে উচ্চতর রোলগুলি আরও ভাল?

সুতরাং, না, স্টপ উত্তর নয়। উত্তরটি আরএডিডি।


7
ভুলে যাবেন না, এটি টাইপ আই ত্রুটি নিয়ন্ত্রণ নিশ্চিত করতে পারে (পর্যাপ্ত দিকের পাশা দেওয়া কোনও পছন্দসই স্তরে) উদাহরণস্বরূপ কেবলমাত্র নাল অনুমানকে প্রত্যাখ্যান করার মাধ্যমে যখন সর্বাধিক সংখ্যক ১০০ পার্শ্বযুক্ত ডাইস যুক্ত 5 টির মধ্যে একটি উপস্থিত হয় একটি 5% প্রকার I ত্রুটির হার।
বুর্জন


17

আমার অভিজ্ঞতা থেকে অবশ্যই বলতে হবে যে ব্যবসায়ের বাস্তবতায় স্টপ হল ডিফল্ট সিদ্ধান্ত নেওয়ার মানদণ্ড, যা পছন্দ করেpমূল্য এবং অন্যান্য ঘনত্ববাদী বা বায়েশিয়ান পদ্ধতি। ব্যবসায়ের দৃষ্টিকোণ থেকে স্টপ সহজ এবং চূড়ান্ত উত্তর সরবরাহ করে যা এটিকে অনিশ্চিত "সম্ভাব্যতা" পদ্ধতির চেয়ে আরও নির্ভরযোগ্য করে তোলে। তদুপরি, বেশিরভাগ ক্ষেত্রে এটি বাস্তবায়ন করা সহজ এবং অন্যান্য পদ্ধতির তুলনায় বাস্তবের পরিবর্তনের সাথে খাপ খাইয়ে নেওয়া সহজ। হ্যাঁ / না সিদ্ধান্তগুলি মধ্যম এবং সিনিয়র পরিচালনার জন্য আরও দৃ more়প্রত্যয়ী। "স্টপ রিপোর্টগুলি" বেশিরভাগ ক্ষেত্রে ডেটা-ভিত্তিকগুলির চেয়ে ছোট এবং পড়া সহজ। অধিকন্তু, এই পদ্ধতিটি গ্রহণ করা আপনার নিয়োগকর্তাকে ডেটা বিজ্ঞানী এবং এসএএস লাইসেন্সের ব্যয় হ্রাস করতে সক্ষম করে। আমি বলব যে স্টপের সাথে একমাত্র সমস্যাটি হ'ল পাওয়ারপয়েন্ট উপস্থাপনাটি স্টপ ফলাফল উপস্থাপন করা কঠিন, তবে এটি একটি গতিশীল উন্নয়নশীল ক্ষেত্র, সুতরাং ভবিষ্যতে আরও উন্নততর দৃশ্যধারণের প্রস্তাব দেওয়া যেতে পারে।


6
উপসংহারের সাথে পাওয়ারপয়েন্ট স্লাইডগুলি একবার সংক্ষিপ্ত হয়ে গেলে, এটি পরিবর্তন করতে খুব দেরি হয়ে যায়, সুতরাং দুটি পছন্দ আছে, বিশ্লেষণকে উপসংহারের সাথে মানিয়ে নিন বা বিশ্লেষণকে মোটেও বিরক্ত করবেন না।
মার্ক এল স্টোন

12
@ মার্কএল.স্টোন শিওর! ডেটা দেখার আগে আমি ব্যক্তিগতভাবে উপস্থাপনাটির জন্য প্লট তৈরি করার ধারণাটি পছন্দ করি, ধারণাটি মূলত বয়েশিয়ান চিন্তার মধ্যে রয়েছে এবং আমি তাদেরকে অগ্রাধিকারের প্লট বলি :) আমি মনে করি যে এই পদ্ধতির প্রথমে এখানে প্রিন্টে প্রকাশিত হয়েছিল: dilbert.com/strip/ 2008-05-08
টিম

15

পি-ভ্যালু বিতর্কের সাথে এই সূক্ষ্ম সংযোজন, আকর্ষণীয় তবে আমার মতে কিছুটা বাসি, আমাকে কয়েক বছর আগে ব্রিটিশ মেডিকেল জার্নালের বিএমজে- এর ক্রিসমাস সংখ্যায় প্রকাশিত একটি অনন্য গবেষণার স্মরণ করিয়ে দেয় , যা প্রতিটি ক্রিসমাস বাস্তবের মজার গবেষণা প্রকাশ করে hes নিবন্ধ। বিশেষত, আইজ্যাকস এবং ফিৎসগেরাল্ডের এই কাজটি প্রমাণ ভিত্তিক ওষুধের সাতটি মূল বিকল্পকে (অর্থাৎ প্রকৃত ক্লিনিকাল এবং পরিসংখ্যানগত প্রমাণের ভিত্তিতে medicineষধের অনুশীলন) তুলে ধরেছে:

  • বিশিষ্টতা ভিত্তিক ওষুধ
  • ভীমেন্স ভিত্তিক ওষুধ
  • বাগ্মিতা ভিত্তিক ওষুধ
  • প্রভিডেন্স ভিত্তিক ওষুধ
  • পার্থক্য ভিত্তিক medicineষধ
  • নার্ভাসনেস ভিত্তিক ওষুধ
  • আত্মবিশ্বাস ভিত্তিক ওষুধ

সবচেয়ে মজার বিষয় হল, আপনাকে অবশ্যই উপরের আইটেমগুলির জন্য পরিমাপের ডিভাইসগুলি এবং পরিমাপের এককগুলি হাইলাইট করে কলামগুলিতে নজর দিতে হবে (উদাহরণস্বরূপ অডিওমিটার এবং ভেমেন্স ভিত্তিক medicineষধের জন্য ডেসিবেল!)।


4
+1 টি। প্রশ্নের উত্সাহে পুরোপুরি এক দুর্দান্ত অবদানের জন্য আপনাকে ধন্যবাদ। (1) কেবল স্পষ্ট করে বলার জন্য: আপনি "বাসি" বা কেবল এই প্রশ্নটিকেই খুঁজে পান পি-ভ্যালু বিতর্ক? (২) আপনি জানতে পারবেন কোথায় রেফারেন্স (6), "জে এক্সপেনশনাল বেতন" পাবেন? আমি নিশ্চিত এটির আরও বেশি পরিচিত থাকলে এটিতে অনেক আগ্রহী পাঠক থাকতেন।
whuber

5
(1) আপনার অবদানটি 'প্রত্যয়িত তাজা' (রোটেনটোমোটোস.কমের উদ্ধৃতিতে)। বিপরীতভাবে, আমি পি মানগুলির সীমাবদ্ধতার উপর এই জোরটিকে কিছুটা বাসি দেখতে পাই। মেশিন লার্নিং, বড় ডেটা এবং জনসাধারণের মধ্যে দুর্বল বৈজ্ঞানিক সাক্ষরতার যুগে এএসএ-র স্ট্যান্ডটি কিছুটা মাসোশিস্ট মনে হতে পারে। (২) আমি মনে করি আপনি সেই নিবন্ধটি একই জার্নালে পাবেন যেখানে তারা এই বিএমজে ক্রিসমাসের অন্যান্য অংশে সুপারিশ করা এলোমেলোভাবে পরীক্ষামূলকভাবে প্রকাশ করেছে: বিএমজেড / কনটেন্ট / 77/ / 74৪২ / ১45৫৯
জো_74

আমি সবসময় ভুলে যাই, এটি কি আত্মবিশ্বাস ভিত্তিক মেডিসিন যা ডানিং-ক্রুগার-ভিত্তিক অনুমান ব্যবহার করে?
অ্যালেক্সিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.