কোনও পরিসংখ্যান ব্যাকগ্রাউন্ড নেই এমন লোকদের কাছে আপনি কীভাবে পরিসংখ্যানিক তাত্পর্যটি ব্যাখ্যা করবেন?


11

পটভূমি:
আমাকে একজন ক্লায়েন্টের (একরকম আইনজীবি) ডেটা বিশ্লেষণ করতে হয়েছিল যিনি পরিসংখ্যানের এক চূড়ান্ত সূচনা করেছিলেন। তিনি আমাকে জিজ্ঞাসা করেছিলেন, "পরিসংখ্যানগত তাত্পর্য" শব্দটির অর্থ কী এবং আমি সত্যই তা ব্যাখ্যা করার চেষ্টা করেছি ... তবে যেহেতু আমি ব্যর্থ জিনিসগুলি ব্যাখ্যা করতে ভাল নই;)

উত্তর:


15

পার্থক্য সুযোগের ফলস্বরূপ ঘটে।

আমরা যখন বিশ্বাস করি যে কোনও কিছু পরিসংখ্যানগত দিক থেকে গুরুত্বপূর্ণ, আমরা বিশ্বাস করি যে পার্থক্যটি তার চেয়ে বড়তর কারণটি যথাযথ ঘটনা হিসাবে ব্যাখ্যাযোগ্য।


আমি সুযোগের ব্যবহার পছন্দ করি, তবে এটি কীভাবে তাত্পর্যপূর্ণভাবে পরীক্ষামূলকভাবে তাত্পর্যপূর্ণভাবে ব্যবহৃত হয় তার দিক থেকে এটি অত্যন্ত বিভ্রান্তিকর বলে মনে হয়। উদাহরণস্বরূপ, বৃহত নমুনার আকারের অর্থ "সুযোগ" বেসলাইন পার্থক্যের কারণে আপনি প্রায় সর্বদা তাত্পর্য পাবেন। এটি বেশ বিস্তৃতভাবে গ্রহণযোগ্য যে সুযোগগুলি যথাযথভাবে ব্যাখ্যা করার পরেও এই ফলাফলগুলিকে "পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ" বলা যেতে পারে।
ফ্লাস্ক

@ ফ্লাস্ক: সুযোগের কারণে এই বেসলাইন পার্থক্যটি কী অর্থে?
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

@ স্কোর্টচি যদি র্যান্ডমাইজেশন সম্পাদন করা হয় তবে সুযোগের কারণে পার্থক্য হতে পারে। এখানে দেখুন । এমনকি যদি এটি সম্পাদন করা হয়ে থাকে তবে পরে পক্ষপাতিত্বের পরিচয় দিতে পারে। এখানে দেখুন । যদি এলোমেলোভাবে সম্পাদন না করা হয় তবে তা সুযোগ বা তদন্তকারী পক্ষপাতিত্ব বা যে কোনও কারণেই হতে পারে।
ফ্ল্যাস্ক

1
এটি কেবলমাত্র পার্থক্যের পরীক্ষার ক্ষেত্রে প্রযোজ্য তা ছাড়া দরকারী উত্তর।
Rolando2

2
+1 এটি একটি দুর্দান্ত উত্তর কারণ এটি পি-মান, সম্ভাব্যতা, বিতরণ, নকল হাইপোথেসিস ইত্যাদির আরকানা এড়িয়ে চলে এবং বেশিরভাগ আইনজীবীর সাথে যে আচরণ করা হবে তার ক্ষেত্রে প্রযোজ্য এমন উপায়ে পৌঁছে যায়। এটি সামগ্রিকভাবে নাও পয়েন্টের পাশে থাকতে পারে: বিশদ এবং প্রকরণগুলি পরে পরিচালনা করা যেতে পারে। যদি এটির উন্নতি করার জন্য চাপ দেওয়া হয়, তবে আমি যে প্রধান পরিবর্তন করব তা হ'ল জোর দেওয়া উচিত যে পরিসংখ্যানগত তাত্পর্য সম্পর্কে বিশ্বাসগুলি তথ্যের উপর ভিত্তি করে : যা ধর্মীয় বিশ্বাস থেকে এই বর্ণনাকে আলাদা করবে।
whuber

3

দ্রষ্টব্য: আমি এই উত্তরে যা চাপ দিতে চাই তা হ'ল পরিসংখ্যানগত তাত্পর্য একটি দরকারী সরঞ্জাম, তবে সত্য থেকে পৃথক।

52 টি কার্ডের একটি প্যাক নিন। যদি আমার ক্লায়েন্ট নির্দোষ হয় তবে এটি কার্ডের একটি সাধারণ প্যাক, 13 হৃদয়। যদি আমার ক্লায়েন্ট মিথ্যা বলে থাকে তবে এটি একটি স্থির প্যাক এবং সমস্ত 52 টি কার্ড হৃদয়।

আমি প্রথম কার্ড এঁকেছি এবং এটি একটি হৃদয়। আহা, অপরাধী! হ্যাঁ, স্পষ্টতই সাধারণ জ্ঞান আমাদের বলছে যে এটি নয়: তিনি নির্দোষ হলেও চারটি ক্ষেত্রেই এটি ঘটতে পারে। আমরা না পরিসংখ্যানগত তাৎপর্য শুধু একটা কার্ড দিকে তাকিয়ে থেকে।

সুতরাং আমরা একটি দ্বিতীয় কার্ড আঁকুন। অন্য হৃদয়। হুঁ হুঁ ... তবে অবশ্যই দোষী! ঠিক আছে, বাকি ৫১ টি কার্ডে এখনও 12 টি হৃদয় রয়েছে, তাই এটি অসম্ভব নয়। গণিত (13/52 * 12/51 = 0.0588) আমাদের নির্দোষ হলেও প্রায়%% সময় এটি বলে। বেশিরভাগ বিজ্ঞানীর কাছে এটি এখনও গণনা করা হবে না।

তৃতীয় কার্ড আঁকুন, অন্য হৃদয়! পরপর তিনটি। এটি হওয়ার সম্ভাবনাগুলি (১৩/৫২ * 12/51 * 11/50 = 0.01294), সুতরাং সুযোগের 1% এরও বেশি সময় এটি ঘটনাক্রমে ঘটতে পারে।

বিজ্ঞানের বেশিরভাগ ক্ষেত্রে 5% কাট-অফ পয়েন্ট হিসাবে ব্যবহৃত হয়। সুতরাং যদি সেই তিনটি কার্ড ছাড়া আপনার কাছে অন্য কোনও প্রমাণ না থাকে তবে আপনার কাছে একটি পরিসংখ্যানগতভাবে উল্লেখযোগ্য ফলাফল রয়েছে যে তিনি দোষী।

গুরুত্বপূর্ণ বিষয়টি হ'ল যত বেশি কার্ড আপনাকে তার অপরাধীর প্রতি তত বেশি আস্থা অর্জনের অনুমতি দেবে, যা পরিসংখ্যানের তাত্পর্যটি তত বেশি বলে বলার অন্য উপায়।

দ্রষ্টব্য: 14 টি কার্ড দেখার অনুমতি না থাকলে আপনার কাছে কখনও তার অপরাধের প্রমাণ নেই have কার্ডের একটি সাধারণ প্যাকের সাহায্যে তাত্ত্বিকভাবে সম্ভবত একটানা 13 টি হৃদয় আঁকানো সম্ভব তবে 14 টি অসম্ভব। [পেডেন্টদের পক্ষে: ধরে নেওয়া যাক কার্ডগুলিতে সংখ্যাগুলি দৃশ্যমান নয়; সমস্ত কার্ড চারটি সম্ভাব্য স্যুটগুলির মধ্যে একটি এবং এটিই]

দ্রষ্টব্য: আপনি হৃদয় ব্যতীত অন্য কোনও কার্ড আঁকানোর মুহুর্তে তাঁর নিষ্পাপতার প্রমাণ রয়েছে। এটি কেবলমাত্র দুটি সম্ভাব্য প্যাক ছিল: স্বাভাবিক বা সমস্ত হৃদয়। বাস্তব-জীবন আরও জটিল, এবং গণিতগুলিও আরও জটিল হয়।

যাইহোক, যদি আপনার ক্লায়েন্ট কার্ড প্লেয়ার না হন তবে একচেটিয়া ব্যবহার করে দেখুন: প্রত্যেকে কিছুটা সময় ডাবল-সিক্সে রোল করে; তবে যদি কেউ প্রতিবার ডাবল-সিক্স ঘূর্ণায়মান হন তবে আপনি সন্দেহজনক হন। পরিসংখ্যান কেবল আমাদের সন্দেহজনক হওয়া উচিত তার উপর একটি সঠিক সংখ্যা রাখার অনুমতি দেয়।


3

আমার নিজের পরামর্শটি নিম্নলিখিত বিষয়গুলি সম্পর্কে কথা বলার নয় :

  1. P-মূল্যবোধ,
  2. পরীক্ষা পরিসংখ্যান,
  3. একা সুযোগে ঘটে যাওয়ার সম্ভাবনা।

উকিল সম্পর্কে নিজেকে খুব কঠিন করবেন না। এই একজন শিক্ষিত ব্যক্তি যিনি একটি বিশ্ববিদ্যালয়ের স্ট্যাটিস্টিক্স ক্লাসে কমপক্ষে একটি সেমিস্টার ব্যয় করেছেন এবং এর একটি অংশও তাঁর সাথে আটকে নেই। এটি প্রায় প্রতিটি অন্যান্য অ-বিজ্ঞানী যার সাথে আমি কাজ করেছি - এটির জন্য একই গল্প - পরিসংখ্যানগত তাত্পর্য স্থায়ী হয় না । এটি ঠিক খুব অপ্রাকৃত একটি ধারণা।

আমি আপনাকে প্রমাণ হিসাবে পরিসংখ্যানগত তাত্পর্য ব্যাখ্যা করতে উত্সাহিত । শাস্ত্রীয় পরিসংখ্যানবিদরা 0 থেকে 1 স্কেলে প্রমাণকে এনকোড করেছেন, যেখানে ছোট মানগুলি আরও প্রমাণ দেয় এবং 0.05 যেখানে লাইনটি প্রচলিতভাবে টানা হয়।


ইমো সিগ ধারণা। অ-বিজ্ঞানীদের সাথে থাকতে পারে; যা প্রায়শই অপ্রাকৃত হিসাবে দেখা হয় তা হ'ল প্রযুক্তিগত সংজ্ঞা, যদি লোকেরা এতদূর পায়। যতদূর প্রমাণ হিসাবে, অবশ্যই এটি প্রমাণ সম্পর্কিত: প্রশ্ন হল সিগ সম্পর্কিত কোনও সিদ্ধান্তে পৌঁছানোর জন্য কোনও ব্যক্তি কীভাবে পরিসংখ্যানগতভাবে প্রমাণের সাথে কাজ করে।
Rolando2

আমি আপনার আশাবাদটি পছন্দ করি, তবে আমি অসম্মতি প্রকাশ করি যে সাধারণ ব্যক্তির কাছে এটি স্পষ্ট যে পরিসংখ্যানগত তাত্পর্য প্রমাণ সম্পর্কে is আমি মনে করি যে তারা যখন আপনার ডেটা সেটটি যথেষ্ট পরিমাণে বড় হয়ে যায় এবং সমস্ত সংখ্যার গণনা করা হয় তখন কোনওভাবে "বৈধ" হয়ে উঠবে fl আপনি জোর দিয়ে বলছেন যে কীভাবে প্রমাণের পরিমাণ প্রমাণিত হয়েছে তা লাইপারসনের পক্ষে জরুরী, সুতরাং একটি অনুমানের অধীনে গণনা করা সম্ভাবনার বিষয়ে কথা বলার জন্য প্রস্তুত হন যা আপনি সম্ভবত বিশ্বাস করেননি যে প্রথম স্থানে সত্য ছিল।
বেন ওগোরেক

আহ তবে আপনি যদি আলামত সম্পর্কে কথা বলেন তবে আপনি বায়েশিয়ান জমিতে প্রবেশ করুন।
আর্থার বি

1
আমি মনে করি না যে বায়েশিয়ানরা "প্রমাণ" (ধারণা) এর মালিক, যদিও তারা অবশ্যই এটি আনুষ্ঠানিকভাবে তৈরি করেছে। আমি তর্ক করব যে একটি ছোট পি-মান কোনও কিছুর প্রমাণ।
বেন ওগোরেক

1

"পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ" এর অর্থ হ'ল কিছু এলোমেলোভাবে ঘটতে পারে তবে এটি অসম্ভব। পরিবর্তে, আরও কিছু কারণ রয়েছে যে কোনও কারণ রয়েছে। আপনার ক্লায়েন্টের সাথে প্রাসঙ্গিক একটি উদাহরণ সহ আপনার আরও কংক্রিট করা উচিত, কারণ সেই ব্যাখ্যাটি এত বিমূর্ত।

উদাহরণস্বরূপ, যদি আইনজীবী অ্যান বিলের তুলনায় গড়ে আরও অনেকগুলি মামলা জিতেন, তবে এটি কেবল এলোমেলোভাবে ঘটতে পারে। তবে, যদি অ্যান একটি পরিসংখ্যানগতভাবে আরও বেশি কেস জিতেন তবে সম্ভবত এমন আরও কিছু সম্ভাবনা রয়েছে যা অ্যান বিলের চেয়ে বেশি মামলা কেন জিতেছে তা ব্যাখ্যা করতে সহায়তা করতে পারে। আমরা এর কারণ জানি না। সম্ভবত অ্যান আরও ভাল আইনজীবী বা বিল উদ্দেশ্যমূলকভাবে এমন মামলাগুলি বেছে নিয়েছেন যা আরও বেশি কঠিন।


0

এটি সহজ এবং সংক্ষিপ্ত রাখুন!

একটি পি-মানটিকে নাল সত্য বলে ধরে নিয়ে আমরা দেখেছি যে হিসাবে ফলাফল প্রাপ্তির সম্ভাবনা বা ততোধিক চরম হিসাবে সংজ্ঞায়িত করা হয়। যদি পি-মানটি যথেষ্ট ছোট হয় তবে নালটি সম্ভবত সত্য নয়। আমরা যাকে "" যথেষ্ট পরিমাণে ছোট "(আলফা) বলে মনে করি এবং আলফার নীচে যে সমস্ত পি-মানগুলি আমরা বিবেচনা করি তার জন্য আমরা নির্বিচারে একটি কাট-অফ চয়ন করি।

এটিই আমি আমার পরিসংখ্যানের ক্লাসে এটি ব্যাখ্যা করব।


তবে যদি আপনার কাছে কোনও কলুষিত নাল হাইপোথিসিস বাছাই করার উপায় না থাকে (অর্থাত্, কোনও দুটি গ্রুপের লোকেরা একেবারে সমান হয় না, তবে আপনার কাছে গড় 1 = গড় 2 এর চেয়ে ভাল কোনও কিছুর পূর্বাভাস দেওয়ার পর্যাপ্ত তথ্য নেই)? সীমাবদ্ধতার উল্লেখ না করে পরিসংখ্যানগত তাত্পর্য বর্ণনা করা ক্ষতি করতে পারে।
ফ্ল্যাস্ক

0

আমি চেষ্টা করবো.

প্রথমে আপনি গড় ডেটা এবং ডেটাটি কত পরিবর্তনশীল তার উপর ভিত্তি করে একটি পি-মান গণনা করুন। আরও পরিবর্তনশীল, একটি ছোট পি-মান পাওয়ার সম্ভাবনা তত কম। অন্যদিকে, উদাহরণস্বরূপ, আপনি যদি দুটি গ্রুপের সাথে তুলনা করছেন, তাদের গড় গড়ের মধ্যে পার্থক্য তত বেশি হবে, পি-মানটিও ছোট হবে।

এছাড়াও, আরও বেশি ডেটা থাকার কারণে ডেটাটির পরিবর্তনশীলতা কিছুটা বাতিল হতে পারে। দুটি গড় এবং একই পরিমাণে পরিবর্তনশীলতার মধ্যে একই পার্থক্য সহ দুটি সেট ডেটা ইমেজিং। এই ক্ষেত্রে, বৃহত্তর নমুনা আকারের সাথে সেটটির পি-মান আরও কম হবে।

পরীক্ষার অংশটি কেবল দেখতে পাচ্ছে যে পি-মানটি কোনও সংখ্যার চেয়ে কম। সাধারণত লোকেরা .05 ব্যবহার করে তবে এটি স্বেচ্ছাসেবী সামাজিক রীতিনীতি। অনেক লোক মনে করেন যে একটি স্বেচ্ছাসেবী সংখ্যা ব্যবহার করা কোনও অর্থবোধ করে না, তবুও এটি commonতিহাসিক কারণে খুব সাধারণ।

এছাড়াও মনে রাখবেন যে কেবল আপনার তাত্পর্য পরীক্ষা বলে দুটি দলের মধ্যে পার্থক্য রয়েছে তার অর্থ এই নয় যে কেন আপনি এই পার্থক্য রয়েছে তা জানেন। অন্যদিকে, যদি পরীক্ষাটি বলে যে কোনও উল্লেখযোগ্য পার্থক্য নেই, এটি কেবল কারণ আপনার পরিবর্তনশীলতা খুব বেশি ছিল এবং আপনার কাছে কম পি মান পেতে পর্যাপ্ত ডেটা ছিল না, এর অর্থ এই নয় যে প্রকৃত পার্থক্য নেই।

সম্পাদনা:

সংক্ষিপ্তসার হিসাবে, কম পি মান মানে ভবিষ্যদ্বাণীটির বিরুদ্ধে আরও প্রমাণ:

পূর্বাভাসিত ফলাফল থেকে পার্থক্য -> পি-মান ডাউন করুন

আরও ডেটা -> ডাউন পি-মান

আরও পরিবর্তনশীলতা -> পি-ভ্যালু আপ

ডাউন পি-মান মানে ভবিষ্যদ্বাণীটি মিথ্যা বলে আরও প্রমাণ রয়েছে। ইতিহাসের প্রতিটি ভবিষ্যদ্বাণী কিছু দশমিক জায়গায় মিথ্যা দেখানো হয়েছে।


0

পরিসংখ্যানগত তাত্পর্য একটি ধারণা যা কোনও প্রদত্ত অনুমানকে গ্রহণ বা প্রত্যাখ্যান করার ন্যায্যতা প্রদান করতে ব্যবহৃত হয়। ডেটার একটি সেট দেওয়া একটি বিশ্লেষক পরিসংখ্যান গণনা করতে এবং বিভিন্ন ভেরিয়েবলের মধ্যে বিভিন্ন সম্পর্কের প্রস্থতা নির্ধারণ করতে পারে।

পরিসংখ্যানগুলির কাজটি হ'ল ডেটাটিতে এমন প্রমাণ রয়েছে যা নিশ্চিত করতে সক্ষম হয় যে ভেরিয়েবলের মধ্যে পরিগণিত পরিসংখ্যান বা সম্পর্কগুলি সত্য বিবৃতি হিসাবে ব্যাখ্যা করা যেতে পারে বা যদি আপনার নমুনা ডেটাতে প্রদর্শিত ফলাফলগুলি কেবল সুযোগের কারণে ঘটে থাকে। এটি কিছু নমুনা পরিসংখ্যান নির্ধারণ করে করা হয় যা নাল অনুমানটি সত্য হয় তবে নাল অনুমানটি মিথ্যা থাকলে তা নয় তবে নির্দিষ্ট বৈশিষ্ট্য প্রদর্শন করবে। নাল অনুমানের অধীনে যত বেশি প্রাসঙ্গিক নমুনা পরিসংখ্যান প্রত্যাশিত বৈশিষ্ট্য প্রদর্শিত হয়, নাল হাইপোথিসিসটি সঠিক যে পরিসংখ্যানগত প্রমাণ তত বেশি দৃ .় হয়। অনুরূপভাবে, নমুনা পরিসংখ্যানগুলি নাল অনুমানের অধীনে প্রত্যাশিত বৈশিষ্ট্যগুলি প্রদর্শিত যত কম প্রদর্শিত হবে, নাল অনুমানটি সঠিক বলে পরিসংখ্যানের প্রমাণ দুর্বল।

শূন্যের অধীনে প্রত্যাশিত বৈশিষ্ট্যগুলির নমুনা পরিসংখ্যানগুলি যে পরিমাণ পরিমাণ প্রদর্শন করে তা ডিগ্রির বিষয়, তবে নাল অনুমানটি গৃহীত বা প্রত্যাখ্যানিত হয় এই সিদ্ধান্তে পৌঁছাতে অবশ্যই কিছু স্বেচ্ছাসেবক কাটঅফ থাকতে হবে। যেমন, একটি কাট অফ মান নির্বাচন করা হয়। যদি নমুনা পরিসংখ্যানটি কাটাফের মানটির মধ্যে বা একপাশে পড়ে যায় তবে এটি নাল অনুমানের অধীনে প্রত্যাশিত বৈশিষ্ট্যগুলির সাথে সামঞ্জস্যপূর্ণ বলে মনে হয় এবং ফলস্বরূপ প্রদত্ত কাট অফের মানটির জন্য পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ হিসাবে বিবেচনা করা যেতে পারে (যেমন 5% আলফাতে স্তর)। যদি প্রাসঙ্গিক নমুনা পরিসংখ্যানটি কাটাফের মানটির অন্য দিকে পড়ে তবে বলা হয় যে নাল অনুমানের অধীনে প্রত্যাশিত বৈশিষ্ট্যগুলি মেনে চলবে না এবং ফলস্বরূপ প্রদত্ত কাট অফের মানটিকে পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ হিসাবে বিবেচনা করা হয় না।


তবে কতবার সত্যই আলাদা আলাদা জনসংখ্যার আগেই নির্ধারিত হয় যে ফলাফলগুলি প্রয়োগ করা উচিত apply অধ্যয়ন করা সঠিক জনসংখ্যার বাইরে ফলাফল প্রয়োগ করার জন্য সাধারণত একটি যুক্তি তৈরি করা হয়, যা ছিল একটি অনন্য নমুনা। বিষয়গুলির এই স্বাতন্ত্র্যতা / যে কোনও বিষয়ই অনেক পরিস্থিতিতে অজানা। একটি ব্যতিক্রম মান নিয়ন্ত্রণ উত্পাদন উত্পাদন হতে পারে, কিন্তু তাত্পর্য পরীক্ষা তার চেয়ে অনেক বেশি ব্যবহৃত হয়। আমার অর্থ কেবলমাত্র এই পদ্ধতিটির সীমাবদ্ধতার উপর জোর দেওয়া, যা আমার নিজস্ব শিক্ষা থেকে বাদ দেওয়া হয়েছিল।
ফ্লাস্ক

@ ফ্লাস্ক এটি একটি ভাল বিষয়। আমি আমার উত্তরটি সম্পাদনা করেছি এবং এটিকে আরও সাধারণ করার চেষ্টা করেছি।
tjnel
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.