স্ট্যান্ডার্ড বিচ্যুতি কি সম্পূর্ণ ভুল? আপনি কীভাবে উচ্চতা, গণনা এবং ইত্যাদি (ধনাত্মক সংখ্যা) এর জন্য স্ট্যান্ড গণনা করতে পারেন?


13

ধরা যাক আমি উচ্চতা গণনা করছি (সেমি থেকে) এবং সংখ্যাগুলি অবশ্যই শূন্যের চেয়ে বেশি হতে হবে।

এখানে নমুনা তালিকা:

0.77132064
0.02075195
0.63364823
0.74880388
0.49850701
0.22479665
0.19806286
0.76053071
0.16911084
0.08833981

Mean: 0.41138725956196015
Std: 0.2860541519582141

এই উদাহরণে, সাধারণ বিতরণ অনুযায়ী, মানগুলির 99.7% হতে হবে গড় থেকে মান বিচ্যুতি। 3 এর মধ্যে। যাইহোক, এমনকি দ্বিগুণ মান বিচ্যুতি নেতিবাচক হয়ে যায়:

-2 x std calculation = 0.41138725956196015 - 0.2860541519582141 x 2 = -0,160721044354468

তবে আমার নম্বরগুলি অবশ্যই ইতিবাচক হতে হবে। সুতরাং তাদের অবশ্যই ০. এর উপরে হতে হবে negativeণাত্মক সংখ্যাগুলি উপেক্ষা করতে পারি তবে আমি সন্দেহ করি এটি আদর্শ বিচ্যুতি ব্যবহার করে সম্ভাবনার গণনা করার সঠিক উপায়।

আমি কি এটি সঠিক উপায়ে ব্যবহার করছি তা বুঝতে কেউ আমাকে সহায়তা করতে পারে? নাকি আমার আলাদা পদ্ধতি বেছে নেওয়া দরকার?

সত্যি কথা বলতে কি গণিত ম্যাথ। এটি সাধারণ বিতরণ কিনা তা বিবেচ্য নয়। এটি যদি স্বাক্ষরবিহীন সংখ্যাগুলির সাথে কাজ করে তবে এটি ইতিবাচক সংখ্যাগুলির সাথেও কাজ করা উচিত! আমি কি ভূল?

EDIT1: যুক্ত হিস্টোগ্রাম

আরও পরিষ্কার করে বলতে গেলে, আমি আমার আসল ডেটার হিস্টোগ্রাম যুক্ত করেছি এখানে চিত্র বর্ণনা লিখুন

সম্পাদনা 2: কিছু মান

Mean: 0.007041500928135767
Percentile 50: 0.0052000000000000934
Percentile 90: 0.015500000000000047
Std: 0.0063790857035425025
Var: 4.06873389299246e-05

28
আমি মনে করি যে এখানে ভুল বুঝাবুঝি হ'ল এমন বিতরণ যা কেবলমাত্র ইতিবাচক সংখ্যা থাকতে পারে তাই সাধারণ নয়, সুতরাং আপনার যে 99.7% বিধিটি উল্লেখ করা হয়েছে তা প্রয়োগ হয় না। দ্বিতীয়ত, (নমুনা) স্ট্যান্ডার্ড বিচ্যুতি সূত্র থেকে আপনি দেখতে পাচ্ছেন যে মূল মানগুলির ইতিবাচক হওয়ার কোনও শর্ত নেই - তবে কেন এটি ভুল হওয়া উচিত? এটি হতে পারে যে এটি ভুলভাবে ব্যবহৃত হয়েছে, তবে পরিসংখ্যানগুলি বেশিরভাগই অজ্ঞেয়বাদী এবং মূর্খতার সাথে প্রয়োগ করা উচিত নয়।
মোমো

8
68-95-99.7 নিয়ম, @Momo, সৌন্দর্য যে এটা করে অনেক নিশ্চিতভাবে অ সাধারন ডিস্ট্রিবিউশন এমনকি প্রযোজ্য। এই ক্ষেত্রে 50% সংখ্যার গড় 1 sd এর মধ্যে এবং 100% এর গড় 2 sd মধ্যে হয়। লক্ষ করুন যে 68% সঠিকভাবে প্রায় 50% এবং 95% নির্ভুলভাবে 100% সঠিকভাবে প্রায় যে পরিমাণ পরিবর্তনগুলি আমরা এরকম একটি ছোট ডেটাসেটের প্রত্যাশা করতাম তার মধ্যে প্রায় কাছাকাছি হয়। সুতরাং, এই উদাহরণটি থাম্বের বিধিটিকে চিত্রিত করে, যদিও এটি ছোট আকারের কারণে এটি কিছুটা অবিশ্বাস্য হতে পারে।
whuber

2
আমি রাজী. আমাকে এটি "এটিকে সংশোধন করতে দিন সুতরাং আপনার যে 99.7% নিয়ম উল্লেখ করেছেন তা প্রয়োজনীয়ভাবে প্রয়োগ হয় না "। এখানে বিভ্রান্তির উত্সটি এটিকে আঙ্গুলের নিয়মের চেয়েও বেশি কিছু হিসাবে প্রয়োগ করার মতো মনে হচ্ছে এবং এটি আপনার অনুন্নত হিসাবে বিবেচনা করবে না "প্রায় আমরা যে বিচ্যুতির আশা করব"। ওপিএসের সর্বশেষ মন্তব্যটি কেবল এটি দেখায়।
মোমো

4
"কীভাবে ইতিবাচক হতে হবে এমন ডেটাতে 68-95-99.7 বিধি প্রয়োগ করতে হবে" এর মতো কিছুতে শিরোনামটি পরিবর্তন করা উচিত? আমি মনে করি যে প্রশ্নের আরও চেতনা ধারণ করে। (মানক বিচ্যুতির গণনা যেভাবে করা হচ্ছে তাতে কোনও সমস্যা নেই, যা শিরোনাম প্রস্তাব দেয়, বরং সম্ভাব্যতা অনুসন্ধানে এটি যেভাবে ব্যবহার করা হচ্ছে।)
সিলভারফিশ

4
স্ট্যান্ডার্ড বিচ্যুতি "ভুল" নয়। কম সঠিক যা সাধারণ জিনিস হিসাবে বিবেচনা করা হয় যা নয়; স্বাভাবিকতার দ্বারা আরোপিত একটি নির্দিষ্ট সংখ্যক মানক বিচ্যুতির বাইরে থাকা অনুপাতগুলি অন্যান্য বিতরণের ক্ষেত্রে সর্বদা সঠিক হবে না। ক্রমাগত ইউনিমোডাল বিতরণগুলির জন্য, 2 স্ট্যান্ডার্ড বিচ্যুতির কাছাকাছি দ্বি-পার্শ্ববর্তী বিরতিগুলি প্রায়শই বেশ যুক্তিসঙ্গত হয় তবে আরও দূরে লেজের সম্ভাবনাগুলির মধ্যে খুব বেশি আপেক্ষিক ত্রুটি থাকতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


23

যদি আপনার সংখ্যাগুলি কেবল ইতিবাচক হতে পারে তবে আপনার ব্যবহারের ক্ষেত্রে তার উপর নির্ভর করে সাধারণ বন্টন হিসাবে মডেলিং করা বাঞ্ছনীয় নয়, কারণ সাধারণ বিতরণ সমস্ত আসল সংখ্যার উপর সমর্থন করে।

সম্ভবত আপনি উচ্চতার মডেলটি ঘনিষ্ঠভাবে বিতরণ হিসাবে বেছে নিতে চান, বা সম্ভবত কোনও কাটা সাধারণ বিতরণ?

λ


10
প্রথম বাক্যটি সাধারণভাবে সঠিক নয়: অনেক পরিমাণে যা কঠোরভাবে ইতিবাচক হয় প্রায়শই সাধারণ বন্টন দ্বারা প্রায় অনুমান করা যায়। 0 এর নীচে সম্ভাবনার ভর যদি খুব ছোট হয় তবে সমস্ত ব্যবহারিক উদ্দেশ্যে এটি বিবেচনা করে না। এই বিশেষ ক্ষেত্রে, এটি অবশ্যই সঠিক।
COOLSerdash

13
-1 এই উত্তরটি একটি পরিসংখ্যানগত মডেল কী এবং একটি সাধারণ বন্টন সহ ডেটা মডেল করার প্রকৃত অর্থ কী তা সম্পর্কে একটি বিস্তৃতভাবে অনুষ্ঠিত (এবং imho ক্ষতিকারক) ভুল ধারণাটি প্রতিফলিত করে। প্রকৃতপক্ষে, যদি আমরা এই পোস্টটি যা বলে বিশ্বাস করি, তবে এটি একটি সাধারণ বিতরণের সাথে দ্বিপদী বিতরণকে আনুমানিকভাবে "ভুল" হতে পারে - তবে এটি historতিহাসিকভাবেই সাধারণ বিতরণের মূল এবং সম্ভবত সবচেয়ে বিস্তৃত ব্যবহার! (সম্পাদনা করুন:
ডাউন ডাউনটি

4
এটি "উচ্চতর" বলতে কী বোঝায় তার উপর নির্ভর করে। কোনও মডেলের ব্যয়ের একটি অংশ এটি কার্যকর করতে যা লাগে তা তার মধ্যে রয়েছে। যদি আপনি কোনও ছাঁটাই করা সাধারণ মডেল গ্রহণ করেন, আপনি সম্ভবত নিজেকে দ্রুত, সহজ এবং সম্ভবত সুন্দরভাবে বিশ্লেষণী গণনার পরিবর্তে অনেকগুলি কাস্টম সংখ্যার গণনায় প্রতিশ্রুতি দিচ্ছেন। একটি মডেলের আরেকটি উদ্দেশ্য অন্তর্দৃষ্টি প্রদান করা : একজন মনে করেন, "প্রকৃতি যদি কমপক্ষে এই অনুমানগুলির মতো আচরণ করে তবে এই অনুমানগুলি থেকে কী পরিণতি অনুমান করা যেতে পারে?" প্রায়শই, সাধারণ অনুমানের সাথে এই জাতীয় সূত্রগুলি তৈরি করা আরও সহজ।
whuber

2
@ শুভ: "সুন্দরভাবে নির্ভুল" পরে আমি মানসিকভাবে "ভুল" যুক্ত করেছি। দুঃখিত। অবশ্যই, প্রতি বাক্সে "তবে দরকারী"।
স্টিফান কোলাসা

2
যদিও ডেটাতে অ-পূর্ণসংখ্যার মান থাকে?
কেভিন লি

19

"আমার ক্ষেত্রে 68-95-99.7 প্রয়োগ করার সঠিক উপায় কী?"

আপনি কেবল (1) সম্পূর্ণ (অসীম) জনসংখ্যা বা তাত্ত্বিক সম্ভাবনার বন্টনটি দেখছেন এবং (2) বিতরণটি ঠিক স্বাভাবিক হলে কভারেজটির আঙ্গুলের নিয়মটি ঠিক প্রয়োগ করা উচিত ।

আপনি যদি আকার ২০ এর একটি এলোমেলো নমুনা গ্রহণ করেন, এমনকি সত্যিকারের সাধারণ বিতরণ থেকেও, আপনি সর্বদা খুঁজে পাবেন না যে 95% তথ্য (20 আইটেমের মধ্যে 19) গড়ের 2 (বা 1.960) স্ট্যান্ডার্ড বিচ্যুতির মধ্যে রয়েছে। বাস্তবে এটির কোনও গ্যারান্টি নেই যে ২০ টি আইটেমের মধ্যে ১৯ টি জনসংখ্যার ১.৯60০ জনসংখ্যার মানক বিচ্যুতির মধ্যে পড়ে থাকবে, বা ২০ টি আইটেমের মধ্যে ১৯ টি নমুনাটির নমুনার মানক বিচ্যুতির মধ্যে থাকা নয়।

আপনি যদি এমন বিতরণ থেকে উপাত্তের নমুনা নেন যা সাধারণত বিতরণ করা হয় না, তবে আবার কেউ 68-95-99.7 বিধিটি সঠিকভাবে প্রয়োগ করবে বলে আশা করবে না। তবে এটি কাজটি করার কাছাকাছি আসতে পারে, বিশেষত যদি নমুনার আকার বড় হয় ("99.7% কভারেজ" নিয়মের অফ-থাম্বটি 1000 এর নীচে নমুনার আকারের সাথে বিশেষভাবে অর্থবহ নাও হতে পারে) এবং বিতরণটি যথাযথভাবে স্বাভাবিকতার কাছাকাছি। তত্ত্ব অনুসারে উচ্চতা বা ওজনের মতো প্রচুর ডেটা সঠিকভাবে বিতরণ হতে পারে না বা এটি একটি ছোট, তবে শূন্য নয়, তাদের সম্ভাবনা নেতিবাচক হওয়ার ইঙ্গিত দেয়। তবুও, প্রায় একটি প্রতিসম ও ইউনিমোডাল বিতরণ সহ ডেটাগুলির জন্য, যেখানে মিডলিং মানগুলি বেশি সাধারণ এবং অত্যন্ত উচ্চ বা নিম্ন মানের সম্ভাবনার সম্ভাবনা ছাড়িয়ে যায়, সাধারণ বিতরণের মডেল ব্যবহারিক উদ্দেশ্যে যথেষ্ট হতে পারে।যদি আমার হিস্টগ্রামটি বেল-আকৃতির বক্ররেখা দেখায়, আমি কি বলতে পারি যে আমার ডেটা সাধারণত বিতরণ করা হয়?

1/2গড় থেকে স্ট্যান্ডার্ড বিচ্যুতি। এটি গ্যারান্টি দেয় যে কমপক্ষে 75% ডেটা তিনটি গড় বিচ্যুততার মধ্যে এবং 89 টি স্ট্যান্ডার্ড বিচ্যুতির মধ্যে 89% থাকে। তবে এই পরিসংখ্যানগুলি কেবল তাত্ত্বিকভাবে-নিশ্চিত ন্যূনতম। প্রায় মোটামুটি ঘণ্টা আকারের বিতরণগুলির জন্য, আপনি দেখতে পাবেন যে দ্বিমুখী বিচ্যুতি কভারেজের পরিসংখ্যান %৫% এর তুলনায় 95% এর কাছাকাছি এসে গেছে, এবং তাই সাধারণ বিতরণ থেকে "থাম্বের নিয়ম" এখনও কার্যকর। অন্যদিকে, যদি আপনার ডেটা এমন বন্টন থেকে আসে যা বেল-আকৃতির কাছাকাছি নয়, আপনি একটি বিকল্প মডেল সন্ধান করতে পারবেন যা ডেটা আরও ভালভাবে বর্ণনা করে এবং এর আলাদা কভারেজের নিয়ম রয়েছে।

(68-95-99.7 র নিয়ম সম্পর্কে একটি জিনিস যা দুর্দান্ত তা হ'ল এটি কোনও সাধারণ বিতরণের ক্ষেত্রে প্রযোজ্য , গড় বা মানক বিচ্যুতির জন্য তার প্যারামিটার নির্বিশেষে। একইভাবে, চেবিশেভের অসমতাটি পরামিতিগুলি বা এমনকি বিতরণে নির্বিশেষে প্রযোজ্য, যদিও কেবল কভারেজটির জন্য নিম্ন সীমানা দেয় But তবে আপনি যদি প্রয়োগ করেন, উদাহরণস্বরূপ, একটি কাটা সাধারণ বা স্কিউ সাধারণ মডেল, তবে "68-95-99.7" কভারেজের সাধারণ সমতুল্য নেই, কারণ এটি বিতরণের পরামিতিগুলির উপর নির্ভর করবে ।)


7

আমি কি এটি সঠিক উপায়ে ব্যবহার করছি তা বুঝতে কেউ আমাকে সহায়তা করতে পারে?

ওহ, এটা সহজ। না, আপনি এটি সঠিকভাবে ব্যবহার করছেন না।

প্রথমত, আপনি বরং একটি ছোট ডেটা সেট ব্যবহার করছেন। এই আকারের সেট থেকে পরিসংখ্যানগত আচরণ ছড়িয়ে দেওয়ার চেষ্টা করা অবশ্যই সম্ভব তবে আত্মবিশ্বাসের সীমা (আহেম) বরং বড়। ছোট ডেটা সেটগুলির জন্য, প্রত্যাশিত বিতরণগুলি থেকে বিচ্যুতি অবশ্যই কোর্সের সমান এবং সেটটি যত ছোট হবে সমস্যা তত বেশি। মনে রাখবেন, "গড় আইন" কেবলমাত্র সবচেয়ে মারাত্মক কাকতালীয় ঘটনাগুলিকেই অনুমতি দেয় না, এটির প্রয়োজন। "

সবচেয়ে খারাপ বিষয়, আপনি যে নির্দিষ্ট ডেটা সেটটি ব্যবহার করছেন তা সাধারণ বিতরণের মতো লাগে না। এটি সম্পর্কে চিন্তা করুন - .498 এর মধ্য দিয়ে আপনি 0.1 এর নীচে দুটি নমুনা পেয়েছেন এবং .748 বা তদুর্ধে আরও তিনটি নমুনা পেয়েছেন। তারপরে আপনি .17 এবং .22 এর মধ্যে 3 পয়েন্টের একটি ক্লাস্টার পেয়েছেন। এই নির্দিষ্ট ডেটা সেটটির দিকে তাকানো এবং তর্ক করা যে এটি অবশ্যই স্বাভাবিক বন্টন হতে হবে প্রোক্রাস্টিয়ান যুক্তির একটি খুব ভাল ক্ষেত্রে। এটি কি আপনাকে বেল বাঁকানোর মতো দেখাচ্ছে? এটি পুরোপুরি সম্ভব যে বৃহত্তর জনগোষ্ঠী একটি সাধারণ, বা পরিবর্তিত সাধারণ, বন্টন এবং বৃহত্তর নমুনার আকারের বিষয়টি অনুসরণ করবে, তবে আমি জনগণের সম্পর্কে আরও কিছু না জেনেও তাতে বাজি ধরব না।

আমি বলি স্বাভাবিক পরিবর্তিত, যেহেতু কেভিন লি উল্লেখ করেছেন, প্রযুক্তিগতভাবে একটি সাধারণ বিতরণে সমস্ত আসল সংখ্যা রয়েছে। তাঁর উত্তরের মন্তব্যে যেমন উল্লেখ করা হয়েছিল, এটি সীমিত পরিসরে এই জাতীয় বিতরণ প্রয়োগ করা এবং কার্যকর ফলাফল পেতে বাধা দেয় না। প্রবাদটি যেমন চলে যায়, "সমস্ত মডেল ভুল Some কিছু কিছু কার্যকর।"

তবে এই নির্দিষ্ট ডেটা সেটটি সাধারণ বিতরণ (এমনকি সীমিত সীমারও বেশি) অনুমান করার মতো দেখায় না এটি একটি বিশেষভাবে ভাল ধারণা। যদি আপনার 10 ডেটা পয়েন্টগুলি .275, .325, .375, .425, .475, .525, .575, .625, .675, .725 (0.500 এর মাঝামাঝি) এর মতো দেখায়, আপনি কি সাধারণ বিতরণ অনুমান করবেন?


আমি আমার প্রয়োজন এবং সমস্যাটি ব্যাখ্যা করতে সক্ষম হতে এলোমেলো ডেটা ব্যবহার করেছি
ডন কোডার

1
@ ডনকোডার র‌্যান্ডম ডেটা (যদি আপনি এটি কোনও উপায়ে টুইট করেন না) অভিন্ন বিতরণ অনুসরণ করবেন, সাধারণ বিতরণ নয়।
ব্যারিকার্টার

5
কিছু বিতরণ থেকে এলোমেলো ডেটা তৈরি করা দরকার। আপনি কোনটি বেছে নিয়েছেন?
পিটার ফ্লুম - মনিকা পুনরায়

আমি আমার আসল ডেটাটির হিস্টোগ্রাম যুক্ত করেছি
ডন কোডার

2

একটি মন্তব্যে আপনি বলেছেন যে আপনি "এলোমেলো ডেটা" ব্যবহার করেছেন তবে কোন বিতরণ থেকে আপনি তা বলতে পারেন না। যদি আপনি মানুষের উচ্চতা সম্পর্কে কথা বলছেন তবে এগুলি প্রায় সাধারণত বিতরণ করা হয় তবে আপনার ডেটাগুলি মানব উচ্চতার জন্য দূরবর্তীভাবে উপযুক্ত নয় - আপনার এক সেন্টিমিটারের ভগ্নাংশ!

এবং আপনার ডেটা দূরবর্তীভাবে স্বাভাবিক নয়। আমি অনুমান করছি যে আপনি 0 এবং 1 এর সীমানা সহ অভিন্ন বিতরণ ব্যবহার করেছেন এবং আপনি একটি খুব ছোট নমুনা তৈরি করেছেন। একটি বড় নমুনা দিয়ে চেষ্টা করুন:

set.seed(1234)  #Sets a seed
x <- runif(10000, 0 , 1)
sd(x)  #0.28

সুতরাং, ডেটাগুলির কোনওটিই গড় থেকে 2 এসডি এর বাইরে নয়, কারণ এটি ডেটা সীমা ছাড়িয়ে। এবং 1 এসডির মধ্যে অংশটি প্রায় 0.56 হবে be


1

প্রায়শই, যখন আপনার প্রতিবন্ধকতা রয়েছে যে আপনার নমুনাগুলিগুলি অবশ্যই সব ধনাত্মক হওয়া উচিত, আপনার ডেটা লগারিদমটি দেখার জন্য আপনার ডিগ্রিবিজ্ঞানটি কোনও লগন্যরমাল বিতরণ দ্বারা সন্নিকট করা যায় কিনা তা দেখার জন্য এটি মূল্যবান।


1

একটি আদর্শ বিচ্যুতি গণনা গড়ের সাথে তুলনামূলক। আপনি কি সর্বদা ধনাত্মক এমন সংখ্যায় মানক বিচ্যুতি প্রয়োগ করতে পারেন? একেবারে। আপনি যদি আপনার নমুনা সেটের প্রতিটি মানগুলিতে 1000 যুক্ত করে থাকেন তবে আপনি একই স্ট্যান্ডার্ড বিচ্যুতির মান দেখতে পাবেন তবে আপনি নিজেকে শূন্যের বেশি শ্বাস প্রশ্বাসের ঘর সরবরাহ করবেন।

গুলি=Σআমি=1এন(এক্সআমি-এক্স¯)2এন-1=Σআমি=1এন((এক্সআমি+ +)-(এক্স¯+ +))2এন-1

যাইহোক, আপনার ডেটাতে একটি স্বেচ্ছাসেবক ধ্রুবক যোগ করা অতিমাত্রায়। এত ছোট কোনও ডেটা সেট করার জন্য স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করার সময়, আপনাকে অপরিশোধিত আউটপুট আশা করতে হবে। একটি অটো-ফোকাস ক্যামেরা লেন্সের মতো স্ট্যান্ডার্ড বিচ্যুতি বিবেচনা করুন: আপনি যত বেশি সময় (ডেটা) দেবেন, ছবিটি তত বেশি পরিষ্কার হবে। আপনি যদি 1000000 ডেটা পয়েন্ট ট্র্যাক করার পরে, আপনার গড় এবং স্ট্যান্ডার্ড বিচ্যুতি 10 এর মতোই থেকে যায় তবে আমি আপনার পরীক্ষার বৈধতা নিয়ে প্রশ্ন করতে শুরু করব।


1

আপনার হিস্টগ্রামটি দেখায় যে সাধারণ বিতরণ ভাল মানানসই নয়। আপনি লগন্যরমাল বা অন্য কিছু যা অসমমিত এবং কঠোরভাবে ইতিবাচক চেষ্টা করতে পারেন


1

মূল কথাটি হ'ল আমাদের অনেকগুলি অলস * এবং সাধারণ বিতরণটি আমাদের পক্ষে অলস লোকদের সাথে কাজ করা সুবিধাজনক। সাধারণ বিতরণ ব্যবহার করে গণনা করা সহজ এবং এর গাণিতিক ভিত্তি খুব ভাল। যেমন ডেটাতে কীভাবে কাজ করা যায় এটি একটি "মডেল"। এই মডেলটি প্রায়শই আশ্চর্যজনকভাবে ভালভাবে কাজ করে এবং কখনও কখনও তার মুখের উপর সমতল হয়।

এটি খুব স্পষ্ট যে আপনার নমুনাগুলি ডেটাতে একটি সাধারণ বিতরণ নির্দেশ করে না। সুতরাং আপনার দ্বিধাদ্বন্দ্বের সমাধান হ'ল ভিন্ন "মডেল" চয়ন করা এবং একটি ভিন্ন বিতরণ নিয়ে কাজ করা। ওয়েবেল বিতরণগুলি দিকনির্দেশে থাকতে পারে, অন্যরাও আছেন।

  • প্রয়োজনে ডেটা সত্যিই না জানতে এবং প্রয়োজনের পরে আরও ভাল মডেলগুলি বেছে নিতে অলস।

0

মূলত আপনি অনুপাতের ডেটার বিপরীতে অনুপাতের ডেটা ব্যবহার করছেন। ভূগোলবিদরা নির্দিষ্ট স্থানে বার্ষিক বৃষ্টিপাতের জন্য এস / ডি গণনা করার সময় (ল্যা সিভিক সেন্টার বলার জন্য নমুনা পয়েন্টগুলির 100+ বছর) বা তুষারপাত (বিগ বিয়ার লেকের 100+ বছর ধরে তুষারপাতের নমুনাগুলি) গণনা করার সময় এই সমস্ত সময় অতিক্রম করে। আমাদের কেবল ইতিবাচক সংখ্যা থাকতে পারে, এটি কেবল এটিই।


0

আবহাওয়াবিদ্যায়, বাতাসের গতির বন্টন অনেকটা এ জাতীয় দেখায়। সংজ্ঞা অনুসারে বাতাসের গতিও অ-নেতিবাচক।

সুতরাং আপনার ক্ষেত্রে, আমি স্পষ্টভাবে ওয়েইবুল বিতরণের দিকে নজর দেব ।


0

আপনার ডেটা স্পষ্টভাবে সাধারণ বিতরণ না হলে আপনি "সাধারণ বিতরণ অনুযায়ী" দিয়ে শুরু করেন, এটিই প্রথম সমস্যা। আপনি বলছেন "এটি সাধারণ বিতরণ কিনা তা বিবেচ্য নয়" " যা পরম বাজে কথা। আপনার ডেটা স্বাভাবিক বিতরণ না করা হলে আপনি সাধারণ বিতরণকৃত ডেটা সম্পর্কে বিবৃতি ব্যবহার করতে পারবেন না।

এবং আপনি বিবৃতিটির ভুল ব্যাখ্যা করেন। "99.7% অবশ্যই তিনটি স্ট্যান্ডার্ড বিচ্যুতির মধ্যে থাকতে হবে"। এবং আপনার ডেটার 99.7% প্রকৃতপক্ষে তিনটি স্ট্যান্ডার্ড বিচ্যুতির মধ্যে ছিল । আরও ভাল, এটি দুটি স্ট্যান্ডার্ড বিচরণের মধ্যে 100% ছিল। সুতরাং বিবৃতি সত্য

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.