মানে নিখুঁত বিচ্যুতি বনাম মানক বিচ্যুতি


35

গ্রেয়ার (1983) দ্বারা "ও লেভেলের জন্য নতুন কমপ্রেইনসিভ ম্যাথমেটিক্স" পাঠ্য বইয়ে , আমি গড় গণ্যমান্য বিচ্যুতিটি এইভাবে গণ্য করতে দেখি:

একক মান এবং গড়ের মধ্যে নিখুঁত পার্থক্য যোগ করুন। তারপরে তার গড় পান। অধ্যায়ের শব্দটির অর্থ হ'ল বিচ্যুতি শব্দটি ব্যবহৃত হয়।

তবে আমি সম্প্রতি বেশ কয়েকটি উল্লেখ দেখেছি যা স্ট্যান্ডার্ড বিচ্যুতি শব্দটি ব্যবহার করে এবং তারা এটি করে:

একক মান এবং গড়ের মধ্যে পার্থক্যগুলির স্কোয়ার গণনা করুন। তারপরে তাদের গড় এবং শেষ পর্যন্ত উত্তরের মূলটি পান।

আমি উভয় পদ্ধতিতে ডেটাগুলির একটি সাধারণ সেটে চেষ্টা করেছি এবং তাদের উত্তরগুলি পৃথক। আমি কোনও পরিসংখ্যানবিদ নই। আমার বাচ্চাদের বিচ্যুতি শেখানোর চেষ্টা করার সময় আমি বিভ্রান্ত হয়ে পড়েছিলাম।

সুতরাং সংক্ষেপে, পদগুলি কি আদর্শ বিচ্যুতি এবং মানে বিচ্যুতি একই বা আমার পুরাতন পাঠ্যপুস্তকটি ভুল?


2
দুটি পরিমাণে পৃথক। তারা ডেটা আলাদাভাবে ওজন। স্ট্যান্ডার্ড বিচ্যুতি আরও বড় হবে এবং এটি বৃহত্তর মান দ্বারা তুলনামূলকভাবে বেশি প্রভাবিত হয়। স্ট্যান্ডার্ড বিচ্যুতি (বিশেষত, এন-ডিনোমিনেটর সংস্করণ )টিকে মূল-বর্গ-বিভক্ত বিচ্যুতি হিসাবে ভাবা যেতে পারে। স্ট্যান্ডার্ড বিচ্যুতিগুলি বেশি ব্যবহৃত হয়।
গ্লেন_বি -রিনস্টেট মনিকা

6
খুব ঘনিষ্ঠভাবে সম্পর্কিত : stats.stackexchange.com/questions/118/…
হোয়বার


1
ঘটনাক্রমে, লোকেরা স্ট্যান্ডার্ড বিচ্যুতি পছন্দ করার একটি কারণ হ'ল সম্পর্কহীন এলোমেলো ভেরিয়েবলের পরিমাণের পরিমাণগুলি যুক্ত হয় (এবং এর সাথে সম্পর্কিতগুলির একটি সহজ সূত্রও থাকে)। এটি গড় বিচ্যুতি দিয়ে ঘটে না।
গ্লেন_বি -রিনস্টেট মনিকা

2
nপদার্থগুলি যখন জড়িত সূত্রগুলিকে মানে করে, উদাহরণস্বরূপ এক-নমুনা টি-পরিসংখ্যানের মতো)। গড় বিচ্যুতির জন্য যথাযথভাবে কোনও সাধারণ ঘটনা নেই।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


27

উভয়ই উত্তর দেয় যে পর্যালোচনাগুলির মাঝখানে আপনার মানগুলি কতদূর ছড়িয়ে রয়েছে।

গড়ের নীচে 1 থাকা একটি পর্যবেক্ষণ গড় থেকে 1 এর চেয়ে বেশি মানের হিসাবে গড় থেকে সমান "দূরে"। সুতরাং আপনার বিচ্যুতির চিহ্নটিকে অবহেলা করা উচিত। এটা দুইভাবে সম্পাদন করা যেতে পারে:

  • বিচ্যুতির পরম মান গণনা করুন এবং এগুলি যোগ করুন।

  • বিচ্যুতিগুলি স্কোয়ার করুন এবং এই স্কোয়ারগুলি যোগ করুন। বর্গক্ষেত্রের কারণে, আপনি উচ্চ বিচ্যুতির ক্ষেত্রে আরও বেশি ওজন দেন এবং তাই এই স্কোয়ারগুলির যোগফল অর্থের যোগফলের চেয়ে আলাদা হবে।

"পরম বিচ্যুতির যোগফল" বা "স্কোয়ার বিচ্যুতির যোগফলের বর্গমূল" গণনা করার পরে, আপনি যথাক্রমে "গড় বিচ্যুতি" এবং "স্ট্যান্ডার্ড বিচ্যুতি" পেতে তাদের গড় নির্ধারণ করেন।

গড় বিচ্যুতি খুব কমই ব্যবহৃত হয়।


সুতরাং যখন কেউ কেবল 'বিচ্যুতি' বলে থাকে তখন তাদের অর্থ কী 'প্রমিত বিচ্যুতি'?
itsols

আমি সম্মত হই যে উপরে বা নীচে 1 জন সাধারণ মানুষের দৃষ্টিভঙ্গি থেকে অর্থবহ 'পরিবর্তন' বা 'ছত্রভঙ্গ' নির্দেশ করবে। তবে এটি স্কোয়ারিংয়ের ফলে বৃহত্তর মান হবে এবং এটি আমার 'আসল পরিবর্তন' নাও হতে পারে। হয়তো আমি ভুল কিন্তু যে কিভাবে আমি এটা দেখতে আছে: /
itsols

বেশিরভাগ সময় স্ট্যান্ডার্ড বিচ্যুতি (বিবর্তনের বর্গমূল) শব্দটি ব্যবহৃত হয়। স্কোয়ারগুলি গণনা করা সাধারণত সম্পন্ন হয়, কারণ এটি প্রচুর পরিমাণে অন্যান্য গণনার সুবিধে করে।
ক্যাস্পার

1
@itsols প্রযুক্তিগতভাবে, আপনি সর্বদা নির্দিষ্ট করতে হবে যে আপনি ডেটা সেটের জন্য কোন ধরণের বিচ্যুতি পরিসংখ্যান গণনা করছেন - তার নিজের দ্বারা বিচ্যুতি শব্দের অর্থটি একটিমাত্র ডেটাপয়েন্টের বিচ্যুতিকে বোঝানো উচিত (ক্যাস্পার উত্তরে যেভাবে এটি ব্যবহার করে) )।
অমেলিয়াবিআর

@itsols, +1 থেকে অ্যামেলিয়ায়। প্রকৃতপক্ষে, কোনও ডেটাসেটের পরিসংখ্যানকে কেবল "বিচ্যুতি" হিসাবে বলে না। একটি পরিসংখ্যান হ'ল "গড় পরম বিচ্যুতি" বা "গড় স্কোয়ার্ড বিচ্যুতির মূল" বা এই জাতীয়।
ttnphns

15

আজ, পরিসংখ্যানগত মানগুলি মূলত কম্পিউটার প্রোগ্রামগুলি (এক্সেল, ...) দ্বারা গণনা করা হয়, হাতে থাকা ক্যালকুলেটরগুলির দ্বারা আর নয়। সুতরাং, আমি পোষ্ট করব যে "গড় বিচ্যুতি" গণনা করা "স্ট্যান্ডার্ড বিচ্যুতি" গণনার চেয়ে আর জটিল নয়। যদিও স্ট্যান্ডার্ড বিচ্যুতিতে "... গাণিতিক বৈশিষ্ট্য থাকতে পারে যা এটি পরিসংখ্যানগুলিতে আরও কার্যকর করে তোলে", এটি বাস্তবে একটি গড় থেকে বৈকল্পিক ধারণার একটি বিকৃতি, যেহেতু এটি মাধ্যম থেকে ডেটা পয়েন্টগুলিকে অতিরিক্ত ওজন দেয়। এটি কিছুটা সময় নিতে পারে, তবে আমি এক হিসাবে আশা করি যে পরিসংখ্যানবিদরা প্রায়শই ডেটা পয়েন্টগুলির মধ্যে বন্টন নিয়ে আলোচনা করার সময় "গড় বিচ্যুতি" ব্যবহার করে ফিরে এসেছেন - এটি আরও সঠিকভাবে উপস্থাপন করে যে আমরা আসলে কীভাবে বিতরণটি চিন্তা করি।


(পরিসংখ্যানগতভাবে যোগ্য) লোকেরা কীভাবে "আসলেই ভাবেন" সে সম্পর্কে আপনি একটি অসাধারণ দাবি করেন। সে সম্পর্কে আপনার তথ্যের উত্স কী?
হোবার

7
উত্সটি কেবল সেই ব্যক্তি যাদের আমি এই বিষয়টিতে নিজেরাই পাশাপাশি প্রশ্ন করেছি। যখন জিজ্ঞাসা করা হয়: আপনি কীভাবে এই ডেটা সেটে তারতম্যকে চিত্রিত করেন? প্রতিক্রিয়া সর্বদা গড় থেকে লিনিয়ার দূরত্বের শর্তে প্রকাশিত হয়েছিল - প্রতিক্রিয়াটি কখনও স্কোয়ার বা বর্গমূলের অন্তর্ভুক্ত হয় না। মঞ্জুর, আমি একজন প্রকৌশলী, "পরিসংখ্যানবিদ" নই, তবে আমি অন্য কাউকে এই বিষয়টিতে তাদের চ্যালেঞ্জ জানাতে বলব। হ্যাঁ, আমরা স্ট্যান্ডার্ড বিচ্যুতির গণিত পছন্দ করি - এটি মজাদার তবে আপনি কি সত্যিকার অর্থে বিচ্যুতিটিকে চিত্রিত করেন?
andyl

2
এটা উদ্দেশ্য উপর নির্ভর করে। ডেটা অন্বেষণের জন্য, আমি প্রসারণের দৃ ,়, র‌্যাঙ্ক-ভিত্তিক প্রাক্কলন, যেমন মিডিয়ানদের মধ্য থেকে মধ্যযুগীয় বিচ্যুতিগুলি ব্যবহার করার প্রবণতা ব্যবহার করি, যা আপনার প্রস্তাবের কাছাকাছি spirit তবে অন্যান্য অনেক কাজের জন্য, বিশেষত পরিসংখ্যানগত তাত্পর্য সম্পর্কে সম্ভাব্যতা (এমনকি মানসিকভাবে) মূল্যায়ন করার সময়, উপযুক্ত নমুনার আকারগুলি নির্ধারণ করা, তথ্যের মূল্য নির্ধারণ করা, এবং প্রতিদ্বন্দ্বী পরিসংখ্যান পদ্ধতির মধ্যে সিদ্ধান্ত নেওয়া, ভেরিয়েন্সগুলির বিবেচনায় (এবং সুতরাং স্ট্যান্ডার্ড বিচ্যুতি) অপরিহার্য। গণিতের স্পষ্টরূপে দেখানো হয়েছে, গড় বিচ্যুতির বিকল্প নেই।
হোবার

1
পরীক্ষা করে দেখুন এই কাগজ
পিট

আপনি কীভাবে সেখানে পৌঁছেছেন?
ভিক্রোবট

9

তারা উভয়ই একই ধারণা পরিমাপ করে তবে সমান নয়।

1n|xix¯|1n(xix¯)2

a+ba+b
|xix¯|=(xix¯)2(xix¯)2

n

গণনা করার চেষ্টা করুন1n(xix¯)2

স্ট্যান্ডার্ড বিচ্যুতিটি কেন পছন্দ করা হয় তার কারণ হ'ল গণনা আরও পরে জটিল হয়ে ওঠে, যখন গণনা আরও জটিল হয়।


3
একটি সমষ্টি পরম মান না , পরম মানের সমষ্টি হিসাবে একই সাধারণভাবে! বর্গক্ষেত্র, বর্গমূল বা নিরঙ্কুশ ফাংশন দুটিই লিনিয়ার নয়, এ কারণেই ফাংশন প্রয়োগের পরে যোগফল যোগফল গ্রহণের পরে ফাংশন প্রয়োগ করা থেকে আলাদা।
অ্যামেলিয়াবিআর

@ আমেলিয়াবিআর আপনি অবশ্যই পুরোপুরি সঠিক!
ltronneberg

বাকী যুক্তিটি ভাল ছিল, যদিও, তাই আমি সমস্যাযুক্ত বিবৃতিটি সম্পাদনা করার সিদ্ধান্ত নিয়েছিলাম।
অমেলিয়াবিআর

8

@ আইসোলস, আমি ক্যাস্পারের গুরুত্বপূর্ণ ধারণাটি যুক্ত করব The mean deviation is rarely usedকেন সাধারন বিচ্যুতিকে পরিপূর্ণ বিচ্যুতির চেয়ে সাধারণত পরিবর্তনের আরও ভাল পরিমাপ হিসাবে বিবেচনা করা হয়? কারণ গাণিতিক গড় ন্যূনতম সমষ্টি রুম হয় ছক তা থেকে বিচ্যুতি (এবং পরম এর সমষ্টি নয়)।

মনে করুন আপনি পরার্থতার ডিগ্রি মূল্যায়ন করতে চান। তারপরে আপনি সম্ভবত কোনও ব্যক্তিকে জিজ্ঞাসা করবেন না যে তিনি জীবনের "সাধারণ পরিস্থিতিতে" অর্থ প্রদানে কতটা প্রস্তুত। বরং আপনি জিজ্ঞাসা করতে বেছে নেবেন যে স্থির অবস্থায় তিনি এটি করতে কতটা প্রস্তুত, যেখানে তাঁর নিজের জীবনযাত্রার জন্য ন্যূনতম সম্ভাব্য রিসোর্স রয়েছে। অর্থাত্ সেই পরিমাণ ব্যক্তির ন্যূনতম হলে পরিস্থিতিতে স্বতন্ত্র পরোপকারের পরিমাণ কত?

তেমনি, এই তথ্যগুলির পরিবর্তনশীলতার ডিগ্রি কী? স্বজ্ঞাতভাবে, এর জন্য সর্বোত্তম পরিমাপের সূচকটি হ'ল যা এই প্রসঙ্গে সীমাবদ্ধতার চেয়ে কম (বা সর্বাধিক) করা হয়েছে ized প্রসঙ্গটি "গাণিতিক গড়ের চারপাশে"। তারপরে স্ট্যান্ড বিচ্যুতি এই অর্থে সেরা পছন্দ। যদি প্রসঙ্গটি "মাঝারি চারপাশে" থাকে তবে তার অর্থ | বিচ্যুতি | সেরা পছন্দ হবে, কারণ মধ্যমা এটি থেকে সর্বনিম্ন বিচ্যুতির সর্বনিম্ন যোগের পঙ্গু is


4
লোকাসের উপর ভিত্তি করে আপনার এসডি করার ন্যায্যতা বিজ্ঞপ্তিযুক্ত। আপনি পাটিগণিত গড়ের উপরে বিশেষ গুরুত্ব দিয়ে এসডিকে ন্যায্যতা দিচ্ছেন - এই সমস্ত শোতে তাদের একটি সম্পর্ক রয়েছে, এসডি বিশেষ নয়। একইভাবে মধ্যস্থকেও গুরুত্ব দেওয়া যায়, যা নিরপেক্ষ ক্ষতির সর্বনিম্ন অঙ্কের লোকাল । এসডি বেশি ব্যবহৃত হয় এর আসল কারণ হ'ল গণিতের সাথে কাজ করা আরও সহজ ... তদুপরি, এটি গণনাগতভাবে আরও সহজ (উভয় কারণেই মিডিয়ানদের "বাছাই" করা প্রয়োজন, এবং শাখা বিবৃতিগুলির চেয়ে স্কোয়ারগুলি দ্রুত গতিতে হয়)। দার্শনিকভাবে মূর্খ বিচ্যুতির বেশি মূল্য রয়েছে।
সামতিবেস্ট

7

একটি বিষয় যোগ করার মতো বিষয় হ'ল আপনার 30 বছরের পুরাতন পাঠ্যপুস্তকটি আদর্শ বিচ্যুতির বিপরীতে নিখুঁত গড় বিচ্যুতিটি ব্যবহার করার কারণ হ'ল হাত দ্বারা গণনা করা সহজ (কোনও স্কোয়ারিং / বর্গমূল নয়)। এখন যেহেতু ক্যালকুলেটরগুলি উচ্চ বিদ্যালয়ের শিক্ষার্থীদের জন্য সহজেই অ্যাক্সেসযোগ্য, তাদের স্ট্যান্ডার্ড বিচ্যুতি গণনা করতে বলার কোনও কারণ নেই।

এখনও কিছু পরিস্থিতি রয়েছে যেখানে জটিল মডেল ফিটিংয়ে স্ট্যান্ডার্ড বিচ্যুতির পরিবর্তে পরম বিচ্যুতি ব্যবহার করা হয়। নিখুঁত বিচ্যুতিগুলি স্ট্যান্ডার্ড বিচ্যুতির তুলনায় চূড়ান্ত আউটলিয়ারের (গড় / ট্রেন্ডলাইন থেকে অনেক বেশি মান) কম সংবেদনশীল কারণ অন্য ডেটা পয়েন্ট থেকে মানগুলিতে এটি যোগ করার আগে তারা সেই দূরত্বটিকে বর্গাকার করে না। যেহেতু মডেল ফিটিং পদ্ধতির লক্ষ্য ট্রেন্ডলাইন থেকে মোট বিচ্যুতি হ্রাস করা (যে কোনও পদ্ধতি বিচ্যুতি গণনা অনুযায়ী), যে পদ্ধতিগুলি স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করে এমন একটি ট্রেন্ডলাইন তৈরি করতে পারে যা বেশিরভাগ পয়েন্ট থেকে দূরে সরে যায় যাতে কোনও বহিরাগতের কাছাকাছি থাকতে পারে methods । পরম বিচ্যুতি ব্যবহার করা এই বিকৃতি হ্রাস করে, তবে ট্রেন্ডলাইন গণনা করার ব্যয়ে আরও জটিল।

এটি কারণ, অন্যরা যেমন উল্লেখ করেছে যে, স্ট্যান্ডার্ড বিচ্যুতির গাণিতিক বৈশিষ্ট্য এবং সম্পর্ক রয়েছে যা সাধারণত এটি পরিসংখ্যানগুলিতে আরও কার্যকর করে তোলে। তবে "দরকারী" কখনই নিখুঁত নিয়ে বিভ্রান্ত হওয়া উচিত নয়।


1
শুধু কৌতূহলী, এমন "গণিতের বৈশিষ্ট্য" কী যা এসডিকে নিখুঁত বিচ্যুতির চেয়ে আরও কার্যকর করে তোলে? উপায় দ্বারা দুর্দান্ত উত্তর।
ওয়েপেং এল

@ পংবা স্ট্যান্ডার্ড বিচ্যুতি এমন অনেক পরিসংখ্যানের মডেলের অন্তর্নিহিত যা একাধিক প্রভাব থেকে এলোমেলোভাবে পরিবর্তনকে ধরে নেয় যা একে অপরকে বাতিল করতে পারে (ওরফে, সাধারণত বিতরণ করা ডেটা)। এর মধ্যে রয়েছে বিশাল জনসংখ্যার জরিপ ব্যবহার করার সময় নমুনা নির্ভুলতা (ত্রুটির মার্জিন) includes যদি আপনার ডেটা এই মডেলটির সাথে মিলিত হয় তবে আপনি গড় থেকে এসডি নম্বর থেকে একটি মান পাওয়ার সম্ভাবনাটি অনুমান করতে পারেন। আপনি স্বতন্ত্র উপাদানগুলির এসডি থেকে একাধিক স্বাধীন প্রভাবের এসডি গণনা করতে পারেন can আরও দেখুন: en.m.wikedia.org/wiki/S স্ট্যান্ডার্ড_ডিভেশন
অ্যামেলিয়াবিআর

7

উভয়ই এর ডেটার দূরত্বকে গণনার মাধ্যমে আপনার ডেটার বিস্তারকে পরিমাপ করে ।

  1. গড় পরম বিচ্যুতি আদর্শ হল L1 ব্যবহার করছে (এটা এছাড়াও বলা হয় ম্যানহাটন দূরত্ব বা সরলরেখাগামী দূরত্ব )
  2. স্ট্যানডার্ড ডেভিয়েশন আদর্শ ও L2 ব্যবহার করছে (নামেও ইউক্লিডিয় দূরত্ব )

দুটি নিয়মের মধ্যে পার্থক্যটি হ'ল মানক বিচ্যুতি পার্থক্যটির বর্গক্ষেত্র গণনা করছে যেখানে গড় নিখুঁত বিচ্যুতি কেবল পরম পার্থক্যের দিকে তাকিয়ে রয়েছে। সুতরাং অন্য পদ্ধতির পরিবর্তে স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করার সময় বৃহত আউটলিয়াররা একটি উচ্চতর বিস্তৃতি তৈরি করবে। ইউক্লিডিয়ান দূরত্ব প্রকৃতপক্ষে প্রায়শই ব্যবহৃত হয়। মূল কারণ হ'ল মানক বিচ্যুতিতথ্য সাধারণত বিতরণ করা হয় যখন ভাল বৈশিষ্ট্য আছে। সুতরাং এই অনুমানের অধীনে, এটি ব্যবহার করার পরামর্শ দেওয়া হচ্ছে। তবে লোকেরা প্রায়শই এমন ধারণা ডেটার জন্য করেন যা আসলে সাধারণত বিতরণ করা হয় না যা সমস্যা তৈরি করে। যদি আপনার ডেটা সাধারণত বিতরণ না করা হয় তবে আপনি এখনও স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করতে পারেন তবে ফলাফলের ব্যাখ্যার সাথে আপনার সতর্ক হওয়া উচিত।

অবশেষে আপনার জানা উচিত যে বিচ্ছুরণের উভয় পদক্ষেপই মিনকভস্কি দূরত্বের বিশেষ ক্ষেত্রে , পি = 1 এবং পি = 2 এর জন্য। আপনার ডেটা ছড়িয়ে দেওয়ার অন্যান্য ব্যবস্থা পেতে আপনি পি বৃদ্ধি করতে পারেন।


এই বিষয়ে গণিত.স্ট্যাকেক্সচেঞ্জে একটি পোস্টও রয়েছে: math.stackexchange.com/questions/384003/l1-norm-and-l2-norm
রকসায়েন্স

6

এগুলি একই ধরণের পদক্ষেপ যা একই ধারণাটি মাপার চেষ্টা করে। সাধারণত আপনি স্ট্যান্ড ব্যবহার। অন্তর্নিহিত বিতরণ সম্পর্কে যদি আপনি কিছু অনুমান করেন তবে বিচ্যুতিটির দুর্দান্ত বৈশিষ্ট্য রয়েছে।

অন্যদিকে গড় বিচ্যুতিতে নিখুঁত মানটি গাণিতিক দৃষ্টিকোণ থেকে কিছু সমস্যা সৃষ্টি করে যেহেতু আপনি এটিকে আলাদা করতে পারবেন না এবং আপনি এটি সহজে বিশ্লেষণ করতে পারবেন না। এখানে কিছু আলোচনা ।


1

না তুমি ভুল. শুধু মজা করছি. তবে, অনেকগুলি কার্যকরী কারণ রয়েছে যে কেন কেউ প্রথাগত ધોરણের চেয়ে গড় বিচ্যুতি গণনা করতে চান এবং এইভাবে আমি আমার ইঞ্জিনিয়ারিং ব্রাদার্সের দৃষ্টিভঙ্গির সাথে একমত আছি। অবশ্যই যদি আমি বিদ্যমান কাজের যে কোনও গুণগত এবং পরিমাণগত সিদ্ধান্তগুলি প্রকাশ করে এমন কোনও শরীরের সাথে তুলনা করার জন্য পরিসংখ্যানগুলি গণনা করছি, তবে আমি স্টুডেন্টের সাথে স্টুড রেখেছি। তবে, উদাহরণস্বরূপ, ধরে নিই আমি কিছুটা দ্রুত চালানোর চেষ্টা করছিবাইনারি, মেশিন-উত্পন্ন ডেটাতে অ্যানোমালি-ডিটেকশন অ্যালগরিদমগুলি। আমি আমার চূড়ান্ত লক্ষ্য হিসাবে একাডেমিক তুলনার পরে নেই। তবে আমি এর গড় সম্পর্কে ডেটাগুলির একটি নির্দিষ্ট প্রবাহের "স্প্রেড" সম্পর্কে মৌলিক অনুচ্ছেদে আগ্রহী। আমি এটি পুনরাবৃত্তভাবে, এবং যথাসম্ভব দক্ষতার সাথে গণনা করতে আগ্রহী। ডিজিটাল বৈদ্যুতিন হার্ডওয়্যারে আমরা সর্বদা নোংরা কৌশলগুলি খেলি - আমরা যথাক্রমে বাম এবং ডান শিফ্টে গুণ এবং বিভাগগুলি ছড়িয়ে দেব এবং "গণনা" পরম মানগুলির জন্য, আমরা কেবল সাইন বিটটি ফেলে রাখি (এবং প্রয়োজনে কারও বা দু'জনের পরিপূরক গণনা করি) , উভয়ই সহজ রূপান্তর)। সুতরাং, আমার পছন্দটি হ'ল আমি সবচেয়ে নাকল-ড্র্যাগিং উপায়ে এটি গণনা করতে পারি এবং কাঙ্ক্ষিত সময়ের উইন্ডোগুলিতে দ্রুত বিচ্ছিন্নতা সনাক্তকরণের জন্য আমার গণনাগুলিতে রৈখিক প্রান্তিক প্রয়োগ করি।


1
স্ট্যান্ডার্ড বিচ্যুতিটি দক্ষতার সাথে এবং কেবলমাত্র একটি অনলাইন অ্যালগরিদমের সাথে গণনা করা যায়, ঠিক যেমন কোনও মুহুর্ত হতে পারে (গড় পরম বিচ্যুতি সহ)। সুতরাং, দ্রুত বা সাধারণ গণনার প্রয়োজনীয়তা এটিকে অস্বীকার করবে না (বা এটি কোনও মুহুর্ত-ভিত্তিক স্প্রেডের প্রাক্কলনকারীকেও অস্বীকার করবে না)।
হোবার

0

দুটি ব্যবস্থা সত্যই পৃথক। প্রথমটি প্রায়শই মিন অ্যাবসুলিউট ডেভিয়েশন (এমএডি) এবং দ্বিতীয়টি স্ট্যান্ডার্ড বিচ্যুতি (এসটিডি) হিসাবে পরিচিত। মারাত্মকভাবে সীমাবদ্ধ কম্পিউটিং শক্তি এবং সীমিত প্রোগ্রাম মেমরি সহ এম্বেড থাকা অ্যাপ্লিকেশনগুলিতে বর্গমূলের গণনাগুলি এড়ানো খুব পছন্দসই হতে পারে।

দ্রুত রুক্ষ পরীক্ষার মাধ্যমে মনে হয় যে এমএডি = এফ * এসটিডি কোথাও ০.7878 থেকে ০.৮০ এর মধ্যে গসিয়ান বিতরণ করা এলোমেলো নমুনার সংকলনের জন্য।


0

আমার সাগুর একটি খুব ভাল নিবন্ধ এটি ব্যাখ্যা করে: [ http://blog.amarsagoo.info/2007/09/making-sense-of-standard-deedia.html]

একটি স্বজ্ঞাত বোঝার জন্য আমার নিজের প্রচেষ্টা যুক্ত করতে:

গড় বিচ্যুতিটি একটি অনুমান "গড়" পয়েন্টটি গড় থেকে কত দূরে রয়েছে তা জিজ্ঞাসার একটি শালীন উপায়, তবে সমস্ত পয়েন্ট একে অপরের থেকে কতটা দূরে, বা ডেটা কীভাবে "ছড়িয়ে পড়ে" তা জিজ্ঞাসা করার জন্য এটি সত্যিকার অর্থে কাজ করে না।

স্ট্যান্ডার্ড বিচ্যুতি জিজ্ঞাসা করছে যে সমস্ত পয়েন্টগুলি কতটা পৃথক, সুতরাং কেবলমাত্র গড় বিচ্যুতির চেয়ে বেশি দরকারী তথ্য অন্তর্ভুক্ত করে (যার কারণ হ'ল বিচ্যুতি সাধারণত স্ট্যান্ডার্ড বিচ্যুতি বোঝার দিকে ধাপ হিসাবে কেবল ব্যবহৃত হয়)।

একটি ভাল উপমা পাইথাগোরিয়ান উপপাদ্য। পাইথাগোরিয়ান উপপাদ্যটি অনুভূমিক দূরত্ব এবং উল্লম্ব দূরত্ব গ্রহণ করে, স্কোয়ারিং করে, স্কোয়ারগুলি যোগ করে এবং মোটের বর্গমূল গ্রহণ করে দুটি মাত্রায় পয়েন্টগুলির মধ্যে দূরত্ব আমাদের বলে।

আপনি যদি এটি ঘনিষ্ঠভাবে লক্ষ্য করেন তবে (জনসংখ্যা) স্ট্যান্ডার্ড বিচ্যুতির সূত্রটি পাইথাগোরিয়ান উপপাদ্য হিসাবে একই, তবে আরও দুটি মাত্রার (এবং প্রতিটি মাত্রার দূরত্ব হিসাবে প্রতিটি বিন্দু থেকে দূরত্ব ব্যবহার করে) ব্যবহার করা যায়। এটি আপনার ডেটা সেটের সমস্ত পয়েন্টের মধ্যে "দূরত্ব" সর্বাধিক সঠিক চিত্র দেয়।

সেই উপমাটিকে আরও খানিকটা এগিয়ে নিয়ে যাওয়ার জন্য, গড় নিখুঁত বিচ্যুতিটি হ'ল অনুভূমিক এবং উল্লম্ব দূরত্বের গড় গ্রহণের সমান হবে, যা মোট দূরত্বের চেয়ে কম, যখন যোগফলের পরম বিচ্যুতিটি অনুভূমিক এবং উল্লম্ব দূরত্ব যুক্ত করবে যা দীর্ঘতর প্রকৃত দূরত্বের চেয়ে


আমি ধরে নিয়েছি যখন আপনি বলছেন যখন বিচ্যুতি বলতে আপনার অর্থ হ'ল একেবারে বিচ্যুতি, যা ওপি কথা বলছিল। পরিভাষাটি গুরুত্বপূর্ণ কারণ গড় বিচ্যুতি সর্বদা 0 থাকে mean গড় নিখুঁত বিচ্যুতি এবং স্ট্যান্ডার্ড বিচ্যুতির মধ্যে পার্থক্য সম্পর্কে উভয়ই মধ্য থেকে সমস্ত পয়েন্টের বিচ্যুতি জড়িত। একটি মধ্য থেকে নিখুঁত বিচ্যুতির
যোগকে যুক্ত করে

0

স্ট্যান্ডার্ড বিচ্যুতি এলোমেলো প্রক্রিয়াগুলির কারণে ছত্রাকের প্রতিনিধিত্ব করে। বিশেষত, অনেক শারীরিক পরিমাপ যা অনেকগুলি স্বতন্ত্র প্রক্রিয়ার যোগফলের কারণ হিসাবে প্রত্যাশিত হয় তার স্বাভাবিক (বেল কার্ভ) বিতরণ থাকে।

Y=1σ2πe(xμ)22σ2

Yxμσ

অন্য কথায়, স্ট্যান্ডার্ড বিচ্যুতিটি এমন একটি শব্দ যা স্বাধীন র্যান্ডম ভেরিয়েবলগুলি একত্রে সংক্ষিপ্ত করে উত্থিত হয়। সুতরাং, আমি এখানে প্রদত্ত কয়েকটি জবাবের সাথে একমত নই - মানক বিচ্যুতি হ'ল বিচ্যুতি বলতে কেবল একটি বিকল্প নয় যা "পরবর্তী গণনার জন্য আরও সুবিধাজনক বলে মনে হয়"। স্ট্যান্ডার্ড ডেভিয়েশন হয় সঠিক ভাবে সাধারণতঃ বিতরণ ঘটনাবলির জন্য মডেল বিচ্ছুরণ করতে।

আপনি যদি সমীকরণটি দেখুন, আপনি স্ট্যান্ডার্ড বিচ্যুতিটি আরও বেশি ভারীভাবে গড় থেকে বৃহত্তর বিচ্যুতিগুলি ওজন করতে পারেন। স্বজ্ঞাতভাবে, আপনি গড় বিচ্যুতিটি গড় থেকে প্রকৃত গড় বিচ্যুতি পরিমাপ হিসাবে ভাবাতে পারেন , যেখানে স্ট্যান্ডার্ড বিচ্যুতিটি গড়টির চারপাশে ঘণ্টা আকারের একটি "সাধারণ" বিতরণ হিসাবে বিবেচিত হয়। সুতরাং যদি আপনার ডেটাটি সাধারণত বিতরণ করা হয় তবে স্ট্যান্ডার্ড বিচ্যুতি আপনাকে বলে যে আপনি যদি আরও মান নমুনা করেন, তবে তাদের মধ্যে the 68% একটি সাধারণ বিচ্যুতির মধ্যে পাওয়া যাবে around

অন্যদিকে, আপনার যদি একটি একক এলোমেলো পরিবর্তনশীল থাকে তবে বিতরণটি একটি আয়তক্ষেত্রের মতো দেখাবে, মানগুলির সমান সম্ভাবনা সহ কোনও ব্যাপ্তির মধ্যেই এটি প্রদর্শিত হতে পারে। এই ক্ষেত্রে, গড় বিচ্যুতি আরও উপযুক্ত হতে পারে।

টিএল; ডিআর যদি আপনার কাছে এমন ডেটা থাকে যা অনেকগুলি অন্তর্নিহিত এলোমেলো প্রক্রিয়াগুলির কারণে হয় বা আপনি সাধারণভাবে বিতরণ করতে জানেন তবে স্ট্যান্ডার্ড বিচ্যুতি ফাংশনটি ব্যবহার করুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.