একে অপরের অনুসরণ করে প্রতিটি মানের মধ্যে পার্থক্য হিসাবে বৈকল্পিক সংজ্ঞা দেওয়া হয় না কেন?


19

এটি অনেকের কাছে একটি সাধারণ প্রশ্ন হতে পারে তবে এটি এখানে:

মানগুলির গড়ের পার্থক্যের পরিবর্তে প্রতিটি মান একে অপরের অনুসরণ করে কেন পার্থক্যটিকে সংজ্ঞায়িত করা হয় না?

এটি আমার কাছে আরও যুক্তিযুক্ত পছন্দ হবে, আমার ধারণা আমি অবশ্যই কিছু অসুবিধাগুলি পর্যবেক্ষণ করছি। ধন্যবাদ

সম্পাদনা করুন:

আমাকে যতটা সম্ভব পরিষ্কার করা যাক। এটাই আমার অর্থ:

  1. ধরুন আপনার অর্ডারের বিস্তৃতি রয়েছে, অর্ডার করা হয়েছে: 1,2,3,4,5
  2. মানগুলি (গড় ব্যবহার না করে) মধ্যে (নিখুঁত) পার্থক্যগুলি (নিরঙ্কর, প্রতিটি নিম্নলিখিত মানের মধ্যে জোড়া লাগানো নয়) গণনা করুন এবং সমষ্টি করুন।
  3. পার্থক্যের সংখ্যা দ্বারা ভাগ করুন
  4. (ফলোআপ: নম্বরগুলি আন-অর্ডার করা হলে উত্তরটি আলাদা হবে)

-> বৈকল্পিকের আদর্শ সূত্রের তুলনায় এই পদ্ধতির অসুবিধাগুলি কী কী?



2
@ user2305193 whuber এর উত্তর সঠিক, তবে তার সূত্রটি ডেটার ক্রম এবং সমস্ত ক্রমগুলির গড়ের গড়ের মধ্যে বর্গক্ষেত্র দূরত্বকে কাজে লাগায়। ঝরঝরে কৌশল, আপনি যে ইঙ্গিত করেছেন তার বৈকল্পিক সন্ধানের প্রক্রিয়াটি হ'ল আমি আমার উত্তরে বাস্তবায়নের চেষ্টা করেছি, এবং প্রদর্শিত হয়েছে যে ভাল কাজ করবে না। বিভ্রান্তি দূর করার চেষ্টা করছি।
গ্রিনপার্কার

1
মজাদার জন্য, অ্যালান ভেরিয়েন্সটি দেখুন।
হাবস

অন্য একটি চিন্তার উপর, আমি অনুমান করি যেহেতু আপনি বর্গক্ষেত্রের পার্থক্য রাখেন না (এবং আপনি পরে স্কোয়ার-রুট গ্রহণ করেন না) তবে পরম মানগুলি গ্রহণ করেন, এটি বরং হওয়া উচিত 'কেন আমরা স্ট্যান্ডার্ড বিচ্যুতি গণনা করি না' এর পরিবর্তে 'কেন আমরা এই বৈকল্পিক গণনা করি না'। তবে আমি এখনই এটি বিশ্রাম দেব
user2305193

উত্তর:


27

সর্বাধিক সুস্পষ্ট কারণ হ'ল মানগুলিতে প্রায়শই সময় ক্রম থাকে না। সুতরাং আপনি যদি ডেটাটি গোলমাল করেন তবে এটি ডেটা দ্বারা প্রদত্ত তথ্যে কোনও তফাত্ করে না। আমরা যদি আপনার পদ্ধতি অনুসরণ করি, তবে প্রতিবার আপনি যখন ডেটা লাফিয়ে নিন তখন আপনি আলাদা নমুনার বৈকল্পিক পান।

আরও তাত্ত্বিক উত্তর হ'ল নমুনা বৈকল্পিকটি একটি এলোমেলো ভেরিয়েবলের প্রকৃত বৈচিত্রটি অনুমান করে। এলোমেলো পরিবর্তনশীল এর আসল প্রকরণটি হ'ল E [ ( এক্স - এক্স ) 2 ]X

E[(XEX)2].

এখানে প্রত্যাশা বা "গড় মান" উপস্থাপন করে। সুতরাং পরিবর্তনের সংজ্ঞা হ'ল তার গড় মূল্য থেকে চলকটির মধ্যে গড় বর্গক্ষেত্রের দূরত্ব। আপনি যখন এই সংজ্ঞাটি দেখেন, কোনও ডেটা নেই বলে এখানে কোনও "টাইম অর্ডার" নেই। এটি এলোমেলো ভেরিয়েবলের একটি বৈশিষ্ট্য।E

আপনি যখন এই বিতরণ থেকে আইডি ডেটা সংগ্রহ করেন, তখন আপনার উপলব্ধি হবে । প্রত্যাশাটি অনুমান করার সর্বোত্তম উপায় হ'ল নমুনা গড়ে নেওয়া। এখানে মূল কীটি হ'ল আমরা আইআইডি ডেটা পেয়েছি এবং এইভাবে ডেটাতে অর্ডার দেওয়ার ব্যবস্থা নেই। নমুনা এক্স 1 , এক্স 2 , , এক্স এন নমুনা এক্স 2 , এক্স 5 , এক্স 1 , এক্স এন এর সমান x1,x2,,xnx1,x2,,xnx2,x5,x1,xn..

সম্পাদনা

নমুনা বৈকল্পিক নমুনার জন্য একটি নির্দিষ্ট ধরণের ছত্রাক পরিমাপ করে, যা গড় থেকে গড় দূরত্বকে পরিমাপ করে। অন্যান্য ধরণের বিস্তৃতি যেমন ডেটার পরিসীমা এবং আন্তঃ কোয়ান্টাইল পরিসীমা রয়েছে।

এমনকি আপনি যদি আপনার মানগুলি আরোহণের ক্রম অনুসারে বাছাই করেন তবে এটি নমুনার বৈশিষ্ট্যগুলিকে পরিবর্তন করে না। আপনি যে নমুনা (ডেটা) পান সেটি হ'ল একটি ভেরিয়েবলের উপলব্ধি। নমুনা বৈকল্পিক গণনা করা পরিবর্তনশীল মধ্যে কত বিস্তৃতি হয় তা বোঝার অনুরূপ। সুতরাং উদাহরণস্বরূপ, আপনি যদি 20 জনকে নমুনা দিয়ে থাকেন এবং তাদের উচ্চতা গণনা করেন তবে এগুলি মানুষের র্যান্ডম ভেরিয়েবল উচ্চতা থেকে 20 "উপলব্ধি" । এখন নমুনা ভেরিয়েন্সটি সাধারণভাবে ব্যক্তিদের উচ্চতায় পরিবর্তনের পরিমাপ করার কথা। আপনি ডাটা অর্ডার 100 , 110 , 123 , 124 , ... ,X=

100,110,123,124,,

যে নমুনা তথ্য পরিবর্তন করে না।

আরও একটি উদাহরণ তাকান। আসুন আপনাকে ভাবে অর্ডার করা র্যান্ডম ভেরিয়েবলের 100 টি পর্যবেক্ষণ রয়েছে বলে মনে করি 100. তারপরে গড় পরবর্তী দূরত্বটি 1 ইউনিট, সুতরাং আপনার পদ্ধতির দ্বারা প্রকরণটি 1 হবে।

1,2,3,4,5,6,7,8,9,10,11,12,13,14,...100.

"বৈকল্পিক" বা "ছড়িয়ে পড়ার" ব্যাখ্যার উপায়টি হ'ল ডেটাগুলির জন্য কি মানের মানগুলির সীমাবদ্ধতা তা বোঝা। এই ক্ষেত্রে আপনি .99 ইউনিটের একটি পরিসর পাবেন, যা অবশ্যই প্রকরণটি ভালভাবে উপস্থাপন করে না।

যদি গড়ের পরিবর্তে আপনি কেবল পরবর্তী পার্থক্যগুলির সমষ্টি করে থাকেন তবে আপনার বৈকল্পিকতা হবে 99 Of অবশ্যই এটি নমুনায় পরিবর্তনশীলতার প্রতিনিধিত্ব করে না, কারণ 99 আপনাকে ডেটাটির পরিসর দেয়, পরিবর্তনের কোনও ধারণা দেয় না।


1
শেষ অনুচ্ছেদটি দিয়ে আপনি আমার কাছে পৌঁছেছেন, হাহা, এই উদ্দীপনা জবাবের জন্য ধন্যবাদ, আমি আশা করি আমার এটির পক্ষে যথেষ্ট প্রতিবেদন থাকতে পারে, লোককে দয়া করে, আমার জন্য এটি করুন ;-) স্বীকৃত !!!
ব্যবহারকারী2305193

ফলো-আপ-টু-ফলোআপ: আমি আসলে কী বোঝাতে চেয়েছি (হ্যাঁ, দুঃখিত, আমি আপনার উত্তরটি পড়ার পরে কেবল সঠিক প্রশ্নটি অনুধাবন করেছি) আপনি কী পার্থক্যগুলি যোগ করেছিলেন এবং নমুনার সংখ্যার মাধ্যমে ভাগ করেছিলেন? আপনার শেষ উদাহরণে এটি হবে 99/100 - আপনি সম্পূর্ণ flabbergasted-ness এর জন্য এটি বিস্তারিত বর্ণনা করতে পারেন?
ব্যবহারকারী2305193

@ user2305193 ঠিক আছে, আমি বললাম গড়ে 1 ইউনিট, যা ভুল। এটি .99 ইউনিট হওয়া উচিত ছিল। এটা পরিবর্তন।
গ্রিনপারকার

1-100 সিরিজের আরও তথ্যের জন্য: 1-100 এর প্রকরণটি হবে 841.7 এবং স্ট্যান্ডার্ড বিচ্যুতি 29.01 উত্স । সুতরাং সত্যিই বেশ ভিন্ন ফলাফল।
ব্যবহারকারী2305193

31

এটা তোলে হয় যে ভাবে সংজ্ঞায়িত!

বীজগণিত এখানে। মানগুলি । দ্বারা চিহ্নিত এফ এই মান এর গবেষণামূলক বিতরণের ফাংশনটি (যা প্রতিটি মানে এক্স আমি অবদান একটি সম্ভাব্যতা ভর 1 / এন মান x আমি ) এবং দিন এক্স এবং ওয়াই ডিস্ট্রিবিউশনের সাথে স্বাধীন র্যান্ডম ভেরিয়েবল হতে এফ । বৈকল্পিকের মৌলিক বৈশিষ্ট্যগুলির (যেমন এটি একটি চতুর্ভুজ রূপ) পাশাপাশি এফ এবং সত্যের সংজ্ঞা রয়েছেx=(x1,x2,,xn)Fএক্সআমি1/এনএক্সআমিএক্সওয়াইএফএফ এবং ওয়াই এর একই গড় আছে,এক্সওয়াই

var(এক্স)=var(এক্স)=12(var(এক্স)+ +var(ওয়াই))=12(var(এক্স-ওয়াই))=12(((এক্স-ওয়াই)2)-(এক্স-ওয়াই)2)=(12(এক্স-ওয়াই)2)-0=1এন2Σআমি,12(এক্সআমি-এক্স)2

এই সূত্রটি অর্ডার করার পথে নির্ভর করে না : এটি অর্ধেক স্কোয়ারযুক্ত পার্থক্য ব্যবহার করে তুলনা করে সমস্ত সম্ভাব্য জোড় উপাদান ব্যবহার করে। তবে, এটি সম্ভাব্য সমস্ত ক্রম ( সমস্ত এন এর গ্রুপ এস ( এন ) ! সূচকের 1 , 2 , , এন ) এর ক্রম ছাড়ের গড়ের সাথে সম্পর্কিত হতে পারে । যেমন,এক্সS(n)n!1,2,,n

Var(x)=1n2i,j12(xixj)2=1n!σS(n)1ni=1n112(xσ(i)xσ(i+1))2.

এই অভ্যন্তরীণ সংমিশ্রণটি পুনঃনির্দিষ্ট মানগুলি গ্রহণ করে এবং সমস্ত n - 1 ধারাবাহিক যুগের মধ্যে (অর্ধ) বর্গক্ষেত্রের পার্থক্যের যোগফল দেয় । এন দ্বারা বিভাজন মূলত এই ক্রমাগত স্কোয়ার পার্থক্যগুলির গড় গড় । এটি ল্যাগ -১ সেমিভারিয়েন্স হিসাবে পরিচিত যা গণনা করে । বাহ্যিক সংমিশ্রণটি সমস্ত সম্ভাব্য অর্ডারের জন্য এটি করেxσ(1),xσ(2),,xσ(n)n1n


প্রমিত বৈকল্পিক সূত্রের এই দুটি সমতুল বীজগণিত মতামত তারতম্যটির অর্থ কী তা সম্পর্কে নতুন অন্তর্দৃষ্টি দেয়। সেমিভারিয়েন্সটি একটি ক্রমের সিরিয়াল কোভারিয়েন্সের একটি বিপরীত পরিমাপ: যখন আভিভাটি কম হয়, এবং বিপরীতভাবে কোভেরিয়েন্স বেশি হয় (এবং সংখ্যাগুলি ইতিবাচকভাবে সম্পর্কিত হয়)। একটি ভ্যারিয়েন্স unordered ডেটা সেটটি, তারপর, এক ধরনের নির্বিচারে reorderings অধীনে গম্য সব সম্ভব semivariances গড়।


1
@ মুর 1lo বিপরীতে: আমি বিশ্বাস করি যে এই উত্সটি সঠিক। কিছু ডেটাতে সূত্র প্রয়োগ করুন এবং দেখুন!
whuber

1
আমি মনে করি মুর 1 লৌকিকতার জন্য সূত্রের নির্ভুলতার বিষয়ে নয় বরং স্পষ্টতই এলোমেলো ভেরিয়েবলের প্রত্যাশা থেকে নমুনার পরিমাণের কার্যকারিতা সম্পর্কে সরাসরি কথা বলার কথা বলছিল।
গ্লেন_বি -রিনস্টেট মনিকা

1
@্লেগেন তবে এটাই যথার্থভাবে যা অনুগ্রহমূলক বিতরণ ফাংশন আমাদের করতে দেয়। এই পদ্ধতির সম্পূর্ণ পয়েন্ট এটি।
whuber

3
হ্যাঁ, এটা আমার কাছে স্পষ্ট; আমি কোথায় যেন বিভ্রান্তি লেগেছে মনে করার চেষ্টা করছিলাম। অস্পষ্ট হওয়ার জন্য দুঃখিত। আশা করি এটি এখন আরও পরিষ্কার হয়ে গেছে কেন এটি কেবল * সমস্যা হিসাবে দেখা দেয়।* (এই ​​কারণেই আমি আগে "আপাত" শব্দটি ব্যবহার করেছি, এটি জোর দেওয়ার জন্য এটি ছিল ঠিক সেই পদক্ষেপের
বহিঃপ্রকাশের উপস্থিতি

2
@ মুর 1o কেবলমাত্র এই সমীকরণগুলির মধ্যে আমি যা করেছি তা হ'ল সংজ্ঞা প্রয়োগ করা। প্রত্যাশা থেকে "নমুনার পরিমাণে" কোনও পাস হয় না। (বিশেষত, কোনও নমুনা পোষ্ট করা বা ব্যবহার করা যায় নি)) সুতরাং আমি আপাত সমস্যাটি কী তা সনাক্ত করতে পারছি না বা বিকল্প ব্যাখ্যাও প্রস্তাব করতে পারছি না। আপনি যদি আপনার উদ্বেগকে প্রসারিত করতে পারেন তবে আমি প্রতিক্রিয়া জানাতে সক্ষম হতে পারি। F
হোবার

11

অন্যান্য উত্তরের একটি পরিপূরক, শর্তগুলির মধ্যে স্কোয়ার পার্থক্য হিসাবে প্রকরণটি গণনা করা যেতে পারে:

Var(X)=12n2injn(xixj)2=12n2injn(xix¯xj+x¯)2=12n2injn((xix¯)(xjx¯))2=1nin(xix¯)2

আমি মনে করি এটি ওপি প্রস্তাবের সবচেয়ে নিকটতম। মনে রাখবেন যে প্রকরণটি কেবলমাত্র সেটের "প্রতিবেশী" সংখ্যার মধ্যেই নয়, প্রতিটি পর্যবেক্ষণের একবারে ছড়িয়ে দেওয়ার পরিমাপ।


হালনাগাদ

আপনার উদাহরণ ব্যবহার করে: । আমরা জানি ভেরিয়েন্টটি হ'ল ভি আর ( এক্স ) = 2X=1,2,3,4,5Var(X)=2

আপনার প্রস্তাবিত পদ্ধতিতে , সুতরাং আমরা আগেই জানি যে প্রতিবেশীদের মধ্যে পার্থক্যকে বৈচিত্র্য বাড়ায় না তাই গ্রহণ করা। আমার অর্থ হ'ল প্রতিটি সম্ভাব্য পার্থক্যটি স্কোয়ার করে নেওয়া হয়েছিল তখন সংক্ষেপে:Var(X)=1

Var(X)==(51)2+(52)2+(53)2+(54)2+(55)2+(41)2+(42)2+(43)2+(44)2+(45)2+(31)2+(32)2+(33)2+(34)2+(35)2+(21)2+(22)2+(23)2+(24)2+(25)2+(11)2+(12)2+(13)2+(14)2+(15)2252==16+9+4+1+9+4+1+1+4+1+1+4+1+1+4+9+1+4+9+1650==2

এখন আমি গুরুতরভাবে বিভ্রান্ত ছেলেরা
ব্যবহারকারী ২৩০৫193

@ ব্যবহারকারী2305193 আপনার প্রশ্নে, আপনি কি প্রতিটি জোড় ব্যবধানের পার্থক্য বোঝাতে চেয়েছিলেন বা একটি অনুক্রমের সাথে একটি মান এবং পরেরটির মধ্যে পার্থক্য বোঝাতে চেয়েছেন? তুমি কি পরিষ্কার করে বলতে পারো?
ফায়ারবাগ

2
@ মুর 1lo কেউ নেই যদিও আপনি কী উল্লেখ করছেন তা আমার কোনও ধারণা নেই।
ফায়ারব্যাগ

2
@ মুর 1lo এটি একটি সাধারণ প্রশ্ন এবং আমি সাধারণত উত্তর দিয়েছি। ভেরিয়েন্স একটি গণনাযোগ্য পরামিতি, যা নমুনাগুলি থেকে অনুমান করা যায়। এই প্রশ্নটি যদিও অনুমান সম্পর্কে নয়। এছাড়াও আমরা ক্রমাগত সেট সম্পর্কে কথা বলছি, অবিচ্ছিন্ন বিতরণ সম্পর্কে নয়।
ফায়ারব্যাগ

1
আপনি দেখিয়েছেন কীভাবে এর ইউ স্ট্যাটিস্টিক এবং এর সূক্ষ্ম দ্বারা বৈকল্পিকটি অনুমান করা যায়। সমস্যাটি যখন আপনি লিখবেন: ভার ("আপার কেস" এক্স) = "লোয়ার কেস" এক্স জড়িত জিনিসগুলি, আপনি প্যারামিটার এবং অনুমানক দুটি ভিন্ন ধারণা মিশ্রিত করছেন।
মুর 1lo

6

অন্যরা যথারীতি সংজ্ঞায়িত বৈকল্পিকতার কার্যকারিতা সম্পর্কে উত্তর দিয়েছেন। যাইহোক, আমাদের বিভিন্ন জিনিসের দুটি বৈধ সংজ্ঞা রয়েছে: বৈকল্পিকের সাধারণ সংজ্ঞা এবং আপনার সংজ্ঞা।

তারপরে, মূল প্রশ্নটি হ'ল প্রথমটিকে কেন ভেরিয়েন্স বলা হয় এবং আপনার নয়। এটি কেবল সম্মেলনের বিষয়। 1918 অবধি আপনি নিজের ইচ্ছামত যে কোনও কিছু আবিষ্কার করতে পারেন এবং এটি "ভেরিয়েন্স" নামে অভিহিত করতে পারতেন, তবে 1918 সালে ফিশার সেই নামটি এখনও ব্যবহার করে যা ভেরিয়েন্স বলা হয়, এবং যদি আপনি অন্য কোনও কিছু সংজ্ঞায়িত করতে চান তবে নামটির জন্য আপনাকে অন্য কোনও নাম সন্ধান করতে হবে।

অন্য প্রশ্নটি হ'ল আপনার সংজ্ঞায়িত জিনিসটি কোনও কিছুর জন্য কার্যকর হতে পারে। অন্যরা এর সমস্যাগুলি ছড়িয়ে দেওয়ার পরিমাপ হিসাবে ব্যবহার করার জন্য চিহ্নিত করেছে, তবে এটির জন্য অ্যাপ্লিকেশনগুলি খুঁজে পাওয়া আপনার পক্ষে। হতে পারে আপনি এত দরকারী অ্যাপ্লিকেশন খুঁজে পেয়েছেন যে একটি শতাব্দীতে আপনার জিনিসটি তারতম্যের চেয়ে বেশি বিখ্যাত।


আমি জানি যে প্রতিটি সংজ্ঞা লোকেরা এটির সিদ্ধান্ত নেয়, আমি প্রতিটি পন্থার জন্য সত্যই ডাউন / ডাউনসাইডের জন্য সন্ধান করছিলাম। লোকেরা একটি সংজ্ঞাতে রূপান্তরিত করার পক্ষে ভাল কারণ রয়েছে এবং আমি সন্দেহ করি যে কেন সরাসরি তাড়াতাড়ি দেখা যায়নি।
ব্যবহারকারী2305193

1
ফিশার 1918 সালে একটি শব্দ হিসাবে বৈকল্পিকতার পরিচয় দিয়েছিলেন তবে ধারণাটি পুরানো।
নিক কক্স

যতদূর আমি জানি, ফিশার হ'ল প্রথম যে তারতম্যের জন্য "বৈকল্পিক" নামটি ব্যবহার করেছিল। এ কারণেই আমি বলি যে 1918 এর আগে আপনার উদ্ভাবিত অন্য কোনও কিছুর নামকরণ করতে আপনি "বৈকল্পিক" ব্যবহার করতে পারেন।
পেরে

3

@ গ্রিনপারকার উত্তরটি আরও সম্পূর্ণ, তবে আপনার পদ্ধতির অপূর্ণতা চিত্রিত করার জন্য একটি স্বজ্ঞাত উদাহরণটি কার্যকর হতে পারে।

আপনার প্রশ্নে, আপনি ধরে নিয়েছেন বলে মনে হচ্ছে যে এলোমেলোভাবে পরিবর্তনশীল আদায় করার বিষয়টি গুরুত্বপূর্ণ। যাইহোক, উদাহরণগুলি যা এটি দেয় না তা ভাবা সহজ।

জনসংখ্যায় ব্যক্তিদের উচ্চতার উদাহরণ বিবেচনা করুন। যে ক্রমে ব্যক্তিদের পরিমাপ করা হয় তা জনসংখ্যার গড় উচ্চতা এবং তারতম্য উভয়ের ক্ষেত্রেই অপ্রাসঙ্গিক (এই মানগুলি কীভাবে গড়ের কাছাকাছি ছড়িয়ে পড়ে)।

আপনার পদ্ধতিটি এই জাতীয় ক্ষেত্রে কেস প্রয়োগের পক্ষে বিজোড় বলে মনে হচ্ছে।


2

যদিও এই প্রশ্নের অনেকগুলি ভাল উত্তর রয়েছে তবে আমি বিশ্বাস করি যে কয়েকটি গুরুত্বপূর্ণ বিষয় যেখানে পিছনে রেখে গেছে এবং যেহেতু এই প্রশ্নটি একটি সত্যই আকর্ষণীয় পয়েন্ট নিয়ে এসেছে আমি অন্য একটি দৃষ্টিকোণ সরবরাহ করতে চাই would

Why isn't variance defined as the difference between every value following    
each other instead of the difference to the average of the values?

XFXμx , যা হয়:

μX=+xdFX(x)

XσX2 হ'ল:

σX2=+(xμX)2dFX(x)

পরিসংখ্যানগুলিতে অনুমানের ভূমিকা হ'ল কোনও আরভি-র অনুধাবনের সেট থেকে, আগ্রহের পরামিতিগুলির জন্য একটি ভাল আনুমানিক provide

আমি যেটি দেখাতে চেয়েছিলাম তা হ'ল প্যারামিটারগুলির ধারণাগুলিতে (এই নির্দিষ্ট প্রশ্নের বৈকল্পিক) এবং এটি নির্ণয়ের জন্য আমরা যে পরিসংখ্যান ব্যবহার করি তাতে বড় পার্থক্য রয়েছে।

Why isn't the variance calculated this way?

Xx={x1,,xn}

ψ(x)=1ni=2n|xixi1|

এবং স্বাভাবিক পরিসংখ্যান হ'ল:

S2(x)=1n1i=in(xix¯)2,

x¯ হল নমুনা গড় mean

যখন কোনও পরামিতিটির দুটি অনুমানককে তুলনা করা যায় তখন সর্বোত্তমটির জন্য সাধারণ মানদণ্ডটি হ'ল ন্যূনতম গড় বর্গ ত্রুটি থাকে (এমএসই) থাকে এবং এমএসইর একটি গুরুত্বপূর্ণ সম্পত্তি হ'ল এটি দুটি উপাদানগুলিতে পচে যেতে পারে:

এমএসই = অনুমানকারী পক্ষপাত + অনুমানের বৈকল্পিক।

S2

  • প্রথমত এটি বৈষম্যের একটি নিরপেক্ষ অনুমানক তবে আপনার পরিসংখ্যান নিরপেক্ষ নয়।

  • S2σ2 অর্থে এটা সব পক্ষপাতিত্বহীন estimators মধ্যে ক্ষুদ্রতম ভ্যারিয়েন্স আছে এবং এইভাবে MSE ছোট।

S2


3
1/n1/(n1)


1

এখানে প্রচুর ভাল উত্তর, তবে আমি কয়েকটি যুক্ত করব।

  1. এখন এটি যেভাবে সংজ্ঞায়িত হয়েছে তা কার্যকর প্রমাণিত হয়েছে। উদাহরণস্বরূপ, সাধারণ বিতরণগুলি ডেটাতে সর্বদা উপস্থিত হয় এবং একটি সাধারণ বন্টন তার গড় এবং প্রকরণ দ্বারা সংজ্ঞায়িত হয়। সম্পাদনা করুন: @ শুভর যেভাবে একটি মন্তব্যে উল্লেখ করেছেন, সেখানে অন্যান্য বিভিন্ন উপায় রয়েছে যা সাধারণ বন্টন নির্দিষ্ট করে দেয়। তবে এগুলির কোনওটিই আমি যতটা অবগত নই, ধারাবাহিকভাবে কয়েক পয়েন্টের সাথে ডিল করি।
  2. সাধারণত সংজ্ঞায়িত হিসাবে বৈকল্পিকতা আপনাকে ডেটা কীভাবে ছড়িয়ে দেওয়া হয় তার একটি পরিমাপ দেয়। উদাহরণস্বরূপ, যাক, শূন্যের গড় দিয়ে আপনার কাছে প্রচুর ডেটা পয়েন্ট রয়েছে তবে আপনি যখন এটি দেখেন তখন আপনি দেখতে পাবেন যে ডেটা বেশিরভাগই হয় -1 বা প্রায় 1 এর কাছাকাছি। আপনার প্রকরণটি প্রায় 1 হবে However তবে আপনার অধীনে পরিমাপ, আপনি শূন্য মোট পাবেন। কোনটি আরও দরকারী? ঠিক আছে, এটি নির্ভর করে, তবে এটি আমার কাছে পরিষ্কার নয় যে এর "বৈকল্পিকতা" এর জন্য শূন্যের একটি পরিমাপটি বোঝায়।
  3. এটি আপনাকে অন্য জিনিসগুলি করতে দেয়। একটি উদাহরণ, আমার পরিসংখ্যান শ্রেণিতে আমরা সময়ের সাথে সাথে পিচারের সাথে (বেসবলে) তুলনা করার একটি ভিডিও দেখেছি। যেমনটি আমার মনে আছে, কলসগুলি আঘাত হানার (বা হোম রান) অনুপাতের যে পরিমাণ বেড়েছে তার প্রবণতা খারাপ হতে দেখা গেছে। একটি কারণ ব্যাটাররা আরও ভাল হচ্ছে। এটি সময়ের সাথে কলস তুলনা করা শক্ত করে তোলে। তবে, তারা সময়ের সাথে তাদের তুলনা করার জন্য পিচারগুলির জেড স্কোর ব্যবহার করতে পারে ।

যাইহোক, @ পিয়ার যেমন বলেছেন, আপনার মেট্রিক ভবিষ্যতে এটি নিজেকে খুব কার্যকর প্রমাণ করতে পারে।


1
একটি সাধারণ বন্টনও তার গড় এবং চতুর্থ কেন্দ্রীয় মুহূর্ত দ্বারা নির্ধারিত হতে পারে, সেই বিষয়ে - বা অনেকগুলি মুহুর্তের মাধ্যমে। বৈকল্পিকটি সেভাবে বিশেষ নয়।
হোবার

@ শুভ আকর্ষণীয়। আমি স্বীকার করব আমি তা বুঝতে পারি নি। তবুও, যতক্ষণ না আমার ভুল হয়, সমস্ত মুহুর্তগুলি "মত বৈকল্পিক" হয় যে তারা ক্রমান্বয়ে জোড় পয়েন্টগুলির সাথে লেনদেনের বিপরীতে একটি নির্দিষ্ট পয়েন্ট থেকে দূরত্বের উপর ভিত্তি করে। তবে আপনি যা বলেছিলেন তা লক্ষ করার জন্য আমি আমার উত্তরগুলি সম্পাদনা করব।
রাউন্ডস্কয়ার

1
আপনি যে অনুভূতিটির অর্থ "ধারাবাহিকভাবে পয়েন্টগুলির জোড়গুলির সাথে লেনদেন" করছেন তা বোঝাতে পারেন? এটি কোনও মুহুর্তের কোনও মানক সংজ্ঞার অংশ নয়। নোট, এছাড়াও, যে গড় চারপাশে সমস্ত নিখুঁত মুহুর্ত - যা গড় প্রায় সমস্ত মুহুর্ত অন্তর্ভুক্ত - একটি "ডেটা কীভাবে ছড়িয়ে পড়ে তার পরিমাপ" দেয়। সুতরাং কেউ তাদের সাথে জেড স্কোরের একটি এনালগ তৈরি করতে পারে। সুতরাং, আপনার তিনটি পয়েন্টের কোনওটিই কোনও পরম কেন্দ্রীয় মুহুর্তের থেকে ভিন্নতা দেখায় না।
whuber

@ শুভ হ্যাঁ আসল প্রশ্নটি 4 টি ধাপের ক্রম পোস্ট করেছে যেখানে আপনি পয়েন্টগুলি সাজান, প্রতিটি পয়েন্ট এবং পরবর্তী পয়েন্টের মধ্যে পার্থক্য গ্রহণ করুন এবং তারপরে এগুলি গড় করুন। এটিকেই আমি "পয়েন্টের অনুক্রমের সাথে ধারাবাহিকভাবে" ডিল [আইং] হিসাবে উল্লেখ করেছি। সুতরাং আপনি ঠিক বলেছেন, আমি যে তিনটি পয়েন্ট দিয়েছি তার কোনওটিই কোনও নিখুঁত কেন্দ্রীয় মুহুর্তের থেকে পৃথককে আলাদা করে না - এগুলি মূল প্রশ্নের বর্ণিত পদ্ধতি থেকে ভিন্নতা (এবং আমি মনে করি, সমস্ত পরম কেন্দ্রীয় মুহূর্তগুলি) আলাদা করতে বোঝায়।
রাউন্ডস্কোয়ার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.