কিছু বিতরণের অর্থ কি অপরিবর্তিত?


21

অনেক পিডিএফ বিয়োগ থেকে ধনাত্মক অনন্ত পর্যন্ত বিস্তৃত, তবুও কিছু উপায় সংজ্ঞায়িত করা হয়েছে এবং কিছুটি নয়। কোন সাধারণ বৈশিষ্ট্য কিছু গণনাযোগ্য করে তোলে?


14
কনভারজেন্ট ইন্টিগ্রালগুলি।
সাইকোরাক্স মনিকাকে

1
এই বিতরণগুলি গাণিতিক বিমূর্ততা। যদি অবিচ্ছেদ্য একত্রিত না হয় তবে গড় সংজ্ঞায়িত হয় না। তবে নীচের উত্তরে যা উল্লেখ করা হয়নি তা হ'ল মাইনাস ইনফিনিটি প্লাস ইনফিনিটি সহ পিডিএফগুলি বাস্তব ডেটা উত্সগুলিকে মডেল করতে পারে না। বাস্তব জীবনে এমন ডেটা উত্পন্ন করার মতো কোনও শারীরিক প্রক্রিয়া নেই। আমার মতে সমস্ত বাস্তব ডেটা উত্স সীমাবদ্ধ থাকবে এবং আপনি গড়টি আনুমানিক করতে সক্ষম হবেন।
ক্যাগডাস ওজগেনেক

3
@ ক্যাগডাস এই মন্তব্যটি সঠিক বলে মনে হচ্ছে না। প্রচুর ভারী লেজযুক্ত প্রক্রিয়া রয়েছে। তাদের বিবিধ প্রত্যাশা দীর্ঘমেয়াদী গড়ের চূড়ান্ত পরিবর্তনশীল হিসাবে প্রকাশিত হয়। কাউচি মডেলের দৃ conv়প্রত্যয়ী প্রয়োগের জন্য, উদাহরণস্বরূপ, stats.stackexchange.com/a/36037/919 এ ডগলাস জেরের পোস্টটি দেখুন
হোবার

2
@ ক্যাগডাস ওজেকেনেক: যুক্তিটি ঠিক কতটা ভুল তা দেখার জন্য আপনার তালেব দ্বারা ব্ল্যাক সোয়ান পড়া উচিত। যদিও তাত্ত্বিকভাবে এমন কোনও প্রক্রিয়া নেই যা পুরোপুরি একটি অপরিজ্ঞাত গড় বা অসীম গড় দিয়ে একটি বিতরণ তৈরি করে, প্রচুর উদাহরণ রয়েছে যেখানে লোকেরা লেজগুলি তাদের বিতরণে কতটা চর্বিযুক্ত এবং কীভাবে গণনা করতে চলেছে তার অর্থ নির্ধারণ করে, যেখানে সত্য বিতরণ রয়েছে এর অর্থ এটি সম্পূর্ণ আলাদা এবং সাধারণত ডান-স্কিউড। এই ধরণের অযৌক্তিক যুক্তি ফিনান্সে অনেক ঝুঁকি-মূল্যায়নের গ্যাফগুলিকে পরিচালিত করে যেখানে অনেকগুলি মাত্রার আদেশ দ্বারা ঝুঁকি হ্রাস করা হয়।
অ্যালেক্স আর।

1
@ ক্যাগডাস ওজেনসিঙ্ক: আপনার যুক্তিটি কেন ভুল তা নিয়ে আলোচনার জন্য দেখুন stats.stackexchange.com/questions/94402/…
কেজিটিল বি হালওয়ারসেন

উত্তর:


23

একটি বিতরণের গড় একটি অবিচ্ছেদ্য পদে সংজ্ঞায়িত করা হয় (আমি এটি লিখব যেন ধারাবাহিক বিতরণের জন্য - একজন রিমন ইন্টিগ্রাল হিসাবে, বলুন - তবে বিষয়টি আরও সাধারণভাবে প্রযোজ্য; আমরা স্টিলিটজেস বা লেবেসগু ইন্টিগ্রেশন নিয়ে কাজ করতে এগিয়ে যেতে পারি) এগুলি যথাযথভাবে এবং একবারে):

E(X)=xf(x)dx

তবে তার মানে কী? এটি কার্যকরভাবে জন্য একটি সংক্ষিপ্তকরণ

a,blimabxf(x)dx

অথবা

alima0xf(x)dx+blim0bxf(x)dx

(যদিও আপনি এটি কেবল 0 এ নয় কোথাও ভেঙে ফেলতে পারেন)

সমস্যাগুলি তখন উপস্থিত হয় যখন এই সংহতগুলির সীমা সীমাবদ্ধ না হয়।

সুতরাং উদাহরণস্বরূপ, স্ট্যান্ডার্ড কচির ঘনত্ব বিবেচনা করুন, যা 1 এর সমানুপাতিক ... নোট করুন11+x2

blim0bx1+x2dx

যাক , সুতরাং d u = 2 xu=1+x2du=2xdx

=blim1211+b21udu

=blim12ln(u)|11+b2

=blim12ln(1+b2)

যা সীমাবদ্ধ নয় নিম্নার্ধের সীমাও সীমাবদ্ধ নয়; প্রত্যাশা ততক্ষণ সংজ্ঞায়িত।

অথবা যদি আমরা আমাদের দৈব চলক যেমন একটি প্রমিত কোশি পরম মান ছিল, তার সম্পূর্ণ প্রত্যাশা যে সীমা আমরা শুধু দিকে তাকিয়ে সমানুপাতিক হবে (অর্থাত )।blim12ln(1+b2)

অন্যদিকে, কিছু অন্যান্য ঘনত্ব "অনন্ত" অব্যাহত থাকে তবে তাদের অবিচ্ছেদ্যতার একটি সীমা থাকে।


1
আপনি একইভাবে পৃথক পৃথক সম্ভাব্যতা বিতরণ একই জিনিস দেখতে পারেন। এমন একটি বিতরণ নিন যেখানে পূর্ণসংখ্যা n > 0 এর জন্য সংঘটিত হওয়ার সম্ভাবনা 1 এর সাথে সমানুপাতিকnn>0 । সম্ভাবনার যোগফল সীমাবদ্ধ (যা ঠিক তেমনি যেহেতু এটির সীমা 1 থাকা দরকার: আসলে আমাদের ধ্রুবকটি6হতে হবে1n2 বা যাই হোক না কেন), কিন্তু এর সমষ্টি থেকে16π2 এর কোনও অর্থ নেই ver আমরা যদি সম্ভাব্যতা1 এর সাথেআনুপাতিকভাবে বেছে নিই1n পরে গড়ের সাথে1 টি যোগ হয়1n3 এবং আমরা ভাল, এটি "যথেষ্ট ছোট" এটি রূপান্তর করে। 1n2
স্টিভ জেসোপ

1
হ্যাঁ, যে জন্য স্কেলিং ধ্রুবক (এটা to1 যোগফল করতে) হয়। 6π2
গ্লেন_বি -রিনস্টেট মনিকা

8

অন্যান্য উত্তরগুলি ভাল, তবে সবাইকে বোঝাতে পারে না, বিশেষত লোকেরা যারা কচী বিতরণকে এক নজরে দেখে ( ) এবং বলে যে এটি এখনও স্বজ্ঞাতভাবে স্পষ্ট যে গড়টি শূন্য হওয়া উচিতx0=0

গাণিতিক দৃষ্টিকোণ থেকে স্বজ্ঞাত উত্তরটি সঠিক না হওয়ার কারণটি রিমন পুনর্বিন্যাসের উপপাদ্য (ভিডিও)

আপনি যখন কোন কাউচিকে দেখছেন এবং বলছেন যে এর অর্থ "শূন্য হওয়া উচিত" কার্যকরভাবে আপনি কী করছেন আপনি হ'ল "কেন্দ্র" কে শূন্যে বিভক্ত করছেন এবং তারপরে দুটি আকারের ভারসাম্যের মুহুর্তগুলি দাবি করছেন। বা অন্য কথায়, আপনি স্পষ্টভাবে "অর্ধেক" পদগুলি ধনাত্মক (ডানদিকে প্রতিটি বিন্দুতে মুহূর্তগুলি) এবং "অর্ধেক" পদগুলি নেতিবাচক (বাম দিকে প্রতিটি বিন্দুতে মুহুর্ত) দিয়ে দাবি করছেন এবং দাবি করছেন শূন্যের সমষ্টি। (প্রযুক্তিগতভাবে মনের জন্য: )0f(x0+r)rdr0f(x0r)rdr=0

রিমন পুনর্বিন্যাসের উপপাদ্যটি বলে যে এই ধরণের অসীম যোগফল (ধনাত্মক এবং নেতিবাচক উভয় পদাবলীর সাথে এক) কেবল তখনই সামঞ্জস্য হয় যদি দুটি সিরিজ (কেবলমাত্র ইতিবাচক পদ এবং কেবল নেতিবাচক পদগুলি) স্বাধীনভাবে গ্রহণের সময় প্রতিটি অভিযোজিত হয়। যদি উভয় পক্ষ (ধনাত্মক এবং নেতিবাচক) তাদের নিজস্ব থেকে আলাদা হয় তবে আপনি পদগুলির সংক্ষেপের ক্রমটি নিয়ে আসতে পারেন যেমন এটি কোনও সংখ্যার সমান । (উপরের ভিডিও, ::৫০ এ শুরু)

সুতরাং, হ্যাঁ, যদি আপনি 0 থেকে সামঞ্জস্যভাবে সংশ্লেষটি করেন তবে কাচ্চি বিতরণের প্রথম মুহুর্তগুলি বাতিল হয়ে যায়। যাইহোক, গড়ের (মানক) সংজ্ঞাটি এই সংক্ষেপের ক্রমটি প্রয়োগ করে না। আপনার কোনও ক্রমে মুহুর্তগুলি যোগ করতে সক্ষম হওয়া উচিত এবং এটিও সমানভাবে বৈধ হওয়া উচিত। অতএব, কচী বিতরণের গড়টি অপরিবর্তিত - আপনি কীভাবে মুহুর্তগুলির সংমিশ্রণ করবেন তা যথাযথভাবে বেছে নিয়ে আপনি ব্যবহারিকভাবে কোনও বিন্দুতে এগুলিকে "ভারসাম্য" (বা না) বানাতে পারেন।

সুতরাং কোনও বিতরণের গড়কে সংজ্ঞায়িত করার জন্য, দুটি মুহুর্তের ইন্টিগ্রালগুলির প্রত্যেককে প্রস্তাবিত গড়ের চারপাশে স্বতন্ত্রভাবে কনভারজেন্ট (সসীম) হওয়া প্রয়োজন (যা আপনি যখন গণিত করেন, সত্যই এটি সম্পূর্ণরূপে অবিচ্ছেদ্য বলার অন্য একটি উপায় ( ) অভিভাবক হওয়া দরকার)। লেজগুলি যদি "চর্বিযুক্ত" হয় তবে একদিকে যেমন অসীম মুহূর্ত তৈরি হয়, আপনি হয়ে গেছেন। আপনি অন্য দিকে অসীম মুহুর্তের সাথে এটি ভারসাম্য বজায় রাখতে পারবেন না।f(x)xdx


আমার উল্লেখ করা উচিত যে কচী বিতরণের মতো জিনিসের "কাউন্টার স্বজ্ঞাত" আচরণ সম্পূর্ণরূপে অনন্ত সম্পর্কে চিন্তা করার সময় সমস্যার কারণে is কচী বিতরণ নিন এবং লেজগুলি কেটে ফেলুন - এমনকি নির্বিচারে অনেকটা দূরে, যেমন এক্স / কেসিডি নাম্বার থেকে প্লাস / বিয়োগের মতো - এবং (একবার পুনরায় সাধারণীকরণ করা) হঠাৎ আপনি এমন কিছু পাবেন যা ভাল আচরণ করেছে এবং এর একটি নির্ধারিত গড় রয়েছে। এটি নিজেদের মধ্যে চর্বিযুক্ত লেজগুলি নয় যে এটি একটি সমস্যা, আপনি যখন অনন্তের কাছে যান তখন এই লেজগুলি কেমন আচরণ করে।


খুশী হলাম। আমি আশ্চর্য হই যে যদি একটি স্পষ্টত "সংক্ষেপণের অর্ডার" দেওয়া সম্ভব হয় যা বলে, দু'জন করে।
ম্যাথু ড্র্যারি

@ ম্যাথেজড্রুরি: পি_আই এবং এন_আই ইতিবাচক এবং নেতিবাচক সংখ্যা বোঝায়। ধারাবাহিকভাবে p_i এবং n_i সন্ধান করুন যাতে [n_i, p_i] এর উপর অবিচ্ছেদ্য 2+ (1 / i) হয় এবং [n_ {i + 1}, p_i] 2- (1 / i) হয় integ আর, মাতলাব বা গণিত ব্যবহার করে কেউ এটি পরিষ্কারভাবে করতে পারে তবে কেবল সীমাবদ্ধ সংখ্যার জন্য।
ডেভিড এপস্টাইন

7

জেনারেল অ্যাবরিয়াল এবং গ্লেন_ বি এর সঠিক উত্তর ছিল। আমি আপনাকে কচী বিতরণের গড়টি বিদ্যমান নেই / রূপান্তর করে না তা বোঝাতে একটি ছোট ডেমো যুক্ত করতে চাই।

নিম্নলিখিত পরীক্ষায়, আপনি দেখতে পাবেন, এমনকি আপনি একটি বৃহত নমুনা পেয়েছেন এবং নমুনা থেকে অনুশীলনীয় গড়কে ক্যালক্লুয়েট করেছেন, পরীক্ষা-নিরীক্ষার থেকে সংখ্যাগুলি পৃথক।

set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))

enter image description here

আপনি লক্ষ করতে পারেন যে আমাদের পরীক্ষা-নিরীক্ষা রয়েছে এবং প্রতিটি পরীক্ষায় আমরা দুটি বিতরণ থেকে 1 × 10 5 পয়েন্টের নমুনা করি , এত বড় নমুনা আকারের সাথে, বিভিন্ন পরীক্ষাগুলির মধ্যে অভিজ্ঞতাগত গড়টি সত্যিকারের গড়ের কাছাকাছি হওয়া উচিত। ফলাফলগুলি দেখায় যে কচী বিতরণের কোনও রূপান্তরকারী গড় নেই, তবে সাধারণ বিতরণ রয়েছে।1001×105

সম্পাদনা করুন:

চ্যাটটিতে @ চিহ্ন 999 হিসাবে উল্লিখিত হিসাবে, আমাদের তর্ক করা উচিত যে পরীক্ষায় ব্যবহৃত দুটি বিতরণের একইরকম "বৈচিত্র্য" রয়েছে (আমার উদ্ধৃতিটি ব্যবহার করার কারণটি হ'ল কাচির বিতরণ বৈকল্পিকতাও অপরিবর্তিত))। এখানে ন্যায়সঙ্গততা রয়েছে: তাদের পিডিএফ একই রকম।

নোট করুন, কাচি বিতরণের পিডিএফটি দেখে আমরা অনুমান করব যে এটি , তবে আমরা যে পরীক্ষাগুলি দেখতে পারি তা থেকে এটি বিদ্যমান নেই। ডেমো পয়েন্ট এটি।0

curve(dnorm, -8,8)
curve(dcauchy, -8,8)

enter image description here


4
আমি মনে করি না যে এটি দেখায় যে কাচি বিতরণের কোনও অর্থ নেই। আপনি যথাযথ বড় বৈকল্পিকতা সহ একটি সাধারণ বিতরণ দ্বারা কচী বিতরণকে প্রতিস্থাপন করলে আপনি অনুরূপ ফলাফল পেতে পারেন।
999

ভাল পয়েন্ট @ চিহ্ন 999, আমি এই উত্তরটি সমাধান করতে আমার উত্তর সম্পাদনা করব।
হাইটাও ডু

কাচি বিতরণের পিডিএফ থেকে বের করা কি এর কোনও অর্থ নেই, সম্ভবত এটি চর্বিযুক্ত লেজগুলি দেখে?
ks1322

মনে মনে কি এমন কিছু ছিল? stats.stackexchange.com/questions/90531/…
সাইকোরাক্স মনিকাকে


2

dθ/2πθAS1length(A)/2πU(π,π)ππεπ+ε (=π+εmod2π)πU(π,π)ε/2π

যেহেতু চেনাশোনাতে বিতরণটি আবর্তনগতভাবে প্রতিসম হয়, তাই বৃত্তের কোনও গড়, মধ্যমা বা মোড থাকতে পারে না। একইভাবে, উচ্চতর মুহুর্তগুলি যেমন বৈকল্পিকতা বোঝা যায় না। এই বিতরণটি অনেক প্রসঙ্গে প্রাকৃতিকভাবে উত্থিত হয়। উদাহরণস্বরূপ, আমার বর্তমান প্রকল্পে ক্যান্সারযুক্ত টিস্যুগুলির মাইক্রোস্কোপ চিত্রগুলি জড়িত। চিত্রটির অনেকগুলি অবজেক্টগুলি প্রতিসম নয় এবং প্রত্যেককে একটি "দিকনির্দেশনা" নির্ধারণ করা যেতে পারে। স্পষ্ট নাল অনুমানটি এই দিকগুলি অভিন্নভাবে বিতরণ করা হয়।

S1p=(0,1)S1xθpxx=tan(θ/2)dθ/2=dx/(1+x2)dθπ(1+x2)

S1{p}ppS1pp=(0,1), which maps to 0R under stereographic projection and this becomes the median and mode of the Cauchy distribution.


2
The Cauchy distribution has a median and mode.
jkabrg

quite right. I got a bit carried away. But the argument for the non-existence of the mean is correct.. I will edit my answer.
David Epstein

Why is it that "there cannot be a mean because there isn't one on the circle"? There's a lot missing in your argument. I'm assuming what you mean by it being the uniform distribution "on the circle" is that θU(π,π) and X=tan(θ/2), but then E[θ]=0 so I don't understand what you're talking about.
jkabrg

@jkabrg: I hope the new edits make this more comprehensible
David Epstein
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.