কচী বন্টন কি কোনওভাবে "অনাকাঙ্ক্ষিত" বিতরণ?


14

কচী বিতরণ কি কোনওভাবে "অনাকাঙ্ক্ষিত" বিতরণ?

আমি চেষ্টা করেছিলাম

cs <- function(n) {
  return(rcauchy(n,0,1))
}

একটি এন সংখ্যাগরিষ্ঠ জন্য আর মধ্যে এবং লক্ষ্য যে তারা মাঝেমধ্যে বেশ অনাকাঙ্ক্ষিত মান উত্পন্ন।

যেমন তুলনা করুন

as <- function(n) {
  return(rnorm(n,0,1))
}

যা সর্বদা পয়েন্টগুলির একটি "কমপ্যাক্ট" মেঘ দেয় বলে মনে হয়।

এই ছবিটি দ্বারা এটি সাধারণ বিতরণের মতো দেখতে হবে? তবুও এটি কেবলমাত্র মানগুলির একটি উপসেটের জন্য করে। বা সম্ভবত কৌশলটি হ'ল কচী স্ট্যান্ডার্ড বিচ্যুতিগুলি (নীচের ছবিতে) আরও ধীরে ধীরে (বাম এবং ডানদিকে) একত্রিত হয় এবং এইভাবে কম গুরুতর ক্ষেত্রেও আরও মারাত্মক বহিরাগতদের অনুমতি দেয়?

https://i.stack.imgur.com/zGTLU.png

এখানে যেমন সাধারণ আরভি এবং সিএস হ'ল কচী আরভিগুলি।

এখানে চিত্র বর্ণনা লিখুন

কিন্তু বহিরাগতদের চূড়ান্ততার দ্বারা, কচির পিডিএফ এর লেজগুলি কখনই একত্রিত হয় না?


9
আপনার প্রশ্নটি অস্পষ্ট / অস্পষ্ট, সুতরাং এর উত্তর দেওয়া শক্ত hard উদাহরণস্বরূপ আপনার প্রশ্নে "অপ্রত্যাশিত" এর অর্থ কী? "কাচ্চি স্ট্যান্ডার্ড বিচ্যুতি" এবং শেষের কাছাকাছি রূপান্তর বলতে কী বোঝ? আপনি কোথাও স্ট্যান্ডার্ড বিচ্যুতির গণনা করছেন বলে মনে হয় না। স্ট্যান্ডার্ড বিচ্যুতি ঠিক কি? ২. সাইটের অনেকগুলি পোস্ট কাচির বৈশিষ্ট্যগুলি নিয়ে আলোচনা করে যা আপনাকে আপনার প্রশ্নকে ফোকাস করতে সহায়তা করতে পারে। এটি উইকিপিডিয়া যাচাইয়ের জন্যও মূল্যবান হতে পারে। ৩. আমি "বেল শেপের" শব্দটি এড়িয়ে চলার পরামর্শ দিই; উভয় ঘনত্বগুলি প্রায় বেলের মতো আকারযুক্ত মনে হয়; কেবল তাদের নামে তাদের কল করুন।
গ্লেন_বি -রিনস্টেট মনিকা

4
অবশ্যই কচী খুব ভারী লেজযুক্ত।
গ্লেন_বি -রিনস্টেট মনিকা

1
আমি কয়েকটি তথ্য পোস্ট করেছি; আশা করি এগুলি আপনাকে কী জানতে চাইবে তা নির্ধারণ করতে সহায়তা করবে যাতে আপনি আপনার প্রশ্নটিকে আরও পরিমার্জন করতে পারেন।
গ্লেন_বি -রিনস্টেট মনিকা

1
|এক্স|এক্স

2
বড় আউটলিয়াররা সাধারণের সাথে সম্ভব তবে তারা অবিশ্বাস্যভাবে বিরল । কৌচির চেয়ে 0 টির চেয়ে বেশি দ্রুত সাধারণ মাথাগুলির জন্য ঘনত্ব (এবং উপরের লেজের মধ্যে, বিশেষত কমপক্ষে প্রদত্ত আকারের বেঁচে থাকার পক্ষে বেঁচে থাকার ক্রিয়া) - তবে তবুও উভয় ঘনত্ব (এবং উভয় বেঁচে থাকার ক্রিয়া) 0 এ পৌঁছনো এবং কখনও এটি পৌঁছাতে পারে না।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


39

সাইটের বেশ কয়েকটি পোস্ট কচির বিভিন্ন সম্পত্তি সম্বোধন করার সময়, আমি সত্যিই তাদের একসাথে রেখেছি এমন কোনও সন্ধান করতে পারি না। আশা করি কিছু সংগ্রহের জন্য এটি ভাল জায়গা হতে পারে। আমি এটি প্রসারিত করতে পারেন।

ভারী লেজ

কচির প্রতিসাম্যযুক্ত এবং মোটামুটি বেল আকৃতির, কিছুটা সাধারণ বিতরণের মতো, এটিতে আরও ভারী লেজ রয়েছে (এবং একটি "কাঁধ" কম)। উদাহরণস্বরূপ, একটি ছোট তবে স্বতন্ত্র সম্ভাবনা রয়েছে যে একটি কাচ্চি এলোমেলো পরিবর্তনশীলটি মধ্যম থেকে 1000 এরও বেশি আন্তঃখণ্ড রেঞ্জ স্থাপন করে rough মোটামুটি একটি সাধারণ র্যান্ডম ভেরিয়েবল হিসাবে একই ক্রম হিসাবে তার মাঝারি থেকে কমপক্ষে 2.67 আন্তঃরৈখিক রেঞ্জ থাকে।

অনৈক্য

কচির বৈচিত্র অসীম।

সম্পাদনা: জিজি মন্তব্যগুলিতে বলেছেন যে এটি অপরিজ্ঞাত। যদি আমরা জোড় জোড়গুলির মধ্যে অর্ধেক বর্গক্ষেত্রের গড়ের গড় হিসাবে গড় হিসাবে গ্রহণ করি - যা উভয়ের উপস্থিতিতেই বৈকল্পিকের অনুরূপ, তবে তা অসীম হবে। তবে সাধারণ সংজ্ঞা অনুসারে জিজি সঠিক। [তবুও নমুনার অর্থের সাথে বিপরীতে, যেটি বড় আকারের হয়ে আসলে কোনও কিছুর সাথে রূপান্তরিত হয় না, নমুনার আকারের বর্ধন যেমন নমুনার আকার বাড়ায়; স্কেলটি আনুপাতিকভাবে n তে বৃদ্ধি পায়, বা সমানভাবে লগের বৈকল্পিকের বিতরণ নমুনা আকারের সাথে লম্বাভাবে বৃদ্ধি পায়। বাস্তবে অসীমের ফলস্বরূপ যে সংস্করণটি আমাদের কিছু বলছে তা বিবেচনা করা ফলপ্রসূ মনে হয়]]

নমুনা স্ট্যান্ডার্ড বিচ্যুতি অবশ্যই বিদ্যমান, তবে তারা যে পরিমাণের চেয়ে বেশি সেই নমুনাটি (যেমন এন = 10 এ মিডিয়ান স্যাম্পল স্ট্যান্ডার্ড বিচ্যুতিটি স্কেল প্যারামিটারের (অর্ধেক আইকিউআর) এর কাছাকাছি, তবে এন = 100 এটি প্রায় 11.9)।

মিন

কচী বিতরণের সীমাবদ্ধ অর্থও নেই; গড় জন্য অবিচ্ছেদ্য একত্রিত হয় না। ফলস্বরূপ, এমনকি প্রচুর সংখ্যক আইন প্রয়োগ হয় না - এন বাড়ার সাথে সাথে নমুনার অর্থ কিছু নির্দিষ্ট পরিমাণে রূপান্তরিত হয় না (সত্যিকার অর্থে তাদের রূপান্তর করার জন্য কিছুই নেই)।

প্রকৃতপক্ষে, নমুনা বিতরণ মানে একটি কাচ্চি বিতরণ থেকে একক পর্যবেক্ষণের বিতরণ (!) এর সমান as লেজটি এত ভারী যে সমষ্টিটিতে আরও মান যুক্ত করা একটি সত্যিকারের চূড়ান্ত মানকে যথেষ্ট হিসাবে যথেষ্ট হিসাবে গড় হিসাবে গ্রহণ করার সময় একটি বৃহত ডিনোমিনেটর দ্বারা বিভাজনের জন্য ক্ষতিপূরণ হিসাবে যথেষ্ট।

ভবিষ্যদ্বাণীর

আপনি অবশ্যই একটি কাচি বিতরণ থেকে পর্যবেক্ষণের জন্য নিখুঁত বুদ্ধিমান পূর্বাভাস অন্তর উত্পাদন করতে পারেন; সরল, মোটামুটি দক্ষ অনুমানক রয়েছে যা অবস্থান এবং স্কেল অনুমানের জন্য ভাল সম্পাদন করে এবং আনুমানিক পূর্বাভাস অন্তরগুলি তৈরি করা যেতে পারে - সুতরাং সেই অর্থে, কমপক্ষে, কচির ভিন্নতাগুলি 'অনুমানযোগ্য'। যাইহোক, লেজটি খুব দূরে প্রসারিত হয়, যাতে আপনি যদি উচ্চ সম্ভাবনার অন্তর চান তবে এটি বেশ প্রশস্ত হতে পারে।

যদি আপনি বিতরণের কেন্দ্রটি পূর্বাভাস দেওয়ার চেষ্টা করছেন (উদাহরণস্বরূপ একটি রিগ্রেশন টাইপ মডেল), এটি কোনও অর্থে অনুমান করা তুলনামূলক সহজ হতে পারে ; কাউচি বেশ উঁচুতে রয়েছে (একটি সাধারণ পরিমাপের পরিমাপের জন্য কেন্দ্রের কাছে "বিতরণ প্রচুর" রয়েছে), সুতরাং আপনার যদি উপযুক্ত অনুমানকারী থাকে তবে কেন্দ্রটি তুলনামূলকভাবে ভাল-অনুমান করা যায়।

এখানে একটি উদাহরণ:

আমি স্ট্যান্ডার্ড কচির ত্রুটির (100 টি পর্যবেক্ষণ, ইন্টারসেপ্ট = 3, servationsালু = 1.5) সাথে লিনিয়ার সম্পর্ক থেকে ডেটা উত্পন্ন করেছি এবং ওয়াই-আউটলিয়ারদের পক্ষে যুক্তিসঙ্গতভাবে শক্তিশালী এমন তিনটি পদ্ধতির দ্বারা আনুমানিক রিগ্রেশন লাইন: টুকি 3 গ্রুপ লাইন (লাল), থেইল রিগ্রেশন (গা dark় সবুজ) এবং এল 1-রিগ্রেশন (নীল)। কাউচিতে বিশেষভাবে দক্ষ কেউ নেই - যদিও তারা সকলেই আরও কার্যকর পদ্ধতির জন্য দুর্দান্ত সূচনা পয়েন্ট তৈরি করে।

তবুও তিনটি ডেটার কোলাহলের তুলনায় প্রায় কাকতালীয় এবং ডেটা যেদিকে চলে সে কেন্দ্রের খুব কাছেই রয়েছে; সেই অর্থে কচি স্পষ্টভাবে "অনুমানযোগ্য" is

পরম বাকী অংশগুলির মাঝারিটি যে কোনও লাইনের জন্য 1 এর চেয়ে সামান্য বড় (বেশিরভাগ ডেটা আনুমানিক লাইনের খুব কাছেই থাকে); সেই অর্থে কচিও "অনুমানযোগ্য"।

কচির ত্রুটি এবং তিনটি ফিটেড রিগ্রেশন লাইনের সাথে লিনিয়ার সম্পর্ক

বাম দিকে প্লট জন্য একটি বড় আউটলেট আছে। ডেটা আরও ভালভাবে দেখার জন্য আমি ডানদিকে y- অক্ষের উপর স্কেল সংকীর্ণ করেছি।


1
ভারী লেজ এবং বৈকল্পিক অসীম সম্পর্কযুক্ত, তাই না?
mavavilj

অবশ্যই. অপরিবর্তিত গড়টিও ভারী লেজের সাথে সম্পর্কিত।
গ্লেন_বি -রিনস্টেট মনিকা

"সরল, মোটামুটি দক্ষ অনুমানক রয়েছে যা অবস্থান এবং স্কেল এবং অনুমানের পূর্বাভাস অন্তরগুলি নির্ধারণের জন্য ভাল সম্পাদন করে" - আপনি কি রেফারেন্স সরবরাহ করতে পারেন?
কার্লোস সিনেলি

মন্তব্যগুলি বর্ধিত আলোচনার জন্য নয়; এই কথোপকথন চ্যাটে সরানো হয়েছে ।
গুং - মনিকা পুনরায়

@ কার্লোস এখানে দুটি ভিন্ন সমস্যা রয়েছে - (i) অবস্থানের জন্য সহজ, মোটামুটি দক্ষ अनुमानক (যেমন একটি উপযুক্ত ছাঁটাইযুক্ত গড়) এবং কাচিতে স্কেল এবং (ii) কচির পক্ষে কাজ করতে পারে এমন একটি পূর্বাভাস অন্তর তৈরির পদ্ধতি। আমি মনে করি প্রথমটি ইতিমধ্যে সাইটে isাকা রয়েছে এবং দ্বিতীয়টি তার নিজের একটি প্রশ্নের যোগ্যতা অর্জন করবে।
গ্লেন_বি -রিনস্টেট মনিকা

1

μσএনμ±σμ±636,62σ

σ

কচী বিতরণ প্রকৃতিতে বেশ খানিকটা প্রদর্শিত হয়, বিশেষত যেখানে আপনার কিছু ধরণের বৃদ্ধি রয়েছে। এটি এমনও উপস্থিত হয় যেখানে জিনিসগুলি স্পিন হয় যেমন শৈলগুলি পাহাড়ের উপর দিয়ে চলছে। আপনি এটি শেয়ার বাজারের রিটার্নগুলিতে বিতরণের কুৎসিত মিশ্রণের মূল বিতরণ হিসাবে পাবেন, যদিও নিলামে বিক্রি হওয়া প্রাচীন জিনিসগুলির মতো বিনিময়ে নয়। প্রাচীন পুরানোগুলিতে রিটার্নগুলি কোনও গড় বা বৈকল্পিকতা ছাড়াই বিতরণের অন্তর্ভুক্ত তবে কচির বিতরণ নয়। নিলামের বিধিবিধানের পার্থক্যের ফলে পার্থক্য তৈরি হয়। আপনি যদি এনওয়াইএসই এর নিয়ম পরিবর্তন করে থাকেন তবে কচী বিতরণটি অদৃশ্য হয়ে যাবে এবং অন্যরকম উপস্থিত হবে।

এটি কেন উপস্থিত তা বোঝার জন্য, কল্পনা করুন যে আপনি বিডার এবং সম্ভাব্য দরদাতাদের একটি খুব বড় সংখ্যায় একজন দরদাতা ছিলেন। স্টকগুলি ডাবল নিলামে বিক্রি হওয়ার কারণে, বিজয়ীর অভিশাপ প্রযোজ্য নয়। সাম্যাবস্থায়, যুক্তিযুক্ত আচরণটি আপনার প্রত্যাশিত মানকে বিড করা। একটি প্রত্যাশা মানে গড় একটি ফর্ম। নমুনার আকার অসীমতায় চলে যাওয়ার সাথে গড় অনুমানের বিতরণ স্বাভাবিকতায় রূপান্তরিত হয়।

Rটি=পিটি+ +1পিটি

এটি শেয়ার বাজারকে খুব অস্থির করে তোলে, যদি কেউ মনে করে যে শেয়ার বাজারের একটি স্বাভাবিক বা লগ-স্বাভাবিক বিতরণ হওয়া উচিত তবে অপ্রত্যাশিতভাবে অস্থির নয় যদি আপনি ভারী লেজগুলি আশা করেন।

আমি কাচি বিতরণের জন্য বায়সিয়ান এবং ফ্রিকোয়েনসিস্ট ভবিষ্যদ্বাণীমূলক বিতরণ উভয়ই তৈরি করেছি এবং তাদের অনুমানগুলি দিয়েছি যে তারা ভালভাবে কাজ করে। বায়সিয়ান ভবিষ্যদ্বাণীটি কুলব্যাক-লেবেলার বিচ্যুতি হ্রাস করেছে, অর্থাত কোনও প্রদত্ত ডেটা সেটের জন্য আপনি ভবিষ্যদ্বাণীতে প্রকৃতির কাছে যেমন যেতে পারেন তত কাছাকাছি। ফ্রিকোয়েনসিস্ট পূর্বাভাস অনেকগুলি স্বতন্ত্র নমুনা থেকে বহু স্বাধীন ভবিষ্যতবাণীগুলির তুলনায় গড় কুলব্যাক-লেবেলার বিচ্যুতিকে হ্রাস করে । এটি প্রয়োজনীয় কভারেজ সহ যে কোনও একটি নমুনার প্রত্যাশা করে, তবে অগত্যা ভাল পারফর্ম করে না। লেজগুলি একত্রিত হয়, তবে তারা ধীরে ধীরে একত্রিত হয়।

মাল্টিভাইয়ারেট কচির আরও বেশি বিরক্তিকর বৈশিষ্ট্য রয়েছে। উদাহরণস্বরূপ, যদিও এটি কোনও স্পষ্টতই কোভারি করতে পারে না কারণ এটির কোনও অর্থ নেই, তবে এর কোনও সমবায় ম্যাট্রিক্সের মতো কিছুই নেই। যদি সিস্টেমে আর কিছু না ঘটে থাকে তবে কচী ত্রুটিগুলি সর্বদা গোলাকার হয়। তদুপরি, কিছুই covaries যখন, কিছুই স্বাধীন হয় না। এটি ব্যবহারিক দিক থেকে কতটা গুরুত্বপূর্ণ হতে পারে তা বোঝার জন্য, এমন দুটি দেশ কল্পনা করুন যে দুটি দেশই বৃদ্ধি পাচ্ছে এবং তারা একে অপরের সাথে বাণিজ্য করে। একটিতে ত্রুটি অন্যটির ত্রুটিগুলি থেকে স্বতন্ত্র নয়। আমার ভুলগুলি আপনার ভুলগুলিকে প্রভাবিত করে। একটি দেশকে যদি পাগল দ্বারা দখল করা হয় তবে সেই পাগলের ভুলগুলি সর্বত্র অনুভূত হয়। অন্যদিকে, যেহেতু প্রভাবগুলি সমবায় ম্যাট্রিক্সের সাথে প্রত্যাশা হিসাবে লিনিয়ার নয়, তাই অন্যান্য দেশগুলি প্রভাব কমানোর জন্য সম্পর্ক ছিন্ন করতে পারে।

এটিই ট্রাম্পের বাণিজ্য যুদ্ধকে এত বিপজ্জনক করে তুলেছে। ইউরোপীয় ইউনিয়ন প্রতিটি অন্যান্য একক অর্থনীতির বিরুদ্ধে বাণিজ্যের মাধ্যমে অর্থনৈতিক যুদ্ধ ঘোষণা করার পরে বিশ্বের দ্বিতীয় বৃহত্তম অর্থনীতি এবং যুদ্ধের জন্য ঘোষিত দেশগুলির কাছ থেকে লড়াই করার জন্য অর্থ ধার করে এই যুদ্ধকে অর্থায়ন করছে। যদি সেই নির্ভরশীলতাগুলি অনাবৃত করতে বাধ্য করা হয় তবে এটি এমনভাবে কুৎসিত হবে যে কারওরই জীবন্ত স্মৃতি নেই। যখন জ্যাকসন প্রশাসনের কাছ থেকে আটলান্টিক বাণিজ্য নিষিদ্ধ করা হয়েছিল তখন জ্যাকসন প্রশাসনের পরে আমাদের তেমন সমস্যা হয়নি।

কাচ্চি বিতরণ আকর্ষণীয় কারণ এটি ক্ষতিকারক এবং এস-কার্ভ ক্রমবর্ধমান সিস্টেমে প্রদর্শিত হয়। তারা মানুষকে বিভ্রান্ত করে কারণ তাদের প্রতিদিনের জীবন ঘনত্বের সাথে পূর্ণ যা সাধারণত একটি গড় এবং সাধারণত একটি বৈচিত্র রয়েছে। এটি সিদ্ধান্ত নেওয়া খুব কঠিন করে তোলে কারণ ভুল পাঠ শিখেছে।


আমি গা the় পদ্ধতিতে পছন্দ করি যেখানে এই উত্তরে গাণিতিক বৈশিষ্ট্যগুলি বাস্তব-বিশ্বের আচরণের সাথে ম্যাপ করা হয়েছে। তবে আপনি কি উল্লেখ করবেন না যে (উভয় পক্ষের) কাটা কাঁচির সমস্ত মুহুর্তের সীমাবদ্ধ রয়েছে?
অ্যালেকোস পাপাদোপল্লোস

এটি কেবল বাম দিকে কাটা হয়েছে। নামমাত্র গ্রহীয় বাজেটের সীমাবদ্ধতা ডানদিকে স্টোকাস্টিক এবং যেহেতু আর্থিক ব্যবস্থা সংরক্ষণ ব্যবস্থা নেই, তাই তারা ডানদিকে অসীম।
ডেভ হ্যারিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.