সাইটের বেশ কয়েকটি পোস্ট কচির বিভিন্ন সম্পত্তি সম্বোধন করার সময়, আমি সত্যিই তাদের একসাথে রেখেছি এমন কোনও সন্ধান করতে পারি না। আশা করি কিছু সংগ্রহের জন্য এটি ভাল জায়গা হতে পারে। আমি এটি প্রসারিত করতে পারেন।
ভারী লেজ
কচির প্রতিসাম্যযুক্ত এবং মোটামুটি বেল আকৃতির, কিছুটা সাধারণ বিতরণের মতো, এটিতে আরও ভারী লেজ রয়েছে (এবং একটি "কাঁধ" কম)। উদাহরণস্বরূপ, একটি ছোট তবে স্বতন্ত্র সম্ভাবনা রয়েছে যে একটি কাচ্চি এলোমেলো পরিবর্তনশীলটি মধ্যম থেকে 1000 এরও বেশি আন্তঃখণ্ড রেঞ্জ স্থাপন করে rough মোটামুটি একটি সাধারণ র্যান্ডম ভেরিয়েবল হিসাবে একই ক্রম হিসাবে তার মাঝারি থেকে কমপক্ষে 2.67 আন্তঃরৈখিক রেঞ্জ থাকে।
অনৈক্য
কচির বৈচিত্র অসীম।
সম্পাদনা: জিজি মন্তব্যগুলিতে বলেছেন যে এটি অপরিজ্ঞাত। যদি আমরা জোড় জোড়গুলির মধ্যে অর্ধেক বর্গক্ষেত্রের গড়ের গড় হিসাবে গড় হিসাবে গ্রহণ করি - যা উভয়ের উপস্থিতিতেই বৈকল্পিকের অনুরূপ, তবে তা অসীম হবে। তবে সাধারণ সংজ্ঞা অনুসারে জিজি সঠিক। [তবুও নমুনার অর্থের সাথে বিপরীতে, যেটি বড় আকারের হয়ে আসলে কোনও কিছুর সাথে রূপান্তরিত হয় না, নমুনার আকারের বর্ধন যেমন নমুনার আকার বাড়ায়; স্কেলটি আনুপাতিকভাবে n তে বৃদ্ধি পায়, বা সমানভাবে লগের বৈকল্পিকের বিতরণ নমুনা আকারের সাথে লম্বাভাবে বৃদ্ধি পায়। বাস্তবে অসীমের ফলস্বরূপ যে সংস্করণটি আমাদের কিছু বলছে তা বিবেচনা করা ফলপ্রসূ মনে হয়]]
নমুনা স্ট্যান্ডার্ড বিচ্যুতি অবশ্যই বিদ্যমান, তবে তারা যে পরিমাণের চেয়ে বেশি সেই নমুনাটি (যেমন এন = 10 এ মিডিয়ান স্যাম্পল স্ট্যান্ডার্ড বিচ্যুতিটি স্কেল প্যারামিটারের (অর্ধেক আইকিউআর) এর কাছাকাছি, তবে এন = 100 এটি প্রায় 11.9)।
মিন
কচী বিতরণের সীমাবদ্ধ অর্থও নেই; গড় জন্য অবিচ্ছেদ্য একত্রিত হয় না। ফলস্বরূপ, এমনকি প্রচুর সংখ্যক আইন প্রয়োগ হয় না - এন বাড়ার সাথে সাথে নমুনার অর্থ কিছু নির্দিষ্ট পরিমাণে রূপান্তরিত হয় না (সত্যিকার অর্থে তাদের রূপান্তর করার জন্য কিছুই নেই)।
প্রকৃতপক্ষে, নমুনা বিতরণ মানে একটি কাচ্চি বিতরণ থেকে একক পর্যবেক্ষণের বিতরণ (!) এর সমান as লেজটি এত ভারী যে সমষ্টিটিতে আরও মান যুক্ত করা একটি সত্যিকারের চূড়ান্ত মানকে যথেষ্ট হিসাবে যথেষ্ট হিসাবে গড় হিসাবে গ্রহণ করার সময় একটি বৃহত ডিনোমিনেটর দ্বারা বিভাজনের জন্য ক্ষতিপূরণ হিসাবে যথেষ্ট।
ভবিষ্যদ্বাণীর
আপনি অবশ্যই একটি কাচি বিতরণ থেকে পর্যবেক্ষণের জন্য নিখুঁত বুদ্ধিমান পূর্বাভাস অন্তর উত্পাদন করতে পারেন; সরল, মোটামুটি দক্ষ অনুমানক রয়েছে যা অবস্থান এবং স্কেল অনুমানের জন্য ভাল সম্পাদন করে এবং আনুমানিক পূর্বাভাস অন্তরগুলি তৈরি করা যেতে পারে - সুতরাং সেই অর্থে, কমপক্ষে, কচির ভিন্নতাগুলি 'অনুমানযোগ্য'। যাইহোক, লেজটি খুব দূরে প্রসারিত হয়, যাতে আপনি যদি উচ্চ সম্ভাবনার অন্তর চান তবে এটি বেশ প্রশস্ত হতে পারে।
যদি আপনি বিতরণের কেন্দ্রটি পূর্বাভাস দেওয়ার চেষ্টা করছেন (উদাহরণস্বরূপ একটি রিগ্রেশন টাইপ মডেল), এটি কোনও অর্থে অনুমান করা তুলনামূলক সহজ হতে পারে ; কাউচি বেশ উঁচুতে রয়েছে (একটি সাধারণ পরিমাপের পরিমাপের জন্য কেন্দ্রের কাছে "বিতরণ প্রচুর" রয়েছে), সুতরাং আপনার যদি উপযুক্ত অনুমানকারী থাকে তবে কেন্দ্রটি তুলনামূলকভাবে ভাল-অনুমান করা যায়।
এখানে একটি উদাহরণ:
আমি স্ট্যান্ডার্ড কচির ত্রুটির (100 টি পর্যবেক্ষণ, ইন্টারসেপ্ট = 3, servationsালু = 1.5) সাথে লিনিয়ার সম্পর্ক থেকে ডেটা উত্পন্ন করেছি এবং ওয়াই-আউটলিয়ারদের পক্ষে যুক্তিসঙ্গতভাবে শক্তিশালী এমন তিনটি পদ্ধতির দ্বারা আনুমানিক রিগ্রেশন লাইন: টুকি 3 গ্রুপ লাইন (লাল), থেইল রিগ্রেশন (গা dark় সবুজ) এবং এল 1-রিগ্রেশন (নীল)। কাউচিতে বিশেষভাবে দক্ষ কেউ নেই - যদিও তারা সকলেই আরও কার্যকর পদ্ধতির জন্য দুর্দান্ত সূচনা পয়েন্ট তৈরি করে।
তবুও তিনটি ডেটার কোলাহলের তুলনায় প্রায় কাকতালীয় এবং ডেটা যেদিকে চলে সে কেন্দ্রের খুব কাছেই রয়েছে; সেই অর্থে কচি স্পষ্টভাবে "অনুমানযোগ্য" is
পরম বাকী অংশগুলির মাঝারিটি যে কোনও লাইনের জন্য 1 এর চেয়ে সামান্য বড় (বেশিরভাগ ডেটা আনুমানিক লাইনের খুব কাছেই থাকে); সেই অর্থে কচিও "অনুমানযোগ্য"।
বাম দিকে প্লট জন্য একটি বড় আউটলেট আছে। ডেটা আরও ভালভাবে দেখার জন্য আমি ডানদিকে y- অক্ষের উপর স্কেল সংকীর্ণ করেছি।