সম্ভাব্যতা ঘনত্ব ফাংশনের মোডটি কীভাবে খুঁজে পাবেন?


14

আমার অন্যান্য প্রশ্নের দ্বারা অনুপ্রাণিত হয়ে আমি জিজ্ঞাসা করতে চাই যে একটি ফাংশন এর সম্ভাব্যতা ঘনত্ব ফাংশনের (পিডিএফ) মোড কীভাবে খুঁজে পায় ?f(x)

এর জন্য কি কোনও "কুক-বুক" পদ্ধতি আছে? স্পষ্টতই, এই কাজটি প্রথমে যতটুকু মনে হয় তার চেয়ে অনেক বেশি কঠিন।


3
আপনি যে খুব আলাদা উত্তর পেয়েছেন সে সম্পর্কে আপনি যদি অবাক হন তবে নোটের উত্তর * আপনার পরিচিত পিডিএফ রয়েছে এমন অবস্থার চেয়ে নমুনা থেকে অনুমানের সাথে সম্পর্কিত ; আমি আপনার প্রশ্নটি পিডিএফ সম্পর্কিত জ্ঞাত হিসাবে জিজ্ঞাসা করে পড়েছি, তবে আপনি কীভাবে নমুনা থেকে জিনিসগুলি করতে চান তা যদি দেখতে চান তবে এটি একটি খুব দরকারী পোস্ট। ... (*
পিয়েরস

উত্তর:


13

"মোড" বলার দ্বারা বোঝা যায় যে বিতরণটির একটি এবং একটি মাত্র রয়েছে। সাধারণভাবে একটি বিতরণে অনেকগুলি মোড থাকতে পারে বা (তর্কযোগ্যভাবে) কোনওটিই না।

যদি একাধিক মোড থাকে তবে আপনার যদি সেগুলি বা কেবলমাত্র বৈশ্বিক মোড (ঠিক সেখানে থাকে তবে) নির্দিষ্ট করতে চান specify

ধরে নিই আমরা অমনোডাল বিতরণে * নিজেকে সীমাবদ্ধ করি , তাই আমরা "" মোডের কথা বলতে পারি, সেগুলি সাধারণভাবে ফাংশনের সর্বাধিক সন্ধানের মতোই পাওয়া যায়।

* নোট করুন যে পৃষ্ঠাটির "মোড" শব্দটির একাধিক অর্থ রয়েছে, সুতরাং "আনমোডাল" শব্দটিও এর অর্থ দেয় এবং মোডের বেশ কয়েকটি সংজ্ঞা প্রদান করে - যা 0, 1 বা একটি মোড হিসাবে সঠিকভাবে গণনা করতে পারে change আরও - এবং তাদের চিহ্নিত করার কৌশলকেও পরিবর্তন করে। নোট বিশেষ করে কিভাবে সাধারণ "আরও সাধারণ" কি unimodality খোলার অনুচ্ছেদ বিষয় সম্পর্কেও phrasing " unimodality মানে শুধুমাত্র একটি একক সর্বোচ্চ মান, একরকম সংজ্ঞায়িত "

এই পৃষ্ঠায় দেওয়া একটি সংজ্ঞা হ'ল:

অবিচ্ছিন্ন সম্ভাব্যতা বিতরণের একটি মোড এমন একটি মান যেখানে সম্ভাব্যতা ঘনত্ব ফাংশন (পিডিএফ) তার সর্বোচ্চ মান অর্জন করে

সুতরাং মোডের একটি নির্দিষ্ট সংজ্ঞা দেওয়া হয়েছে যা আপনি এটি খুঁজে পেয়েছেন কারণ আপনি সাধারণভাবে ফাংশনগুলি নিয়ে কাজ করার সময় "সর্বাধিক মান" এর নির্দিষ্ট সংজ্ঞাটি পেয়ে যাবেন (ধরে নিই যে এই সংজ্ঞাটির অধীনে বিতরণটি সর্বসম্মত)।

পরিস্থিতিগুলির উপর নির্ভর করে এই জাতীয় জিনিসগুলি সনাক্ত করার জন্য গণিতে বিভিন্ন কৌশল রয়েছে। দেখ, "ফাইন্ডিং কার্মিক সর্বোচ্চ এবং সর্বনিম্ন" উইকিপিডিয়া পৃষ্ঠার বিভাগে সর্বোচ্চ এবং সর্বনিম্ন যা সংক্ষিপ্ত আলোচনা দেয়।

উদাহরণস্বরূপ, যদি জিনিসগুলি পর্যাপ্ত পরিমাণে সুন্দর হয় - বলুন আমরা একটি অবিচ্ছিন্ন র্যান্ডম ভেরিয়েবলের সাথে কাজ করছি, যেখানে ঘনত্বের ক্রিয়ায় অবিচ্ছিন্ন প্রথম ডেরাইভেটিভ রয়েছে - আপনি ঘনত্বের ক্রিয়াটি কোথায় ডাইরভেটিভ শূন্য, তা পরীক্ষা করে চেষ্টা করে এগিয়ে যেতে পারেন এটি কোন ধরণের সমালোচনামূলক বিন্দু (সর্বাধিক, ন্যূনতম, অনুভূতির অনুভূমিক পয়েন্ট)। স্থানীয় সর্বাধিক এমন ঠিক একটি পয়েন্ট যদি থাকে তবে এটি একটি সর্বজনীন বিতরণের মোড হওয়া উচিত।

তবে, সাধারণ জিনিসগুলি আরও জটিল (যেমন মোডটি একটি সমালোচনামূলক বিন্দু নাও হতে পারে), এবং কার্যকারিতা সর্বাধিক সন্ধানের জন্য বিস্তৃত কৌশলগুলি আসে come

কখনও কখনও, ডেরাইভেটিভগুলি বীজগণিতভাবে শূন্য যেখানে পাওয়া সন্ধান করা কঠিন বা কমপক্ষে জটিল হতে পারে, তবে অন্য উপায়ে ম্যাক্সিমা সনাক্তকরণ এখনও সম্ভব হতে পারে। উদাহরণস্বরূপ, এটি হতে পারে যে কোনও একটি সর্বজনীন বিতরণের মোড চিহ্নিত করতে প্রতিসাম্য বিবেচনার আবেদন করতে পারে। অথবা একটি কম্পিউটারে সংখ্যাসূচকভাবে একটি মোড সন্ধানের জন্য কোনও সংখ্যক অ্যালগোরিদমের অনুরোধ করতে পারে।

এখানে কয়েকটি কেস রয়েছে যা আপনার যাচাই করতে হবে এমন সাধারণ জিনিসগুলিকে চিত্রিত করে - এমনকি ফাংশনটি অবিমোচনীয় এবং কমপক্ষে টুকরোয়াল ধারাবাহিকভাবে থাকা অবস্থায়ও।

এখানে চিত্র বর্ণনা লিখুন

সুতরাং, উদাহরণস্বরূপ, আমাদের অবশ্যই শেষের পয়েন্টগুলি (সেন্টার ডায়াগ্রাম), পয়েন্টগুলি যেখানে ডেরাইভেটিভ পরিবর্তনগুলি স্বাক্ষর করে (তবে শূন্য হতে পারে না; প্রথম চিত্রটি) এবং বিচ্ছিন্নতার পয়েন্টগুলি (তৃতীয় চিত্র) পরীক্ষা করতে হবে।

কিছু ক্ষেত্রে, বিষয়গুলি এই তিনটির মতো ঝরঝরে নাও হতে পারে; আপনি যে বিশেষ ফাংশনটি ব্যবহার করছেন তার বৈশিষ্ট্যগুলি বোঝার চেষ্টা করতে হবে।


আমি মাল্টিভারিয়েট কেসটি স্পর্শ করি নি, যেখানে ফাংশনগুলি বেশ "দুর্দান্ত" হলেও, স্থানীয় ম্যাক্সিমাকে খুঁজে পাওয়া যথেষ্ট জটিল হতে পারে (উদাহরণস্বরূপ এমনটি করার জন্য সংখ্যাসূচক পদ্ধতিগুলি ব্যবহারিক অর্থে ব্যর্থ হতে পারে, এমনকি তাদের যৌক্তিকভাবে সাফল্য অর্জন করতে হবে তখনও অবশেষে).


1
+1 একটি ছোটখাট পর্যবেক্ষণ হিসাবে, গ্লোবাল মোডটিও অনন্য হতে পারে না; উদাহরণস্বরূপ, একটি এবং একটি র্যান্ডম ভেরিয়েবলের সমান ওজন সহ একটি মিশ্রণ ঘনত্ব । এন ( - 1 , 1 )N(1,1)N(1,1)
দিলীপ সরোতে

@ দিলিপ আমি এতে একটি সামান্য পাঠ্য যুক্ত করব।
গ্লেন_বি -রিনস্টেট মনিকা

1
@ দিলিপ সরওয়াট এছাড়াও যৌথ বন্টন থেকে মোডগুলি প্রান্তিক বিতরণগুলির মোড থেকে পৃথক হতে পারে।
মার্সেলো ভেনচুরা

17

এই উত্তরটি একটি নির্দিষ্ট পদ্ধতিতে জোর দিয়ে একটি নমুনা থেকে পুরো মোডের প্রাক্কলনকে কেন্দ্র করে। যদি এমন কোনও দৃ strong় জ্ঞান থাকে যার মধ্যে আপনি ইতিমধ্যে ঘনত্বটি বিশ্লেষণাত্মকভাবে বা সংখ্যাগতভাবে জানেন তবে @Glen_b- এর উত্তরের মতই পছন্দসই উত্তরটি হ'ল সংক্ষেপে, একক সর্বোচ্চ বা একাধিক ম্যাক্সিমাকে সরাসরি অনুসন্ধান করা।

"অর্ধ-নমুনা মোডগুলি" স্বল্পতম দৈর্ঘ্যের সাথে অর্ধ-নমুনার পুনরাবৃত্ত নির্বাচন ব্যবহার করে গণনা করা যেতে পারে। যদিও এর শিকড় দীর্ঘ রয়েছে, এই ধারণাটির একটি দুর্দান্ত উপস্থাপনা বাইকেল এবং ফ্রেহ্বার্থ (2006) দিয়েছিল।

সংক্ষিপ্ত ব্যবধানের মধ্যবর্তী পয়েন্ট হিসাবে মোডটি অনুমান করার ধারণাটিতে একটি নির্দিষ্ট সংখ্যক পর্যবেক্ষণ রয়েছে কমপক্ষে ড্যালেনিয়াসের দিকে ফিরে (1965)। মোডের অন্যান্য অনুমানকারীদের উপর রবার্টসন এবং ক্রিয়ার (1974), বিকেল (2002) এবং বিকেল এবং ফ্রাওয়ারথ (2006) দেখুন।

X এর মানের একটি নমুনার অর্ডার পরিসংখ্যান দ্বারা সংজ্ঞায়িত করা হয়nxx(1)x(2)x(n1)x(n)

অর্ধ-নমুনা মোড এখানে দুটি বিধি ব্যবহার করে সংজ্ঞায়িত করা হয়।

n=1x(1)n=2(x(1)+x(2))/2n=3(x(1)+x(2))/2x(1)x(2)x(2)x(3)(x(2)+x(3))/2x(2)

n43h1=n/2kk+h1x(k+h1)x(k)k=1,,nh1h1+1h2=h1/2

সংক্ষিপ্ত অর্ধেক শনাক্ত করার ধারণাটি জে ডাব্লু টুকি নামক "সংক্ষিপ্ত" প্রয়োগ করা হয়েছিল এবং অ্যান্ড্রুজ, বিকেল, হাম্পেল, হুবার, রজারস এবং টুকি (1972, পি .26) দ্বারা অবস্থান অনুমানের প্রিন্সটনের দৃust়তা অধ্যয়ন প্রবর্তন করেছিলেন। সংক্ষিপ্ত অর্ধ দৈর্ঘ্যের গড় meanx(k),,x(k+h)h=n/2(xk+x(k+h))/2xshorth

কিছু ব্রড-ব্রাশ মন্তব্য গাণিতিক বা তাত্ত্বিক পরিসংখ্যানবিদদের মতো ব্যবহারিক ডেটা বিশ্লেষকদের দৃষ্টিকোণ থেকে অর্ধ-নমুনা মোডের সুবিধা এবং অসুবিধাগুলি অনুসরণ করে। প্রকল্প যাই হোক না কেন, সর্বদা মানক সারসংক্ষেপ ব্যবস্থাগুলির সাথে ফলাফলগুলির তুলনা করা (যেমন: জ্যামিতিক এবং সুরেলা উপায় সহ মিডিয়ান বা উপায়) এবং বন্টনগুলির গ্রাফের সাথে ফলাফলগুলি সম্পর্কিত সম্পর্কিত বুদ্ধিমানের কাজ হবে। তদুপরি, যদি আপনার আগ্রহ দ্বি-দ্বৈততা বা মাল্টিমোডালটির অস্তিত্ব বা সীমাতে থাকে তবে ঘনত্বের কার্যকারিতাটির যথাযথ স্মুথিত প্রাক্কলনগুলিতে সরাসরি নজর দেওয়া ভাল।

মোড অনুমানের তথ্য যেখানে ঘন সেখানে সংক্ষিপ্তসার করে, অর্ধ-নমুনা মোডটি টুলবক্সে মোডের একটি স্বয়ংক্রিয় অনুমানকারী যুক্ত করে। হিস্টোগ্রামে বা এমনকি কার্নেলের ঘনত্বের প্লটগুলিতে শৃঙ্গগুলি সনাক্তকরণের উপর ভিত্তি করে মোডের আরও প্রচলিত অনুমানগুলি বিনের উত্স বা প্রস্থ বা কার্নেলের ধরণ এবং কার্নেলের অর্ধ-প্রস্থ এবং কোনও অবস্থাতে স্বয়ংক্রিয়ভাবে আরো শক্ত হওয়া সম্পর্কে সিদ্ধান্তের সাথে সংবেদনশীল। যখন আনমোডাল এবং আনুমানিক প্রতিসাম্যযুক্ত বিতরণগুলিতে প্রয়োগ করা হয়, অর্ধ-নমুনা মোডটি গড় এবং মধ্যকের কাছাকাছি থাকবে তবে উভয় পুচ্ছের বহিরাগতদের গড় থেকে বেশি প্রতিরোধী হবে। যখন আনমনোডাল এবং অ্যাসিম্যাট্রিকযুক্ত বিতরণগুলিতে প্রয়োগ করা হয়, তখন অর্ধ-নমুনা মোডটি সাধারণত গড় বা মিডিয়ান উভয়ের চেয়ে অন্য পদ্ধতিগুলির দ্বারা চিহ্নিত মোডের কাছাকাছি হবে।

সরলতা অর্ধ-নমুনা মোডের ধারণাটি এমন শিক্ষার্থী এবং গবেষকদের কাছে ব্যাখ্যা করা মোটামুটি সহজ এবং সহজ যারা নিজেকে পরিসংখ্যান বিশেষজ্ঞ হিসাবে বিবেচনা করেন না।

গ্রাফিক ব্যাখ্যা অর্ধ-নমুনা মোড সহজেই কার্নেল ঘনত্ব প্লট, ক্রমবর্ধমান বিতরণ এবং কোয়ান্টাইল প্লট, হিস্টোগ্রাম এবং স্টেম-এন্ড-লিফ প্লটগুলির মতো বিতরণের স্ট্যান্ডার্ড ডিসপ্লেগুলির সাথে সম্পর্কিত হতে পারে।

একই সাথে, এটি নোট করুন

সমস্ত বিতরণের জন্য কার্যকর নয় যখন প্রায় জ-আকৃতির বিতরণগুলিতে প্রয়োগ করা হয়, অর্ধ-নমুনা মোডটি সর্বনিম্ন ডেটার সর্বনিম্ন। আনুমানিক ইউ-আকারের বিতরণগুলিতে প্রয়োগ করা হলে, অর্ধ-নমুনা মোড বিতরণের অর্ধেকের মধ্যে উচ্চতর ঘনত্বের ক্ষেত্রে ঘটবে। উভয়ই আচরণ বিশেষভাবে আকর্ষণীয় বা কার্যকর বলে মনে হয় না, তবে সমানভাবে জে আকারের বা ইউ-আকারের বিতরণের জন্য একক মোডের মতো সংক্ষিপ্তসারগুলির খুব কম কল নেই। ইউ আকারগুলির জন্য, দ্বিগুণতা অবৈধ না হলে একক মোড মোটের ধারণা তৈরি করে।

টাইস সবচেয়ে কম অর্ধেক স্পষ্ট করে সংজ্ঞায়িত করা যেতে পারে। এমনকি পরিমাপ করা ডেটা সহ, রিপোর্ট করা মানগুলির বৃত্তাকার সাথে ঘন ঘন বন্ধনগুলির উত্থান হতে পারে। দুই বা ততোধিক সংক্ষিপ্ত অর্ধ ভাগ নিয়ে কী করবেন সে সম্পর্কে সাহিত্যে খুব কম আলোচনা হয়েছে। নোট করুন যে বাঁধা অর্ধেকগুলি ওভারল্যাপ হতে পারে বা বিচ্ছিন্ন হতে পারে।

hsmodettt/2

9,4,1,0,1,4,90.501+n/2nn, যা অন্য দেশিদেহের প্রদত্ততা অর্জন করা কঠিন, উল্লেখযোগ্যভাবে নমুনা আকারের সাথে উইন্ডোর দৈর্ঘ্য কখনই হ্রাস করা উচিত নয়। আমরা বিশ্বাস করতে পছন্দ করি যে এটি যুক্তিসঙ্গত আকারের ডেটাসেটের সাথে একটি ছোট সমস্যা।

1+n/2nnn=1,n=2n/2

1.6,3.11,3.95,4.2,4.2,4.62,4.62,4.62,4.7,4.87,5.04,5.29,5.3,5.38,5.38,5.38,5.54,5.54,5.63,5.71,6.13,6.38,6.38,6.67,6.69,6.97,7.22,7.72,7.98,7.98,8.74,8.99,9.27,9.74,10.66.hsmode5.00,5.02,5.04

অ্যান্ড্রুজ, ডিএফ, পিজে বিকেল, এফআর হাম্পেল, পিজে হুবার, ডাব্লুএইচ রজার্স এবং জেডাব্লু টুকি। 1972. অবস্থান সম্পর্কে দৃ ust ় অনুমান: সমীক্ষা এবং অগ্রিম। প্রিন্সটন, এনজে: প্রিন্সটন বিশ্ববিদ্যালয় প্রেস।

বিকেল, ডিআর 2002. মোড এবং অবিচ্ছিন্ন উপাত্তের স্কিউনেসের দৃ Rob় অনুমানকারী। গণনা পরিসংখ্যান এবং ডেটা বিশ্লেষণ 39: 153-163।

বিকেল, ডিআর এবং আর ফ্রিহার্থ। 2006. মোডের একটি দ্রুত, শক্তিশালী অনুমানকারী: অ্যাপ্লিকেশনগুলির সাথে অন্যান্য অনুমানের সাথে তুলনা। গণনা পরিসংখ্যান এবং ডেটা বিশ্লেষণ 50: 3500-3530।

ড্যালেনিয়াস, টি। 1965. মোড - একটি উপেক্ষিত পরিসংখ্যান পরামিতি। জার্নাল, রয়েল স্ট্যাটিস্টিকাল সোসাইটি এ 128: 110-117।

গ্রাবেল, আর। 1988. সংক্ষিপ্ত দৈর্ঘ্য। পরিসংখ্যানগুলির বার্তা 16: 619-628।

হ্যাম্পেল, এফআর 1975 location অবস্থানের পরামিতিগুলি ছাড়িয়ে: দৃust় ধারণা এবং পদ্ধতিগুলি। বুলেটিন, আন্তর্জাতিক পরিসংখ্যান ইনস্টিটিউট 46: 375-382।

মারোনা, আরএ, আরডি মার্টিন এবং ভিজে যোহাই। 2006. শক্তিশালী পরিসংখ্যান: তত্ত্ব এবং পদ্ধতি । চেচেস্টার: জন উইলি।

রবার্টসন, টি। এবং জেডি ক্রিয়ার। 1974. মোডটি অনুমান করার জন্য একটি পুনরাবৃত্তি পদ্ধতি। জার্নাল, আমেরিকান পরিসংখ্যান সমিতি 69: 1012-1016।

রুসিউউ, পিজে 1984. বর্গক্ষেত্রের সংক্ষিপ্ততার মধ্যবর্তীতম ian জার্নাল, আমেরিকান পরিসংখ্যান সমিতি 79: 871-880।

রুসিউউ, পিজে এবং এএম লেরয়। 1987. শক্তিশালী রিগ্রেশন এবং আউটলেট সনাক্তকরণ । নিউ ইয়র্ক: জন উইলি।

এই অ্যাকাউন্টটির জন্য ডকুমেন্টেশনের উপর ভিত্তি করে

কক্সবাজার, এনজে 2007 HSMODE: ক্যালকুলেট অর্ধ নমুনা মোড Stata মডিউল, http://EconPapers.repec.org/RePEc:boc:bocode:s456818

অন্যান্য সফ্টওয়্যার বাস্তবায়ন সম্পর্কিত তথ্যের জন্য এখানে ডেভিড আর। বিকেলের ওয়েবসাইটও দেখুন ।


5

যদি আপনার কোনও ভেক্টর "এক্স" এর বিতরণ থেকে নমুনা থাকে তবে আমি এটি করব:

 mymode <- function(x){
   d<-density(x)
   return(d$x[which(d$y==max(d$y)[1])])
 }

আপনার ঘনত্বের ফাংশন টিউন করা উচিত যাতে এটি শীর্ষে যথেষ্ট মসৃণ হয় ;-)।

যদি আপনার বিতরণের কেবল ঘনত্ব থাকে তবে আমি মোড (আরইএমএল, এলবিএফজিএস, সিমপ্লেক্স, ইত্যাদি) সন্ধানের জন্য একটি অপটিমাইজার ব্যবহার করব ...

 fx <- function(x) {some density equation}
 mode <- optim(inits,fx)

বা বিতরণ (প্যাকেজ আর্স্টান) থেকে কিছু নমুনা পাওয়ার জন্য মন্টে-কার্লো নমুনা ব্যবহার করুন এবং উপরের পদ্ধতিটি ব্যবহার করুন। (যাইহোক, বিতরণের মোড পাওয়ার জন্য স্ট্যান প্যাকেজটি "অনুকূলকরণ" ফাংশন হিসাবে)।


দেখে মনে হচ্ছে এই জাতীয় অনুমানগুলি আর কখনও ব্যবহার করা হয় না। কার্নেলের ঘনত্ব অনুমানকারী ব্যবহার করতে আপনাকে কার্নেলের প্রস্থ নির্দিষ্ট করতে হবে। অন্যদিকে, এইচএসএম এবং এইচআরএমের কোনও সুরের প্রয়োজন নেই এবং রৈখিক সময়ে কাজ করে work
ভিক্টর
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.