আমি বুঝতে পারি যে একবার যখন আমরা মানগুলি একটি চার্ট হিসাবে প্লট করি, আমরা দ্বিগুণ শৃঙ্গগুলি পর্যবেক্ষণ করে দ্বিপদ বন্টন শনাক্ত করতে পারি, তবে কীভাবে প্রোগ্রামটিকে এটি আবিষ্কার করা যায়? (আমি একটি অ্যালগরিদম খুঁজছি।)
আমি বুঝতে পারি যে একবার যখন আমরা মানগুলি একটি চার্ট হিসাবে প্লট করি, আমরা দ্বিগুণ শৃঙ্গগুলি পর্যবেক্ষণ করে দ্বিপদ বন্টন শনাক্ত করতে পারি, তবে কীভাবে প্রোগ্রামটিকে এটি আবিষ্কার করা যায়? (আমি একটি অ্যালগরিদম খুঁজছি।)
উত্তর:
অবিচ্ছিন্ন বিতরণের জন্য একটি মোড সনাক্তকরণের জন্য ডেটা মসৃণ করা বা বেন করা দরকার।
বিনিং সাধারণত খুব বেশি পরিমাণে হয়: ফলাফলগুলি আপনি যেখানে বিন কাটপয়েন্টগুলি রাখেন তার উপর নির্ভর করে।
কার্নেল স্মুথিং (বিশেষত, কার্নেলের ঘনত্বের অনুমানের আকারে) একটি ভাল পছন্দ। যদিও অনেকগুলি কার্নেল আকার সম্ভব, সাধারণত ফলাফল আকৃতির উপর খুব বেশি নির্ভর করে না। এটি কার্নেল ব্যান্ডউইথের উপর নির্ভর করে। সুতরাং, লোকেরা হয় একটি অভিযোজিত কার্নেল মসৃণ ব্যবহার করেবা চিহ্নিত করা মোডের স্থায়িত্ব পরীক্ষা করতে বিভিন্ন স্থির ব্যান্ডউইথের জন্য কার্নেল মসৃণগুলির ক্রম পরিচালনা করে। যদিও একটি অভিযোজিত বা "অনুকূল" স্মুথ ব্যবহারটি আকর্ষণীয়, তবুও জেনে থাকুন যে এগুলির বেশিরভাগ (সমস্ত?) নির্ভুলতা এবং গড় যথার্থতার মধ্যে ভারসাম্য অর্জনের জন্য ডিজাইন করা হয়েছে: এগুলি মোডের অবস্থানের অনুমানের অনুকূলিতকরণের জন্য ডিজাইন করা হয়নি।
বাস্তবায়ন যতদূর যায়, কার্নেল স্মুথাররা স্থানীয়ভাবে স্থানান্তরিত করে এবং ডেটা ফিট করার জন্য একটি পূর্বনির্ধারিত ফাংশন স্কেল করে। প্রদত্ত যে এই বুনিয়াদি কাজটি পার্থক্যযোগ্য - গৌসিয়ানরা একটি ভাল পছন্দ কারণ আপনি যতটা পছন্দ তার চেয়ে বহুগুণ আলাদা করতে পারেন - তবে আপনাকে যা করতে হবে তা মসৃণটির ডেরাইভেটিভ অর্জনের জন্য এটির ডেরাইভেটিভ দ্বারা প্রতিস্থাপন করতে হবে। তারপরে এটি গুরুতর বিষয়গুলি সনাক্ত এবং পরীক্ষার জন্য সাধারণ শূন্য-অনুসন্ধান পদ্ধতি প্রয়োগ করার বিষয়টি। ( ব্রেন্টের পদ্ধতিটি ভালভাবে কাজ করে)) কোনও সমালোচনামূলক বিন্দু স্থানীয় সর্বাধিক - অর্থাত্ একটি মোড কিনা তাড়াতাড়ি পরীক্ষা নেওয়ার জন্য অবশ্যই আপনি দ্বিতীয় কৌশল থেকে একই কৌশল করতে পারেন।
সিলভারম্যানের একটি সুপরিচিত কাগজ রয়েছে যা এই সমস্যাটি নিয়ে কাজ করে। এটি কার্নেল-ঘনত্বের প্রাক্কলন নিয়োগ করে। দেখা
বিডাব্লু সিলভারম্যান, বহু-আধুনিকতা তদন্ত করতে কার্নেল ঘনত্বের প্রাক্কলন ব্যবহার করে , জে। রয়েল স্ট্যাট। SOC। বি , খণ্ড 43, না। 1, 1981, পৃষ্ঠা 97-99।
দ্রষ্টব্য যে কাগজের সারণিতে কিছু ত্রুটি রয়েছে। এটি কেবল একটি সূচনা পয়েন্ট, তবে বেশ ভাল একটি। আপনি সর্বাধিক সন্ধান করছেন এমন ইভেন্টে এটি ব্যবহারের জন্য একটি সু-সংজ্ঞায়িত অ্যালগরিদম সরবরাহ করে। আপনি গুগল স্কলারকে কাগজপত্রগুলিতে দেখতে পাবেন যা এটি আরও "আধুনিক" পদ্ধতির জন্য উদ্ধৃত করে।
আমি পার্টিতে দেরিতে এসেছি, তবে আপনি যদি এটি মাল্টিমোডাল কিনা তা নিয়ে আগ্রহী হন, যার অর্থ আপনি মোডের সংখ্যার প্রতি আগ্রহী নন, আপনার ডিপটেস্টের দিকে নজর দেওয়া উচিত ।
ইন R
প্যাকেজ বলা হয় diptest
।
উইকের সংজ্ঞাটি আমার কাছে কিছুটা বিভ্রান্তিকর। একটি মাত্র মোড থাকা ক্রমাগত ডেটা সেট হওয়ার সম্ভাবনা শূন্য। বিমোডাল ডিস্ট্রবিটনকে প্রোগ্রাম করার একটি সহজ উপায় হ'ল পৃথকভাবে কেন্দ্রিক দুটি পৃথক সাধারণ বিতরণ। এটি দুটি শিখর তৈরি করে বা উইকি কে মোডগুলি কল করে। আপনি আসলে প্রায় কোনও দুটি বিতরণ ব্যবহার করতে পারেন, তবে দুটি পরিসংখ্যক ডেটা বিতরণের সংমিশ্রণের পরে ডেটা সেট কীভাবে তৈরি হয়েছিল তা সন্ধান করার জন্য একটি কঠিন পরিসংখ্যানগত সুযোগগুলির একটি।