একটি 10 ​​ডি এমসিসিএম চেইন দেওয়া, আমি আর এর মধ্যে এর উত্তর মোড (গুলি) কীভাবে নির্ধারণ করতে পারি?


10

প্রশ্ন: একটি 10 ​​টি মাত্রিক এমসিএমসি চেইনের সাথে, আমি বলি যে আমি আপনাকে অঙ্কনের একটি ম্যাট্রিক্স দেওয়ার জন্য প্রস্তুত: 10,000 পরামিতি (কলাম) দ্বারা 100,000 পুনরাবৃত্তি (সারি), আমি উত্তরের দিকগুলি কীভাবে চিহ্নিত করতে পারি? আমি বিশেষত একাধিক মোড নিয়ে উদ্বিগ্ন।

পটভূমি:আমি নিজেকে একটি গণনামূলকভাবে বুদ্ধিমান পরিসংখ্যানবিদ হিসাবে বিবেচনা করি, কিন্তু যখন কোনও সহকর্মী আমাকে এই প্রশ্ন জিজ্ঞাসা করেছিলেন, তখন আমি লজ্জা পেয়েছিলাম যে আমি যুক্তিসঙ্গত উত্তর নিয়ে আসতে পারিনি। প্রাথমিক উদ্বেগটি হ'ল একাধিক মোড উপস্থিত হতে পারে তবে কেবলমাত্র দশটি মাত্রার কমপক্ষে আট বা তার বেশি বিবেচনা করা হয়। আমার প্রথম চিন্তাটি ছিল কার্নেলের ঘনত্বের প্রাক্কলনটি ব্যবহার করা, তবে আর-এর মাধ্যমে অনুসন্ধানে তিনটি মাত্রার বেশি সমস্যা হওয়ার আশ্বাসপ্রাপ্ত কিছুই প্রকাশিত হয়নি। সহকর্মী দশ মাত্রা এবং একটি সর্বাধিক সন্ধানে একটি অ্যাড-হক বিনিং কৌশল প্রস্তাব করেছে, তবে আমার উদ্বেগ হ'ল ব্যান্ডউইদথ হয় তাত্পর্যপূর্ণ স্পারসিটি সমস্যা বা একাধিক পদ্ধতি চিহ্নিত করার জন্য রেজোলিউশনের অভাবে হতে পারে। এটি বলেছিল, আমি আনন্দের সাথে স্বয়ংক্রিয় ব্যান্ডউইথ পরামর্শগুলির জন্য পরামর্শগুলি, 10 কার্নেল ঘনত্বের প্রাক্কলনকারীর লিঙ্কগুলি বা অন্য যে কোনও কিছু সম্পর্কে আপনি জানুন accept

উদ্বেগ:

  1. আমরা বিশ্বাস করি যে বিতরণটি যথেষ্ট পরিমাণে স্কিউড হতে পারে; অতএব, আমরা উত্তরোত্তর উপায়গুলি নয়, তবে পূর্ববর্তী মোডগুলি সনাক্ত করতে চাই।

  2. আমরা উদ্বিগ্ন যে এখানে বেশ কয়েকটি পোস্টারিয়র মোড থাকতে পারে।

  3. যদি সম্ভব হয় তবে আমরা একটি আর ভিত্তিক পরামর্শ পছন্দ করব। তবে যে কোনও অ্যালগরিদম ততক্ষণ কাজ করবে যতক্ষণ না এটি বাস্তবায়ন করা অবিশ্বাস্যরকম কঠিন না। আমি অনুমান করি যে আমি স্ক্র্যাচ থেকে স্বয়ংক্রিয় ব্যান্ডউইথ নির্বাচন সহ একটি এনডি কার্নেল ঘনত্বের অনুমানকারীকে প্রয়োগ না করাকে পছন্দ করব prefer


দয়া করে দ্রুত মোডের প্রাক্কলন পদ্ধতিতে থিমটি দেখুন stats.stackexchange.com/questions/33625
পাভেল রুজানকিন

উত্তর:


9

আপনি কি নিকটতম প্রতিবেশী পদ্ধতির ব্যবহার বিবেচনা করেছেন?

উদাহরণস্বরূপ k, 100'000 পয়েন্টের প্রতিটি জন্য নিকটতম প্রতিবেশীদের একটি তালিকা তৈরি করুন এবং তারপরে kthপ্রতিবেশীর ক্ষুদ্রতম দূরত্বের সাথে একটি মোডে ডেটা পয়েন্টটি বিবেচনা করুন। অন্য কথায়: kএই বিন্দুর চারপাশে অন্যান্য বিন্দু সমন্বিত 'ক্ষুদ্রতম বুদ্বুদ' দিয়ে পয়েন্টটি সন্ধান করুন।

আমি নিশ্চিত না যে এটি কতটা শক্তিশালী এবং এর জন্য পছন্দটি kফলাফলগুলিতে স্পষ্টতই প্রভাবিত করছে।


কখনও কখনও আমি নিজেকে মাথা উল্টে দিতে চাই। দুর্দান্ত পরামর্শ।
এম টিবিটস

1
আমি কেবল kmeansআর-তে ফাংশনটি ব্যবহার করার কথা ভেবেছিলাম really আমার মধ্যরাত থেকে ভোর ৪ টার মধ্যে সত্যই প্রশ্ন করা উচিত নয়।
এম টিবিটস

4

এটি কেবল একটি আংশিক উত্তর।

আমি সম্প্রতি বহুমাত্রিক কার্নেল ঘনত্বের অনুমানের জন্য ডুমুর গাছ ব্যবহার করেছি। এটি একটি সি প্যাকেজ এবং আমি এটি মোটামুটি সহজে কাজ করতে পেলাম। তবে আমি কেবল এটি নির্দিষ্ট পয়েন্টগুলিতে ঘনত্ব অনুমান করার জন্য ব্যবহার করেছি, সারাংশের পরিসংখ্যান গণনা করি না।


3

আপনি যদি লগের সম্ভাবনা রাখেন তবে আপনি সর্বাধিক মান সহ একটি নির্বাচন করতে পারেন। এছাড়াও, যদি আপনার আগ্রহটি প্রাথমিকভাবে মোড হয় তবে সর্বাধিক লগের সম্ভাবনা রয়েছে এমন পয়েন্টটি সন্ধান করার জন্য একটি অপ্টিমাইজেশন করা যথেষ্ট হবে।


এটি সবচেয়ে প্রাসঙ্গিক উত্তর, কমপক্ষে প্রথম অংশ! অনেক MCMC সিমুলেশনগুলিতে, (লগ-) সম্ভাবনাগুলি সমস্ত প্রস্তাবগুলির জন্য গণনা করা হয় এবং এভাবে সংরক্ষণ করা যায়। বা এ পর্যন্ত সর্বোচ্চ মান এবং এটির যুক্তি সংরক্ষণ করা যেতে পারে। শর্ত থাকে যে এমসিএমসি অ্যালগরিদম আপনি যে পরিমাণ সিমুলেশন চালিয়ে গেছেন তার উপর রূপান্তর করেছে, এটি একটি বৈধ পন্থা।
শি'য়ান

2

আপনি কি 'PRIM / গাঁজা শিকার' বিবেচনা করেছেন? (উদাহরণস্বরূপ, তিবশিরানী ইত্যাদি দ্বারা 'পরিসংখ্যান শিক্ষার উপাদানগুলির' বিভাগ 9.3 দেখুন your অথবা আপনার প্রিয় অনুসন্ধান ইঞ্জিনটি জিজ্ঞাসা করুন)। এটি আর-তে কার্যকর হয়েছে কিনা তা নিশ্চিত নয়।

[যতদূর আমি বুঝতে পেরেছি আপনি যে সম্ভাবনা ঘনত্ব থেকে আপনার 100'000 সারি আঁকছেন তার মোড সন্ধান করার চেষ্টা করছেন। সুতরাং আপনার সমস্যাটি একটি উপযুক্ত density estimationপদ্ধতি অনুসন্ধান করে আংশিক সমাধান করা হবে ]।


হ্যাঁ, একটি প্রাইম প্যাকেজ রয়েছে, যার সাথে একটি আর ভিগিনেট রয়েছে: টুপি শিকারের জন্য প্রাইম ব্যবহার করা । যদিও এটি এই ক্ষেত্রে এটি কাজ করবে তা আমার কাছে স্পষ্ট নয়।
CHL
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.