র্যানস্যাক পরিসংখ্যানগুলিতে কেন বহুল ব্যবহৃত হয় না?


26

কম্পিউটার দর্শনের ক্ষেত্র থেকে আগত, আমি প্রায়শই প্রচুর বিদেশিদের সাথে ডেটাতে মডেলগুলি ফিটিংয়ের জন্য রানস্যাক (র্যান্ডম নমুনা সম্মতি) পদ্ধতিটি ব্যবহার করেছি।

যাইহোক, আমি এটি পরিসংখ্যানবিদদের দ্বারা ব্যবহৃত কখনও দেখিনি, এবং আমি সর্বদা এই ধারণাটির মধ্যে ছিলাম যে এটি একটি "পরিসংখ্যানগতভাবে কার্যকর" পদ্ধতি হিসাবে বিবেচিত হয় না। কেন যে এত? এটি প্রকৃতির এলোমেলো, যা বিশ্লেষণ করা আরও শক্ত করে তোলে তবে বুটস্ট্র্যাপিং পদ্ধতিও এটি।

বা কেবল একাডেমিক সিলোসের ক্ষেত্রে একে অপরের সাথে কথা বলার নয়?


1
আমি কম্পিউটার ভিশন পদ্ধতি বনাম পরিসংখ্যান পদ্ধতি সম্পর্কে একটি বিষয় অবাক করে দিচ্ছি: প্রথমটিতে পারফরম্যান্স করা আবশ্যক। পারফরম্যান্স এবং "নির্ভুলতা" এর মধ্যে একটি বাণিজ্য বন্ধ রয়েছে এবং কম্পিউটার ভিশন এবং পরিসংখ্যানগুলির সেই পরিবর্তনশীলগুলির জন্য আলাদা ওজন রয়েছে।
লুকাস রেইস

উত্তর:


10

আমি মনে করি যে এখানে কীটি হ'ল আরএনএসএসি-তে ডেটার একটি বৃহত অংশ বাদ দেওয়া।

বেশিরভাগ পরিসংখ্যানমূলক অ্যাপ্লিকেশনগুলিতে কিছু বিতরণে ভারী লেজ থাকতে পারে এবং তাই ছোট নমুনা সংখ্যার পরিসংখ্যানগত অনুমানের পরিমাণ কমিয়ে দিতে পারে। দৃ estima় অনুমানকারীরা ডেটা আলাদাভাবে ওজন করে এটি সমাধান করে। অন্যদিকে আরএনএসএসি বিদেশিদের সামঞ্জস্য করার কোনও প্রচেষ্টা করে না, এটি এমন ক্ষেত্রে তৈরি করা হয়েছে যেখানে ডেটা পয়েন্টগুলি সত্যিকারের নয়, কেবলমাত্র নন-সাধারণভাবে বিতরণ করা হয়নি।


1
দুর্দান্ত উত্তর। হোমোগ্রাফির অনুমানের জন্য আমি সিএনভিতে আরএনএসএসি সর্বাধিক ব্যবহৃত দেখেছি। এটি সর্বাধিক ব্যবহৃত হয় যখন আমরা জানি যে সংশ্লিষ্ট কিছু পরিমাপ অত্যন্ত অবিশ্বাস্য। এছাড়াও, রিয়েল টাইম পারফরম্যান্স এবং অন্যান্য বিবেচ্য বিষয়গুলি এই প্রযুক্তিটি বেশ জনপ্রিয় করে তুলেছে কারণ এটি সহজেই সমান্তরাল হতে পারে।
লুকা

7

আমাদের জন্য, এটি একটি শক্তিশালী রিগ্রেশনের একটি উদাহরণ - আমি বিশ্বাস করি এটি পরিসংখ্যানবিদরাও ব্যবহার করেন তবে এটি এত প্রশস্ত নয় কারণ এর আরও কিছু ভাল বিকল্প রয়েছে has


1
আপনি বিকল্প উদাহরণ দিতে পারেন? আমি এটি সন্ধান করতে চাই
Bossykena

5
সর্বাধিক পরিচিত এবং সহজতমটি হ'ল মিডিয়ান-মিডিয়ান রিগ্রেশন, স্মার্ট ক্যালকুলেটরগুলি (দীর্ঘশ্বাস!) থেকে সুপরিচিত। এছাড়াও পরামর্শ উইকিপিডিয়া en.wikipedia.org/wiki/Robust_regression এবং হয়ত Cran এর শক্তসমর্থ কাজের দৃশ্য cran.r-project.org/web/views/Robust.html

আরএনএসএসি-এর এমন কোনও বিকল্প রয়েছে যা কেবল আপনাকে নিরপেক্ষ প্রতিক্রিয়াই দেয় না এমন উপাত্ত পয়েন্টগুলিও যেখান থেকে মডেলটি অনুমান করা হয়েছে? ধন্যবাদ
ভ্যালারিও

2

এটি অনেকটা ব্যাগিংয়ের মতো লাগে যা প্রায়শই ব্যবহৃত কৌশল।


3
আরএনএসএসি খুব আলাদা - ব্যাগিংয়ে সমস্ত নমুনা কোনওভাবে বিবেচনায় নেওয়া হয়। আরএনএসএসি এমন ক্ষেত্রে ব্যবহৃত হয় যেখানে 50% পর্যন্ত ডেটা সম্পূর্ণ বাতিল করা উচিত।
nbubis

1

আপনি আরএনএসএসি দিয়ে ডেটা দূরে ফেলেন, সম্ভাব্যভাবে এটি ন্যায়সঙ্গত না করে, তবে মডেলের ফিট বাড়ানোর উপর ভিত্তি করে। বর্ধিত ফিটের জন্য ডেটা ছুঁড়ে ফেলা সাধারণত এড়ানো যায় কারণ আপনি গুরুত্বপূর্ণ ডেটা আলগা করতে পারেন। ন্যায়সঙ্গততা ছাড়াই বিদেশী অপসারণ সর্বদা সমস্যাযুক্ত।

এটি ন্যায্য প্রমাণ করা অবশ্যই সম্ভব। উদাহরণস্বরূপ, যদি আপনি জানতেন যে ডেটা একটি প্রদত্ত প্যাটার্ন অনুসরণ করবে তবে পরিমাপের ত্রুটির কারণে প্যাটার্ন থেকে ডেটাতে বিচ্যুতিও রয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.