কার্নেল ব্যান্ডউইথ: স্কট এর বনাম সিলভারম্যানের বিধি


14

ব্যান্ডউইথ নির্বাচনের জন্য স্কট এবং সিলভারম্যানের থাম্বের নিয়মের মধ্যে পার্থক্য কী কী সহজ সরল ইংরেজিতে ব্যাখ্যা করতে পারবেন? বিশেষত, যখন অন্য একজনের চেয়ে ভাল হয়? এটি অন্তর্নিহিত বিতরণ সম্পর্কিত? নমুনার সংখ্যা?

পিএস আমি সায়পাই-তে কোড উল্লেখ করছি ।


1
আমি অজগরটিও জানতে চাই না। আমি কখন কোন নিয়মটি ব্যবহার করব এবং কেন তা বুঝতে সাহায্য চাই।
xrfang

উত্তর:


11

কোডটিতে দেওয়া মন্তব্যগুলি দুটিরূপে মূলত অভিন্নরূপে সংজ্ঞায়িত করা শেষ বলে মনে হচ্ছে (ধ্রুবকের তুলনায় অপেক্ষাকৃত ছোট পার্থক্যকে বাদ দিয়ে)।

cAn1/5Ac

3.49sn1/3nclass.scott

কোডটি "স্কট এস্টিমেট" বলে তার যে 1.059 কোডটি সিলভারম্যানের (পূর্ববর্তী) বইয়ে রয়েছে (আপনার লিঙ্কে সিলভারম্যান রেফারেন্সের p45 দেখুন - স্কট এর এটি প্রাপ্তি তারা উল্লিখিত বইয়ের p130-131 এ রয়েছে)। এটি একটি সাধারণ-তত্ত্বের অনুমান থেকে আসে।

1.059σ

Aσ

আমি এর আগে যেমন পরামর্শ দিয়েছিলাম তাদের অনুরূপ কারণে, সিলভারম্যান 1.059 হ্রাস করার পরামর্শ দেয় (বাস্তবে তিনি 1.05 ব্যবহার করে না আসলে - 1.06 ব্যবহার করেন - যেমনটি স্কট তাঁর বইয়ে করেছেন)। তিনি একটি হ্রাসকৃত মানটি বেছে নেন যা আইএমএসইতে সাধারণভাবে 10% এর বেশি দক্ষতা হারায় না, যেখানে 0.9 আসে।

সুতরাং এই উভয় দ্বিবিধগুলি স্বাভাবিকের আইএমএসই-সর্বোত্তম দ্বিবিধের উপর ভিত্তি করে তৈরি করা হয়, একদম ডানটি সর্বোত্তম, অন্যটি (প্রায় 15% ছোট, সাধারণের সর্বোত্তম কার্যকারিতার 90% এর মধ্যে পাওয়ার জন্য)। [আমি দু'জনকেই "সিলভারম্যান" অনুমান হিসাবে কল করতাম । তারা স্কটটির জন্য 1.059 টির নাম কেন রাখে সে সম্পর্কে আমার কোনও ধারণা নেই]

আমার মতে, উভয়ই অনেক বড়। ঘনত্বের আইএমএসই-অনুকূল অনুমানের জন্য আমি হিস্টোগ্রামগুলি ব্যবহার করি না। যদি এটি (আইএমএসই অর্থে যে ঘনত্বের অনুকূলতা অর্জন করে) আমি যা করতে চাইতাম তবে আমি সেই উদ্দেশ্যে হিস্টোগ্রাম ব্যবহার করতে চাই না।

হিস্টোগ্রামগুলি শোরগোলের দিকে ভুল করা উচিত (চোখটি প্রয়োজনীয় মসৃণকরণটি করতে দিন)। আমি প্রায় সবসময় এই ধরণের বিধি দেয়াইয়ের ডিফল্ট সংখ্যার দ্বিগুণ (বা আরও)। সুতরাং আমি 1.06 বা 0.9 ব্যবহার করব না, আমি 0.5 এর কাছাকাছি কিছু ব্যবহার করতে চাইতাম, সম্ভবত বড় আকারের নমুনার আকারে কম।

তাদের মধ্যে বেছে নেওয়ার পক্ষে খুব সামান্যই আছে, যেহেতু তারা উভয়ই ডেটাতে যা চলছে তার সন্ধানে খুব কম ব্যবহার করতে খুব কম বিন্দু দেয় (যার উপর, কমপক্ষে ছোট্ট নমুনার আকারগুলি এখানে দেখুন)

[1]: স্কট, ডিডাব্লু (1979), "অনুকূল এবং ডেটা-ভিত্তিক হিস্টোগ্রামগুলিতে," বায়োমেট্রিকা , 66 , 605-610।


এখানে সায়পাই ডকুমেন্ট অনুসারে স্কট নিয়মটি হ'ল: n ** (- 1./(d+4))। কোডটি দেখে আমি দেখতে পেলাম যে আমি "স্কটস_ফ্যাক্টর" এর মতোই নিয়মটি ভুল বুঝেছি। আপনি ঠিক বলেছেন যে ব্যান্ডউইথ খুব বেশি বড়। আমি সংখ্যাগত ব্যান্ডউইথ নির্বাচন সম্পর্কে একটি নতুন প্রশ্ন খুলব। ধন্যবাদ।
xrfang

d=1n1/5Ac

@ গ্লেন_বি-রিইনস্টেটমোনিকা আপনি যে প্রশ্নটি এখানে পোস্ট করেছেন তা একবার দেখতে পারেন ? আমি যখন বড় আকারের নমুনা আকার ব্যবহার করি তখন সিলভারম্যানের নিয়মটিতে যে সমস্যাগুলি দেখা দিতে পারে সেগুলি আমি প্রদর্শন করি। বিস্তারিত কী চলছে তা আপনি উত্তর দিতে পারেন?
user269666
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.