উদ্বেগের বিষয়গুলির মধ্যে রয়েছে:
ডেটাসেটের আকার। এটি ক্ষুদ্র নয়, বড় নয়।
আপনি হিস্টোগ্রাম উত্স এবং বিন প্রস্থে যা দেখতে পান তার নির্ভরতা। শুধুমাত্র একটি পছন্দ স্পষ্টতই, আপনার (এবং আমাদের) সংবেদনশীলতার কোনও ধারণা নেই।
আপনি কার্নেলের ধরণ এবং প্রস্থে যা দেখেন তার নির্ভরতা এবং ঘনত্বের অনুমানের জন্য আপনার জন্য অন্য যে কোনও পছন্দগুলি করা হয়। শুধুমাত্র একটি পছন্দ স্পষ্টতই, আপনার (এবং আমাদের) সংবেদনশীলতার কোনও ধারণা নেই।
অন্য কোথাও আমি স্থায়ীভাবে পরামর্শ দিয়েছি যে মোডগুলির বিশ্বাসযোগ্যতা সমর্থনযোগ্য (তবে প্রতিষ্ঠিত নয়) একটি সংক্ষিপ্ত ব্যাখ্যা দ্বারা এবং একই আকারের অন্যান্য ডেটাসেটগুলিতে একই পদ্ধতিটি চিহ্নিত করার ক্ষমতা দ্বারা। (আরও বড় ভাল ....)
আমরা এখানে যারা কারওর উপর মন্তব্য করতে পারি না। পুনরাবৃত্তিযোগ্যতার একটি ছোট হাতল হ'ল আপনি একই আকারের বুটস্ট্র্যাপ নমুনাগুলির সাথে যা পান তা তুলনা করা। স্টাটা ব্যবহার করে টোকেন পরীক্ষার ফলাফল এখানে দেওয়া হয়েছে, তবে আপনি যা দেখছেন তা নির্বিচারে স্টাতার ডিফল্টগুলিতে সীমাবদ্ধ যা এগুলি এয়ার থেকে বেরিয়ে আসা হিসাবে নথিভুক্ত রয়েছে । আমি আসল তথ্য এবং একই থেকে 24 বুটস্ট্র্যাপ নমুনার জন্য ঘনত্বের অনুমান পেয়েছি।
ইঙ্গিতটি (আর কোনও নয়, কম নয়) আমি মনে করি অভিজ্ঞ বিশ্লেষকরা আপনার গ্রাফ থেকে কোনও উপায় অনুমান করতে পারেন। বাম-হাত মোড অত্যন্ত পুনরাবৃত্তিযোগ্য এবং ডান হাত স্পষ্টতই আরও ভঙ্গুর।
নোট করুন যে এটি সম্পর্কে একটি অনিবার্যতা রয়েছে: ডান হাতের মোডের নিকটে যত কম ডাটা রয়েছে তাই এটি বুটস্ট্র্যাপের নমুনায় সর্বদা আবার প্রদর্শিত হবে না। তবে এটিও মূল বিষয়।
উপরে 3 পয়েন্ট নোট করুন। তবে ফলাফলগুলি ইউনিমোডাল এবং বিমোডালের মধ্যে কোথাও।
আগ্রহীদের জন্য, এই কোড:
clear
set scheme s1color
set seed 2803
mat data = (10346, 13698, 13894, 19854, 28066, 26620, 27066, 16658, 9221, 13578, 11483, 10390, 11126, 13487, 15851, 16116, 24102, 30892, 25081, 14067, 10433, 15591, 8639, 10345, 10639, 15796, 14507, 21289, 25444, 26149, 23612, 19671, 12447, 13535, 10667, 11255, 8442, 11546, 15958, 21058, 28088, 23827, 30707, 19653, 12791, 13463, 11465, 12326, 12277, 12769, 18341, 19140, 24590, 28277, 22694, 15489, 11070, 11002, 11579, 9834, 9364, 15128, 15147, 18499, 25134, 32116, 24475, 21952, 10272, 15404, 13079, 10633, 10761, 13714, 16073, 23335, 29822, 26800, 31489, 19780, 12238, 15318, 9646, 11786, 10906, 13056, 17599, 22524, 25057, 28809, 27880, 19912, 12319, 18240, 11934, 10290, 11304, 16092, 15911, 24671, 31081, 27716, 25388, 22665, 10603, 14409, 10736, 9651, 12533, 17546, 16863, 23598, 25867, 31774, 24216, 20448, 12548, 15129, 11687, 11581)
set obs `=colsof(data)'
gen data = data[1,_n]
gen index = .
quietly forval j = 1/24 {
replace index = ceil(120 * runiform())
gen data`j' = data[index]
kdensity data`j' , nograph at(data) gen(xx`j' d`j')
}
kdensity data, nograph at(data) gen(xx d)
local xstuff xtitle(data/1000) xla(10000 "10" 20000 "20" 30000 "30") sort
local ystuff ysc(r(0 .0001)) yla(none) `ystuff'
local i = 1
local colour "orange"
foreach v of var d d? d?? {
line `v' data, lc(`colour') `xstuff' `ystuff' name(g`i', replace)
local colour "gs8"
local G `G' g`i'
local ++i
}
graph combine `G'