ক্লাস্টার ডেটা জন্য সঠিক বুটস্ট্র্যাপিং কৌশল?


16

শক্তিশালী ক্লাস্টারিং উপস্থিত রয়েছে এমন ডেটা সহ ব্যবহার করার জন্য আমার সঠিক বুটস্ট্র্যাপিং কৌশল সম্পর্কিত একটি প্রশ্ন রয়েছে।

আমাকে আরও সাম্প্রতিক দাবির তথ্যগুলির উপর ভিত্তি করে বর্তমান বেসলাইন মডেলটি স্কোর করে বিমা দাবিগুলির ডেটা সম্পর্কিত একটি মাল্টিভিয়ারেট মিশ্রিত প্রভাবগুলির ভবিষ্যদ্বাণীপূর্ণ মডেলকে মূল্যায়নের দায়িত্ব অর্পণ করা হয়েছে, যাতে মডেলটি কতটা ভালভাবে ভবিষ্যদ্বাণী করে যে যত্নের পর্বগুলি সেশনের সর্বাধিক ফ্রিকোয়েন্সি রয়েছে upper 95 তম পার্সেন্টাইল)। সংবেদনশীলতা, সুনির্দিষ্টতা এবং ইতিবাচক ভবিষ্যদ্বাণীমূলক মান (পিপিভি) মডেলের কার্যকারিতা মূল্যায়নের জন্য ব্যবহার করা হবে।

সংবেদনশীলতা, সুনির্দিষ্টতা এবং পিপিভি শতাংশের জন্য আত্মবিশ্বাসের ব্যবধান তৈরির জন্য বুটস্ট্র্যাপিং সঠিক উপায় বলে মনে হচ্ছে। দুর্ভাগ্যক্রমে, একটি নিষ্পাপ বুটস্ট্র্যাপ যথাযথ নয় যে দাবির তথ্য 1) যত্ন প্রদানকারী দ্বারা সংযুক্ত, ২) যত্নের পর্বে কয়েক মাস আগে ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন দেখাশোনা সহ যত্নের পর্বগুলিতে দলবদ্ধ করা হয়েছে (তাই কিছু স্বতঃসংশ্লিষ্ট উপস্থিত রয়েছে)। চলন্ত ব্লকগুলি বুটস্ট্র্যাপ কৌশলটিতে কোনও বৈকল্পিকতা এখানে কি উপযুক্ত হবে?

অথবা সম্ভবত একটি তিন-পদক্ষেপের বুটস্ট্র্যাপ পদ্ধতিটি কাজ করবে: 1) ডেটাতে স্বতন্ত্র সরবরাহকারীদের সাথে প্রতিস্থাপনের নমুনা, তারপরে 2) নির্বাচিত সরবরাহকারীগণ দ্বারা যত্নের পৃথক পর্বগুলি থেকে প্রতিস্থাপনের নমুনা, তারপরে 3) প্রত্যেকটির মধ্যে স্বতন্ত্র দাবিগুলির প্রতিস্থাপনের সাথে নমুনা sample নির্বাচিত পর্ব

কোন পরামর্শ জন্য অনেক ধন্যবাদ!

উত্তর:


14

আপনি যে দ্বিতীয় পদ্ধতির পরামর্শ দিচ্ছেন তা যুক্তিসঙ্গত বলে মনে হচ্ছে তবে এটি দেখা যাচ্ছে যে উচ্চ স্তরের প্রতিস্থাপনের সাথে কেবল নমুনা দেওয়া ভাল, এবং স্তরবিন্যাসের ডেটা বুটস্ট্র্যাপ করার সময় অবশিষ্ট সাবলেভিলগুলিতে প্রতিস্থাপন ছাড়াই ভাল। এটি রেন এট আল (2010) এর অনুকরণগুলি থেকে দেখানো হয়েছে: http://www.tandfonline.com/doi/abs/10.1080/02664760903046102

ফিল্ড অ্যান্ড ওয়েলশ (২০০)) 2-স্তরের ডেটা সেটগুলির জন্য তাত্ত্বিকভাবে বিভিন্ন পদ্ধতির তদন্ত করেছে এবং দেখা গেছে যে উভয় স্তরে প্রতিস্থাপনের সাথে নমুনা নেওয়া একটি উজ্জ্বল ধারণা নয়।
http://onlinelibrary.wiley.com/doi/10.1111/j.1467-9868.2007.00593.x/full

আপনি যে স্বতঃসংশোধন উল্লেখ করেছেন তা একটি গুরুতর সমস্যা। অন্যদিকে, যত্নের পর্বগুলি থেকে প্রতিস্থাপন ছাড়াই বাছাই করা অটোকোররিলেশন কাঠামো সংরক্ষণ করবে তাই সম্ভবত এটি এত বড় সমস্যা নয়।


নীচের সমাধানটি উপযুক্ত কিনা আমি ভাবছি:
রাফেল

... দুঃখিত আমি আমার আগের মন্তব্যটি শেষ করতে পারিনি। এটি এখানে: ... এমন একটি কোড তৈরি করুন (আইডি) যা প্রতিটি ক্লাস্টারিং স্তরকে বিবেচনা করে (যেমন এপিসয়েড1.ক্লেইম 1, এপিসয়েড1.ক্লেইম 1, ..., এপিসয়েড ২.ক্লেইম 1, এপিসয়েড ২.ক্লেইম 2, ..., এপিসয়েডন.ক্ল্যাম্প) , এবং তারপরে জিইই ব্যবহার করুন যা আপনাকে স্বতঃসংশ্লিষ্টকরণের সাথে মোকাবিলা করার অনুমতি দেয়। আমি কোথাও পড়েছি যে জিইই মডেলগুলি ক্লাস্টিয়র স্ট্রাকচারের উপস্থিতিতেও মজবুত অনুমান দেয়। এই সমাধানটি কি যুক্তিসঙ্গত মনে হচ্ছে?
রাফেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.