বর্ণনামূলকভাবে বলতে গেলে, আমি প্রস্তাব দেব "যদি কোনও তথ্যের নমুনা সেন্সর করা হয় তবে এতে যদি কিছু পর্যবেক্ষণ গ্রহণ করা হয় বা গঠন করা হয়, তবে নমুনার চূড়ান্ত মানগুলি কিন্তু তাদের আসল মান পর্যবেক্ষণকৃত নমুনা সীমার বাইরে"। তবে এটি প্রতারণামূলকভাবে সোজাসাপ্টা।
সুতরাং আসুন প্রথমে আলোচনা করা যাক আমরা কীভাবে উপসংহারে পৌঁছাতে পারি যে একটি ডেটা সেট সেন্সর করা হয়েছে, যা প্রাকৃতিকভাবে আমাদেরকে প্রশ্নে উপস্থাপিত মামলাগুলি নিয়ে আলোচনা করতে পরিচালিত করবে।
ধরুন আমাদের একটি পৃথক র্যান্ডম ভেরিয়েবল থেকে নিম্নলিখিত ডেটা সেট দেওয়া হয়েছে , যার জন্য আমরা কেবলমাত্র জানি এটি অ-নেতিবাচক:X
{0,1,1,2,2,2,2,2,2,2}
আমরা কি বলতে পারি যে ডেটা সেটটি সেন্সর করা হয়েছে? ঠিক আছে, আমরা এটি ভাবার অধিকারী যে এটি হতে পারে তবে এটি অগত্যা নয়:
1) এর ব্যাপ্তি { 0 , 1 , 2 } এবং সম্ভাব্যতা বিতরণ {X{0,1,2} । যদি প্রকৃতপক্ষে এটি হয় তবে এটি প্রদর্শিত হবে যে এখানে কোনও সেন্সরিং নেই, সীমাবদ্ধ সমর্থন এবং অত্যন্ত অসম্পূর্ণ বিতরণ সহ এ জাতীয় এলোমেলো পরিবর্তনীয় থেকে একটি "প্রত্যাশিত" নমুনা। {0.1,0.1,0.8}
2) কিন্তু এটা ক্ষেত্রে যে হতে পারে পরিসর আছে { 0 , 1 , । । । , 9 } অভিন্ন সম্ভাব্যতা বিতরণের সঙ্গে { 0.1 , 0.1 , । । .0 .1 } , এক্ষেত্রে আমাদের ডেটা নমুনা সম্ভবত সেন্সর করা। X{0,1,...,9}{0.1,0.1,...0.1}
আমরা কীভাবে বলতে পারি? আমরা পূর্বের জ্ঞান বা তথ্য রাখি তা বাদ দিয়ে আমরা তা করতে পারি না, যা আমাদের এক বা অন্য মামলার পক্ষে তর্ক করার অনুমতি দেবে। প্রশ্নে উপস্থাপিত তিনটি মামলা কি সেন্সরিংয়ের প্রভাবের পূর্ব জ্ঞানকে উপস্থাপন করে? দেখা যাক:
কেস এ) এমন পরিস্থিতি বর্ণনা করে যেখানে কিছু পর্যবেক্ষণের জন্য আমাদের কাছে কেবল "খুব বড়", "খুব ছোট" ইত্যাদির মতো গুণগত তথ্য থাকে যা আমাদের পর্যবেক্ষণকে একটি চূড়ান্ত মান নির্ধারণ করতে পরিচালিত করে। মনে রাখবেন যে প্রকৃত উপলব্ধিমান মানটি না জেনে চরম মান নির্ধারণকে ন্যায়সঙ্গত করে না। সুতরাং আমাদের অবশ্যই এই প্রভাবের জন্য কিছু তথ্য থাকতে হবে যে এই পর্যবেক্ষণগুলির জন্য, তাদের মান সমস্ত পর্যবেক্ষণের চেয়ে বেশি বা তার চেয়ে কম। এই ক্ষেত্রে, এলোমেলো ভেরিয়েবলের আসল পরিসর অজানা, তবে আমাদের গুণগত তথ্য আমাদের সেন্সর করা নমুনা তৈরি করার অনুমতি দেয় (এটি কেন আমরা কেবল যে পর্যবেক্ষণগুলিতে সত্যিকারের উপলব্ধি মূল্য রাখি না তা কেন বাদ দেই না তা নিয়েই এটি অন্য আলোচনা is )।
কেস বি) হয় না , সেন্সর একটি মামলা যদি আমি এটি সঠিকভাবে বুঝতে, বরং দূষিত নমুনা একটি মামলা: আমাদের অবরোহমার্গী তথ্য আমাদের বলে যে এলোপাতাড়ি ভেরিয়েবলের সর্বোচ্চ মান অতিক্রম করতে পারে না (ক শারীরিক আইন বা কারণে বলে সামাজিক আইন অনুসারে এটি গ্রেডিং সিস্টেমের গ্রেড ডেটা যা কেবলমাত্র 1 , 2 , 3 এর মান ব্যবহার করে ) u তবে আমরা মান 4 এবং মান 5 ও পর্যবেক্ষণ করেছি । এটা কিভাবে হতে পারে? তথ্য রেকর্ডিংয়ে ভুল। তবে এই জাতীয় ক্ষেত্রে আমরা নিশ্চিতভাবে জানি না যে 431,2,3454 এর এবং এর সমস্ত 3 হওয়া উচিত53এর (প্রকৃতপক্ষে, কম্পিউটারের সাইড কীবোর্ডের দিকে তাকানো, সম্ভবত এটি এর 1 এর 1 এবং 5 এর 2 এর 's' বেশি সম্ভবত !)। নমুনাটিকে যেভাবেই "সংশোধন" করে, আমরা এটিকে সেন্সর করে রাখি না, কারণ র্যান্ডম ভেরিয়েবলটি প্রথম স্থানে রেকর্ডকৃত পরিসরে রেঞ্জ করার কথা নয় (সুতরাং 4 এবং 5 এর মানগুলিতে নির্ধারিত সত্যিকারের সম্ভাবনা নেই) )। 415245
কেস সি) একটি যৌথ নমুনা বোঝায়, যেখানে আমাদের নির্ভরশীল পরিবর্তনশীল এবং ভবিষ্যদ্বাণী রয়েছে। এখানে, আমাদের একটি নমুনা থাকতে পারে যেখানে নির্ভরশীল ভেরিয়েবলের মানগুলি এক বা উভয় চূড়ায় কেন্দ্রীভূত হয়, অধ্যয়নের অধীনে ঘটনার কাঠামোর কারণে: "ঘন্টা কাজ" স্বাভাবিক উদাহরণে, বেকার লোকেরা কাজ করে না তবে তাদের থাকতে হবে কাজ করেছেন (সাবধানতার সাথে চিন্তা করুন: এই উত্তরটি কি এই উত্তরটির শুরুতে বর্ণনামূলক "সংজ্ঞা" এর আওতায় পড়ে?) সুতরাং তাদের রেকর্ডিং ঘন্টা "শূন্য" বৈষম্য তৈরি সহ অন্তর্ভুক্ত করুন create অন্য চূড়ান্তভাবে, কাজ করা সর্বাধিক সংখ্যক ঘন্টা পৌঁছতে সক্ষম হতে পারে বলে যুক্তিযুক্ত হতে পারে, বলুন 16/ দিন, এবং এমন কর্মী থাকতে পারে যা প্রদত্ত বেতনের জন্য এতগুলি কাজ করতে ইচ্ছুক হবে। তবে আইনি কাঠামো এটির অনুমতি দেয় না এবং তাই আমরা এই জাতীয় "ঘন্টা কাজ" পালন করি না। এখানে, আমরা অনুমান করার চেষ্টা করছি " অভিযুক্ত শ্রম সরবরাহের ক্রিয়াকলাপ" - এবং এই পরিবর্তনশীলটির প্রতি শ্রদ্ধার সাথে এই নমুনাটি সেন্সরযুক্ত হিসাবে চিহ্নিত করা হয়েছে।
কিন্তু আমরা যদি ঘোষণা করে যে আমরা কি করতে চাই "শ্রম সরবরাহ ফাংশন অনুমান হয় দেওয়া বেকারত্ব ঘটনাটি এবং আইনি কাঠামো", নমুনা, সেন্সর হবে না যেহেতু এটি, এমন কিছু বিষয় যা আমরা চাই এই দুটি দিক প্রভাব প্রতিফলিত হবে এটা করতে।
সুতরাং আমরা দেখতে পেলাম যে সেন্সর হিসাবে একটি ডেটা নমুনা বৈশিষ্ট্যযুক্ত
ক)
বিভিন্ন পরিস্থিতি থেকে আসতে পারে এবং
খ)
একা কিছু যত্নশীল-আবশ্যক প্রয়োজন যে এটি কেটে যাওয়ার ক্ষেত্রে বিভ্রান্ত হতে পারে ।