ডেটা আইআইডি হলে আপনি কী উপসংহারে তা বাইরের তথ্য থেকে আসে, তথ্য নিজেই নয়। বিজ্ঞানী হিসাবে আপনার এটি নির্ধারণ করা দরকার যে কীভাবে তথ্য সংগ্রহ করা হয়েছিল এবং অন্যান্য বাইরের তথ্যের উপর ভিত্তি করে ডেটা আইআইডি ধরে নেওয়া যুক্তিসঙ্গত কিনা if
কিছু উদাহরণ বিবেচনা করুন।
দৃশ্য 1: আমরা 2 টি স্বাভাবিকের মিশ্রণ হতে পারে এমন একক বিতরণ থেকে স্বাধীনভাবে একটি সেট তৈরি করি।
পরিস্থিতি 2: আমরা প্রথমে দ্বিপদী বিতরণ থেকে একটি লিঙ্গ পরিবর্তনশীল উত্পন্ন করি, তারপরে পুরুষ ও স্ত্রীদের মধ্যে আমরা স্বতন্ত্রভাবে একটি সাধারণ বিতরণ থেকে ডেটা উত্পন্ন করি (তবে সাধারণগুলি পুরুষ এবং স্ত্রীদের জন্য পৃথক পৃথক), তারপরে আমরা লিঙ্গ সম্পর্কিত তথ্য মুছতে বা হারাতে পারি।
1 দৃশ্যে ডেটা আইআইডি এবং 2 দৃশ্যে ডেটা স্পষ্টভাবে সনাক্ত করা হয় না (পুরুষ এবং স্ত্রীদের জন্য বিভিন্ন বিতরণ), তবে 2 টি পরিস্থিতিতে দুটি বিতরণ ডেটা থেকে পৃথক, আপনাকে কীভাবে তথ্য সম্পর্কে তথ্য জানতে হবে পার্থক্য নির্ধারণের জন্য উত্পন্ন হয়েছিল
পরিস্থিতি 3: আমি আমার শহরে বসবাসকারী মানুষের একটি সাধারণ এলোমেলো নমুনা নিয়েছি এবং একটি সমীক্ষা চালিয়ে যাচ্ছি এবং শহরের সমস্ত লোকের সম্পর্কে তথ্য নির্ধারণের জন্য ফলাফলগুলি বিশ্লেষণ করি।
পরিস্থিতি 4: আমি আমার শহরে বসবাসকারী মানুষের একটি সাধারণ এলোমেলো নমুনা গ্রহণ করি এবং একটি সমীক্ষা পরিচালনা করি এবং দেশের সমস্ত লোক সম্পর্কে তথ্য অন্তর্ভুক্ত করার জন্য ফলাফলগুলি বিশ্লেষণ করি।
3 দৃশ্যে বিষয়গুলি স্বতন্ত্র হিসাবে বিবেচিত হবে (সুদের জনসংখ্যার সাধারণ এলোমেলো নমুনা), তবে 4 দৃশ্যে এগুলি স্বতন্ত্র বলে বিবেচিত হবে না কারণ তারা আগ্রহের জনসংখ্যার একটি ক্ষুদ্র উপসেট থেকে নির্বাচিত হয়েছিল এবং ভৌগলিক ঘনিষ্ঠতা সম্ভবত আরোপিত হবে নির্ভরতা। তবে ২ টি ডেটাসেট অভিন্ন, এটি সেই পদ্ধতিতে আমরা ডেটা ব্যবহার করার ইচ্ছা করি যা নির্ধারণ করে যে তারা এই ক্ষেত্রে স্বতন্ত্র বা নির্ভরশীল কিনা।
সুতরাং কেবলমাত্র ডেটা ব্যবহার করে পরীক্ষা করার কোনও উপায় নেই যে ডেটা আইআইডি, প্লট এবং অন্যান্য ডায়াগনস্টিকস কিছু ধরণের নন-আইআইডি প্রদর্শন করতে পারে তবে এগুলির অভাবে ডেটা আইআইডি হওয়ার গ্যারান্টি নেই। আপনি নির্দিষ্ট অনুমানের সাথেও তুলনা করতে পারেন (আইআইডি সাধারণ কেবল আইআইডি-র তুলনায় অস্বীকার করা সহজ)। যে কোনও পরীক্ষা এখনও একটি নিয়ম বাইরে, কিন্তু পরীক্ষা প্রত্যাখ্যান করতে ব্যর্থতা কখনও প্রমাণ করে না যে এটি আইআইডি।
আপনি আইডিআইডি শর্তাদি ধারণ করে কিনা তা সিদ্ধান্ত গ্রহণের জন্য কীভাবে তথ্য সংগ্রহ করা হয়েছিল, কীভাবে এটি অন্যান্য তথ্যের সাথে সম্পর্কিত, এবং কীভাবে এটি ব্যবহার করা হবে তার বিজ্ঞানের উপর ভিত্তি করে সিদ্ধান্ত নেওয়া দরকার।
সম্পাদনা:
অ-অভিন্নের জন্য উদাহরণগুলির আরও একটি সেট এখানে।
পরিস্থিতি 5: ডেটা হ'ল একজাতীয় অবস্থানের অবশিষ্টাংশ যেখানে বিজাতীয়ত্ব রয়েছে (রূপগুলি সমান নয়)।
পরিস্থিতি 6: ডেটা গড়ের সাথে 0 তবে বিভিন্ন বৈকল্পিক সহ নরমালদের মিশ্রণ থেকে প্রাপ্ত।
5 দৃশ্যে আমরা স্পষ্টভাবে দেখতে পাচ্ছি যে আমরা যদি লাগানো মান বা অন্যান্য ভেরিয়েবল (ভবিষ্যদ্বাণীকারী, বা সম্ভাব্য ভবিষ্যদ্বাণীকারী) এর বিরুদ্ধে অবশিষ্টাংশগুলি পরিকল্পনা করি তবে অবশিষ্টাংশগুলি অভিন্নভাবে বিতরণ করা হয় না, তবে অবশিষ্টাংশগুলি (বাইরের তথ্য ব্যতীত) দৃশ্য 6 থেকে পৃথক হতে পারে।