আমি প্রকৃতিতে এই নিবন্ধটি পড়ছিলাম যেখানে ডেটা বিশ্লেষণের প্রসঙ্গে কিছু ভুলত্রুটি ব্যাখ্যা করা হয়েছে। আমি লক্ষ্য করেছি যে টেক্সাসের শার্পশুটারের ভ্রান্তি এড়ানো বিশেষত কঠিন ছিল:
তথ্য বিশ্লেষণের সময় অপেক্ষা করা একটি জ্ঞানীয় জাল টেক্সাসের শার্পশুটারের কল্পকাহিনী দ্বারা চিত্রিত: একটি অদক্ষ চিহ্নিতকারী যিনি একটি শস্যাগার পাশের বুলেটের এলোমেলো প্যাটার্নে গুলি চালান, বুলেটের ছিদ্রগুলির সবচেয়ে বড় গুঁড়ির চারপাশে লক্ষ্য টানেন এবং গর্বের সাথে উল্লেখ করেছেন তার সাফল্য।
তাঁর বুলসিয়ে স্পষ্টতই হাস্যযোগ্য - তবে জয়ের ক্ষেত্রে যারা জয়ের ধারাবাহিকতা অবলম্বন করে এমন একটি 'হট হ্যান্ড' বিশ্বাস করে বা লটারির অঙ্কটি যখন সমস্ত বিজোড় সংখ্যা হিসাবে আসে তখন অতিপ্রাকৃত তাত্পর্য দেখায় এমন লোকদের কাছে এই স্পষ্টতা স্পষ্ট নয়।
না এটি গবেষকদের কাছে সর্বদা সুস্পষ্ট। পশলার বলেছেন, "আপনি কেবল ডেটা থেকে কিছুটা উত্সাহ পান এবং তারপরে ভাবেন, ভাল, এটাই নেমে যাওয়ার পথ," “আপনি বুঝতে পারবেন না যে আপনার কাছে ২ different টি ভিন্ন ভিন্ন বিকল্প রয়েছে এবং আপনি এমন একটিটিকে বেছে নিয়েছিলেন যা আপনাকে সর্বাধিক সম্মত বা আকর্ষণীয় ফলাফল দিয়েছে এবং এখন আপনি এমন কোনও কিছুতে নিযুক্ত আছেন যা উপাত্তের নিরপেক্ষ প্রতিনিধিত্ব নয় at "
আমি মনে করি যে এই ধরণের অনুসন্ধানের কাজগুলি সাধারণ এবং প্রায়শই অনুমানগুলি বিশ্লেষণের সেই অংশটির ভিত্তিতে নির্মিত হয়। এই প্রক্রিয়াটিতে নিবেদিত একটি সম্পূর্ণ পদ্ধতির ( EDA ) রয়েছে:
পরিসংখ্যানবিদদের ডেটা অন্বেষণ করতে উত্সাহিত করার জন্য এবং সম্ভবত ডেপুটিসিসকে নতুন তথ্য সংগ্রহ এবং পরীক্ষা-নিরীক্ষার দিকে পরিচালিত করার জন্য জন টুকি দ্বারা অনুসন্ধানের তথ্য বিশ্লেষণকে উত্সাহিত করেছিলেন
দেখে মনে হচ্ছে যে কোনও অন্বেষণ প্রক্রিয়া আগে থেকেই অনুমান ব্যতীত সম্পাদিত হয় যা উদ্দীপক অনুমান তৈরি করার প্রবণ।
লক্ষ্য করুন যে উপরে ইডিএর বর্ণনাটি আসলে আলোচনা করে new data collection and experiments
। আমি বুঝতে পারি যে নতুন ডেটা সংগ্রহ করার পরে, তারপরে একটি নিশ্চিতকরণ তথ্য বিশ্লেষণ (সিডিএ) উপযুক্ত। তবে, আমি মনে করি না যে এই পার্থক্যটি খুব স্পষ্টভাবে তৈরি হয়েছে, এবং যদিও ইডিএ এবং সিডিএর পৃথকীকরণ আদর্শ হবে, অবশ্যই কিছু পরিস্থিতিতে রয়েছে যা এটি সম্ভব নয়। আমি যতদূর বলতে পারি যে এই বিচ্ছেদ অনুসরণ করা কঠোরভাবে অস্বাভাবিক এবং বেশিরভাগ অনুশীলনকারীরা ইডিএর দৃষ্টিতে মোটেও সাবস্ক্রাইব করেন না।
সুতরাং আমার প্রশ্নটি হ'ল: ইডিএ (বা ডেটা অন্বেষণের কোনও অনানুষ্ঠানিক প্রক্রিয়া) কি টেক্সাসের শার্পশুটারের ত্রুটির কারণে পড়ে যাওয়ার সম্ভাবনা বেশি করে তোলে?