অনেক সময় আমি "ডেটা স্নুপিং" (এখানে একটি মজাদার উদাহরণ ) এর বিরুদ্ধে অনানুষ্ঠানিক সতর্কতাগুলি পেয়েছি এবং আমি মনে করি এর মোটামুটি অর্থ কী, এবং কেন এটি সমস্যা হতে পারে সে সম্পর্কে আমার একটি স্বজ্ঞাত ধারণা রয়েছে।
অন্যদিকে, "অনুসন্ধানের তথ্য বিশ্লেষণ" পরিসংখ্যানগুলিতে একটি যথাযথ সম্মানজনক পদ্ধতি বলে মনে হচ্ছে, কমপক্ষে এই শিরোনামযুক্ত একটি বই এখনও শ্রদ্ধার সাথে ক্লাসিক হিসাবে উদ্ধৃত হয়েছে তা বিচার করে ।
আমার কাজের লাইনে আমি প্রায়শই আমার কাছে প্রচুর "ডেটা স্নুপিং" এর মতো দেখতে পাই, বা সম্ভবত এটি "ডেটা অত্যাচার " হিসাবে আরও ভালভাবে বর্ণনা করা হবে , যদিও তারা এটি করছে তারা একই কার্যকলাপকে সম্পূর্ণ যুক্তিসঙ্গত এবং অযোগ্য "অনুসন্ধান হিসাবে দেখছে বলে মনে হচ্ছে "।
এখানে সাধারণ পরিস্থিতিটি: ব্যয়বহুল পরীক্ষা-নিরীক্ষা করা হয় (পরবর্তী বিশ্লেষণে খুব বেশি চিন্তাভাবনা না করে) মূল গবেষকরা সহজেই জড়ো করা উপাত্তগুলিতে একটি "গল্প" চিহ্নিত করতে পারবেন না, কেউ কেউ "পরিসংখ্যানের জাদুকরী" প্রয়োগ করতে আনেন, এবং কে , ডেটা কেটে ও ডাইস করার পরে , শেষ পর্যন্ত এটি থেকে কিছু প্রকাশযোগ্য "গল্প" বের করার ব্যবস্থা করে।
অবশ্যই, পরিসংখ্যান বিশ্লেষণ আপ-আপ-এ রয়েছে তা দেখানোর জন্য সাধারণত চূড়ান্ত প্রতিবেদন / কাগজে কিছু "বৈধতা" ছুঁড়ে দেওয়া হয় তবে এর পিছনে নির্মোহ প্রকাশ-অ-ব্যয়বহুল মনোভাব আমাকে সন্দেহজনক করে দেয়।
দুর্ভাগ্যক্রমে, ডেটা বিশ্লেষণের করণীয় ও করণ সম্পর্কে আমার সীমাবদ্ধ বোঝাপড়া আমাকে এ জাতীয় অস্পষ্ট সন্দেহের অতিক্রম করতে বাধা দেয়, তাই আমার রক্ষণশীল প্রতিক্রিয়াটি মূলত এই জাতীয় অনুসন্ধানগুলি উপেক্ষা করা।
আমার আশা এই যে অনুসন্ধান ও স্নুপিং / অত্যাচারের মধ্যে পার্থক্য সম্পর্কে কেবল আরও ভাল বোঝাপড়াই নয়, এবং আরও গুরুত্বপূর্ণ, সেই রেখাটি কখন পেরিয়ে গেছে তা সনাক্ত করার জন্য নীতি ও কৌশলগুলি সম্পর্কে আরও ভাল উপলব্ধি আমাকে এই জাতীয় অনুসন্ধানগুলি মূল্যায়নের অনুমতি দেবে এমন একটি উপায় যা যুক্তিসঙ্গতভাবে সর্বোত্তম-বিশ্লেষণী পদ্ধতির চেয়ে কম পরিমাণে হিসাব করতে পারে এবং এইভাবে কম্বল অবিশ্বাসের জন্য আমার বর্তমানের চেয়ে বরং সহজ-মনের প্রতিক্রিয়া ছাড়িয়ে যেতে সক্ষম হতে পারে।
সম্পাদনা: খুব আকর্ষণীয় মন্তব্য এবং উত্তরের জন্য আপনাকে সবাইকে ধন্যবাদ। তাদের বিষয়বস্তু দ্বারা বিচার করে, আমি মনে করি আমি আমার প্রশ্নটি যথেষ্টভাবে ব্যাখ্যা করতে পারি নি। আমি আশা করি এই আপডেটটি বিষয়গুলি পরিষ্কার করে দেবে।
এখানে আমার প্রশ্ন এত কি উদ্বেগ আমি অত্যাচার এড়াতে কী করা উচিত আমার আমি বিবেচনা করা উচিত (অথবা মূল্যায়ন) ফলাফল যে: ডেটা, বরং (যদিও এই একটি প্রশ্ন যে স্বার্থ আমার হয়) আমি জানি একটা সত্য জন্য মাধ্যমে আগত হয়েছে যেমন "তথ্য নির্যাতন।"
পরিস্থিতি তাদের (অনেক বিরল) ক্ষেত্রে আরও আকর্ষণীয় হয়ে ওঠে, এগুলি ছাড়াও, আমি প্রকাশের জন্য জমা দেওয়ার আগে এই জাতীয় "ফলাফলগুলি" সম্পর্কে একটি মতামত জানাতে পারি।
এই মুহুর্তে সর্বাধিক আমি যা করতে পারি তা হ'ল "আমি জানি না যে আমি এই আবিষ্কারগুলিতে কতটা বিশ্বাসযোগ্যতা দিতে পারি, সেগুলি অনুধাবন এবং পদ্ধতিগুলি সম্পর্কে যা আমি জানি তা প্রদত্ত।" এমনকি এটি বলার অপেক্ষা রাখে না too এই ধরণের অস্পষ্টতার বাইরে যাওয়ার ইচ্ছা ছিল আমার পোস্টের প্রেরণা।
মোট কথা, এখানে আমার সন্দেহগুলি আপাতদৃষ্টিতে প্রশ্নোত্তর প্রশ্নাবলীর পরিসংখ্যানগত পদ্ধতির চেয়ে বেশি ভিত্তিক are প্রকৃতপক্ষে, আমি আরও গভীরতর সমস্যার ফলস্বরূপ পরে দেখতে পাচ্ছি: পরীক্ষাগুলির নকশার প্রতি অশ্বারোহী মনোভাবের সংমিশ্রণ এবং ফলাফলগুলি দাঁড়ানোর সাথে সাথে (যেমন কোনও পরীক্ষা-নিরীক্ষা ব্যতীত) প্রকাশ করার স্পষ্ট প্রতিশ্রুতি রয়েছে। অবশ্যই, ফলো-আপ প্রকল্পগুলি সর্বদা কল্পনা করা হয়, তবে এটি কেবলমাত্র প্রশ্ন-বহির্ভূত যে কোনও একটি কাগজই বের হবে না, এটি বলে, "100,000 নমুনায় ভরাট একটি রেফ্রিজারেটর"।
পরিসংখ্যান কেবল এই সর্বোচ্চ উদ্দেশ্য পূরণের একটি উপায় হিসাবে ছবিতে আসে। পরিসংখ্যানগুলিতে ল্যাচিংয়ের একমাত্র যুক্তি (গৌণ হিসাবে তারা পুরো দৃশ্যে রয়েছে) হ'ল "প্রকাশনা-সর্ব-ব্যয়" অনুমানের জন্য একটি সামনের চ্যালেঞ্জ কেবল অর্থহীন।
প্রকৃতপক্ষে, আমি এই জাতীয় পরিস্থিতিতে কেবলমাত্র একটি কার্যকর প্রতিক্রিয়া সম্পর্কে ভাবতে পারি: কিছু পরিসংখ্যানগত পরীক্ষার প্রস্তাব দেওয়ার জন্য (অতিরিক্ত পরীক্ষার প্রয়োজন নেই) যা বিশ্লেষণের গুণমানকে সত্যই পরীক্ষা করে। তবে আমার কাছে এটির পরিসংখ্যানের চপস নেই। আমার আশা (বিপরীতমুখী নিষ্পাপ) আমি কী অধ্যয়ন করতে পারি তা সন্ধান করা ছিল যা আমাকে এই ধরনের পরীক্ষাগুলি নিয়ে আসতে সক্ষম করতে পারে ...
আমি যখন এটি লিখছি এটি আমার উপরে প্রমাণিত হয়েছে যে, এটি ইতিমধ্যে বিদ্যমান না থাকলে, বিশ্ব পরিসংখ্যানগুলির একটি নতুন উপ-শাখা ব্যবহার করতে পারে, "ডেটা-অত্যাচার" সনাক্ত এবং প্রকাশের জন্য কৌশলগুলিতে নিবেদিত। (অবশ্যই, আমার অর্থ এই নয় যে "অত্যাচার" রূপক দ্বারা বাহিত হওয়া: বিষয়টি প্রতি সেচ "ডেটা-অত্যাচার" নয়, তবে উদ্দীপনাজনিত "অনুসন্ধান" হতে পারে))