বিশ্লেষণগুলি প্রায়শই সাধারণ লোকেরা যখন পরিচালনা করেন তখন আমরা কি এমন এক যুগে মডেল ধারণা এবং মূল্যায়নের গুরুত্বকে অতিরঞ্জিত করছি?


54

নীচের লাইন , পরিসংখ্যান সম্পর্কে আমি যত বেশি শিখব, আমার ক্ষেত্রে প্রকাশিত কাগজপত্রের উপর আমি তত কম বিশ্বাস করি; আমি কেবল বিশ্বাস করি যে গবেষকরা তাদের পরিসংখ্যান যথাযথভাবে করছেন না।


আমি একজন সাধারণ মানুষ, তাই কথা বলতে। আমি জীববিজ্ঞানে প্রশিক্ষিত কিন্তু পরিসংখ্যান বা গণিতে আমার কোনও আনুষ্ঠানিক শিক্ষা নেই। আমি আর উপভোগ করি এবং প্রায়শই গবেষণা করার সময় আমি যে পদ্ধতিগুলি প্রয়োগ করি তার কিছু তাত্ত্বিক ভিত্তি পড়ার (এবং বুঝতে ...) চেষ্টা করার চেষ্টা করি। আজ বিশ্লেষণ করা বেশিরভাগ লোকেরা যদি আসলে আনুষ্ঠানিকভাবে প্রশিক্ষিত না হয় তবে অবাক হওয়ার কিছু নেই। আমি প্রায় ২০ টি মূল কাগজ প্রকাশ করেছি, যার মধ্যে কয়েকটি স্বীকৃত জার্নাল দ্বারা গৃহীত হয়েছে এবং পরিসংখ্যানবিদরা প্রায়শই পর্যালোচনা-প্রক্রিয়ায় জড়িত ছিলেন। আমার বিশ্লেষণগুলিতে সাধারণত বেঁচে থাকা বিশ্লেষণ, লিনিয়ার রিগ্রেশন, লজিস্টিক রিগ্রেশন, মিশ্র মডেল অন্তর্ভুক্ত থাকে। কোনও পর্যালোচক কখনও কখনও মডেল অনুমান, ফিট বা মূল্যায়নের বিষয়ে জিজ্ঞাসা করেননি।

সুতরাং, আমি কখনও মডেল অনুমান, ফিট এবং মূল্যায়ন সম্পর্কে খুব বেশি মাথা ঘামাই না। আমি একটি হাইপোথিসিস দিয়ে শুরু করি, রিগ্রেশন কার্যকর করি এবং তারপরে ফলাফলগুলি উপস্থাপন করি। কিছু কিছু ক্ষেত্রে আমি এই বিষয়গুলি মূল্যায়নের চেষ্টা করেছি, তবে আমি সর্বদা শেষ করে দিয়েছি " ভাল এটি সমস্ত অনুমানগুলি পূরণ করেনি, তবে আমি ফলাফলগুলিতে বিশ্বাস করি" (বিষয় সম্পর্কিত জ্ঞান ") এবং সেগুলি প্রশংসনীয়, তাই এটি ঠিক আছে " এবং কোনও পরিসংখ্যানবিদদের সাথে পরামর্শ করার সময় তারা সর্বদা সম্মত বলে মনে হয়।

এখন, আমি অন্যান্য পরিসংখ্যানবিদ এবং অ-পরিসংখ্যানবিদদের (কেমিস্ট, চিকিত্সক এবং জীববিজ্ঞানীদের) সাথে কথা বলেছি যারা নিজেদের বিশ্লেষণ করে; দেখে মনে হচ্ছে এই সমস্ত অনুমান এবং আনুষ্ঠানিক মূল্যায়ন সম্পর্কে লোকেরা খুব বেশি মাথা ঘামায় না। তবে এখানে সিভিতে, প্রচুর পরিমাণে লোকেরা অবশিষ্টাংশ, মডেল ফিট, এটি মূল্যায়নের উপায়গুলি, ইগন্যাল্যু, ভেক্টর এবং তালিকাটি সম্পর্কে আরও অনেক কিছু জিজ্ঞাসা করছে। আমি এটিকে এটিকে বলি, যখন lme4 বৃহত্তর ইগন্যালভ্যু সম্পর্কে সতর্ক করে, আমি সত্যিই সন্দেহ করি যে এর ব্যবহারকারীর বেশিরভাগই এই বিষয়টির প্রতি যত্নশীল ...

এটি অতিরিক্ত প্রচেষ্টা মূল্য? এটি সম্ভবত এমন নয় যে সমস্ত প্রকাশিত ফলাফলের সিংহভাগই এই অনুমানগুলিকে সম্মান করে না এবং সম্ভবত সেগুলি মূল্যায়নও করে নি? এটি সম্ভবত একটি ক্রমবর্ধমান সমস্যা যেহেতু ডাটাবেসগুলি প্রতিদিন বড় হয় এবং একটি ধারণা রয়েছে যে ডেটা যত বড় হবে, অনুমান এবং মূল্যায়ন তত কম গুরুত্বপূর্ণ।

আমি একেবারে ভুল হতে পারি, তবে এটি আমি এটি বুঝতে পারি।

আপডেট: প্রশংসাপত্র স্টাসকে (নীচে) থেকে ধার করা হয়েছে: http://www.nature.com/news/s ज्ञान-joins-push-to-screen-statistics-in-papers-1.15509


34
আমি সতর্ক করতে চাই যে এই প্রশ্নটি বন্ধ করলে পরিসংখ্যান বিভাগের দেয়ালের বাইরে "বাস্তব বিশ্বে" কীভাবে পরিসংখ্যান ব্যবহৃত হচ্ছে তা নিয়ে আলোচনা করার একটি গুরুত্বপূর্ণ সুযোগ বন্ধ হয়ে যাবে। সিভি হ'ল কয়েকটি জায়গার মধ্যে একটি আসল বিশ্বের মানুষ এবং পরিসংখ্যানবিদরা একত্রে মিশ্রিত হয়েছিল, এবং যোগাযোগের লাইনগুলি উন্মুক্ত রাখা সিভি-র মিশন হলেও গুরুত্বপূর্ণ। যারা খুব কাছাকাছি এবং মতামত ভিত্তিক এই "ঘনিষ্ঠ" ক্লিক করেছেন তাদের সাথে আমি সম্পূর্ণরূপে একমত, তবে আমি এখনও আশা করি আমরা এই আলোচনাটি রাখতে পারি।
স্টাসকে

5
অনেক প্রকাশনী, গবেষক বা এমনকি পুরো ক্ষেত্র অনুমানের সাথে আপত্তিজনক আচরণ করে তা কি আমাদের যথেষ্ট যত্ন নেওয়ার পরামর্শ দেয় না ? এটিও সম্ভব যে পরিসংখ্যানবিদগণ এবং পাঠ্যপুস্তকগুলি তাদের গুরুত্বকে অতিরঞ্জিত করে তবে অবশ্যই অনুশীলনকারীদের সাথে এবং জনপ্রিয় লোকদের কাছে তাদের জনপ্রিয়তা সেটির গজ হতে পারে না। এছাড়াও সম্মেলন এবং মান কিছুটা পৃথক হয়। কিছু শাখা সম্ভবত আপনার সাথে পরিচিতদের চেয়ে এটি সম্পর্কে বেশি যত্নশীল, অন্যরা সম্ভবত আপনার ক্ষেত্রে প্রকাশিত হওয়ার জন্য যে বিষয়গুলি খুব গুরুত্বপূর্ণ তা নিয়ে খুব বেশি যত্ন নেন না।
গালা

6
পূর্ববর্তী গবেষণার সমালোচনা করে একটি মন্তব্য পত্র লিখেছিলেন যেখানে মডেল অনুমানগুলি জেনে বুঝে লঙ্ঘিত হয়েছিল এবং ভুল সিদ্ধান্তগুলি টানা হয়েছিল, আমার পরামর্শ হবে ফলাফলগুলিতে বিশ্বাস না করা এবং আপনি নিজের মতো করে আত্ম-সমালোচিত না হওয়া।
ডিকরান মার্সুপিয়াল

7
"যত বড় ডেটা, তত কম গুরুত্বপূর্ণ অনুমানগুলি" তথ্যের প্রকৃত বিকাশের সাথে ধরা দেয় না: যা বৃদ্ধি পায় তা (মূলত) পরিমাপের কৌশলগুলির অগ্রগতির কারণে নির্ভরশীল পর্যবেক্ষণ / বৈশিষ্ট্যগুলির সংখ্যা। বিপরীতে, স্বতন্ত্র পর্যবেক্ষণগুলির সংখ্যা, যেমন পরীক্ষামূলক ইউনিট বা প্রব্যান্ডগুলি বরং সীমাবদ্ধ থাকে (কারণ জনগণ প্রযুক্তিগত অগ্রগতি দ্বারা বৃদ্ধি পায় না ...)। দুর্ভাগ্যক্রমে, কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটির কারণে কেবলমাত্র বৃহত ডাটা ডেটা স্বাধীনতা অনুমানগুলি (প্রায়শই, সবসময় নয়) কম গুরুত্বপূর্ণ করে তোলে।
হোর্স্ট গ্রানবুশ

3
@ অ্যাডামরবিনসন: আপনি আপনার প্রশ্নের শীর্ষে পোস্ট করেছেন যে উপসংহারটি আমি পছন্দ করি। আমি বড় নাম প্রকাশিত বা বড় সংস্থাগুলি দ্বারা সমর্থিত কাগজপত্রগুলি সম্পর্কে আরও সতর্ক থাকব। আমি যখন শীর্ষ-স্তরের জার্নালে সম্মানিত প্রতিষ্ঠানের ১৫ জন প্রবীণ লেখকের সাথে কাগজপত্রগুলি দেখি, তখন আমার প্রথম প্রবৃত্তিটি আসলে কাগজটিকে আরও তদন্ত করে দেখানো হয়, কারণ লেখক / প্রতিষ্ঠানগুলির খপ্পরতার কারণে কাগজটি প্রকাশিত হওয়ার সম্ভাবনা রয়েছে। এই কাগজপত্রগুলিতে সুদূরপ্রসারী নীতিগত প্রভাবও রয়েছে। আমার ক্ষেত্রের (জনস্বাস্থ্যের) একটি উদাহরণ
হ'ল

উত্তর:


26

আমি জীববিজ্ঞানী বা চিকিত্সক ডাক্তার হিসাবে নয়, একটি পরিসংখ্যানবিদ হিসাবে প্রশিক্ষিত। তবে আমি বেশ কিছু চিকিত্সা গবেষণা (জীববিজ্ঞানী এবং চিকিত্সক ডাক্তারদের সাথে কাজ করা) করি, আমার গবেষণার অংশ হিসাবে আমি বেশ কয়েকটি বিভিন্ন রোগের চিকিত্সা সম্পর্কে বেশ কিছুটা শিখেছি। এর অর্থ কি এই যে কোনও বন্ধু যদি আমাকে এমন কোনও রোগ সম্পর্কে জিজ্ঞাসা করে যা আমি গবেষণা করে বলেছি যে আমি কেবল তাদের ওষুধের জন্য একটি প্রেসক্রিপশন লিখতে পারি যা আমি জানি যে সেই বিশেষ রোগের জন্য সাধারণত ব্যবহৃত হয়? যদি আমি এটি করতে পারি (আমি না), তবে অনেক ক্ষেত্রে সম্ভবত এটি ঠিক হয়ে যায় (যেহেতু কোনও চিকিত্সক চিকিত্সক একই medicationষধটি লিখেছিলেন) তবে তাদের অ্যালার্জি / ড্রাগ থাকার সম্ভাবনা সবসময়ই থাকে কথোপকথন / অন্য যে কোনও চিকিত্সক জিজ্ঞাসা করতে জানতে পারে, যে আমি না এবং ভাল চেয়ে অনেক বেশি ক্ষতি কারণ।

আপনি কী অনুমান করছেন এবং কী ভুল হতে পারে তা না বুঝে যদি আপনি পরিসংখ্যানগুলি করছেন (বা এই বিষয়গুলির সন্ধানের জন্য কোনও পরিসংখ্যানবিদের সাথে পরামর্শ করা) তবে আপনি পরিসংখ্যানগত অপব্যবহারের অনুশীলন করছেন। বেশিরভাগ সময় এটি সম্ভবত ঠিক থাকবে, তবে সেই উপলক্ষটির কী হবে যেখানে একটি গুরুত্বপূর্ণ অনুমান হয় না, তবে আপনি কেবল তা উপেক্ষা করেন?

আমি এমন কিছু চিকিত্সকের সাথে কাজ করি যারা পরিসংখ্যানগতভাবে দক্ষ এবং তাদের নিজস্ব বিশ্লেষণ অনেক কিছু করতে পারে তবে তারা এখনও এটি আমার অতীতে চালাবেন। প্রায়শই আমি নিশ্চিত করি যে তারা সঠিক কাজটি করেছে এবং তারা বিশ্লেষণ নিজেই করতে পারে (এবং তারা নিশ্চিতকরণের জন্য সাধারণত কৃতজ্ঞ) তবে মাঝে মধ্যে তারা আরও জটিল কিছু করবে এবং আমি যখন আরও ভাল পদ্ধতির উল্লেখ করি তখন তারা সাধারণত বিশ্লেষণকে ঘুরিয়ে দেবে আমার বা আমার দলে, বা কমপক্ষে আমাকে আরও সক্রিয় ভূমিকার জন্য নিয়ে আসুন।

সুতরাং আপনার শিরোনাম প্রশ্নের আমার উত্তর হ'ল "না" আমরা অতিরঞ্জিত করছি না, বরং আমাদের কিছু বিষয়কে আরও বেশি জোর দেওয়া উচিত যাতে সাধারণ লোকেরা কোনও পরিসংখ্যানবিদদের সাথে তাদের পদ্ধতি / ফলাফলগুলি কমপক্ষে দ্বিগুণ করার সম্ভাবনা অর্জন করতে পারে।

সম্পাদন করা

এটি নীচে অ্যাডামের মন্তব্যের ভিত্তিতে একটি সংযোজন (অন্য মন্তব্যের জন্য কিছুটা দীর্ঘ হবে)।

অ্যাডাম, আপনার মন্তব্যের জন্য ধন্যবাদ। সংক্ষিপ্ত উত্তরটি "আমি জানি না"। আমি মনে করি নিবন্ধের পরিসংখ্যানগত মান উন্নয়নে অগ্রগতি হচ্ছে, তবে বিষয়গুলি বিভিন্নভাবে এত দ্রুত স্থানান্তরিত হয়েছে যে গুণটি ধরে রাখতে এবং গ্যারান্টি দেওয়ার জন্য এটি কিছুটা সময় নিতে পারে। সমাধানের অংশটি অনুমান এবং ইন্ট্রো স্ট্যাটাস কোর্সে লঙ্ঘনের পরিণতিতে ফোকাস করছে। ক্লাসটি যখন পরিসংখ্যানবিদদের দ্বারা শেখানো হয় তখন এটি হওয়ার সম্ভাবনা বেশি থাকে তবে সমস্ত ক্লাসে এটি হওয়া দরকার।

কিছু জার্নাল আরও ভাল করছে, তবে আমি একটি নির্দিষ্ট পরিসংখ্যানবিদ পর্যালোচক স্ট্যান্ডার্ড হয়ে উঠতে চাই। কয়েক বছর আগে একটি নিবন্ধ ছিল (দুঃখের সাথে রেফারেন্সটি হাতে নেই, তবে এটি জ্যামা বা নিউ ইংল্যান্ড জার্নাল অফ মেডিসিনে ছিল) এটি প্রকাশের উচ্চতর সম্ভাবনা দেখিয়েছিল (যদিও এটি যতটা বড় ততটা পার্থক্য নয়) জেএমএ বা এনইজেএম-এ যদি কোনও বায়োস্ট্যাটিস্টিকান বা এপিডেমিওলজিস্ট সহ-লেখক ছিলেন।

সম্প্রতি একটি আকর্ষণীয় নিবন্ধ প্রকাশিত হয়েছে: http://www.nature.com/news/statistics-p-values-are-just-the-tip-of-the-iceberg-1.17412 যা একই সমস্যা নিয়ে কিছু আলোচনা করে।


1
আমি আপনার দৃষ্টিভঙ্গি ভাগ করছি, গ্রেগ। আমি মনে করি আপনার উত্তরটি এটি পরিষ্কারভাবে ব্যাখ্যা করেছে। তবে আমি আপনাকে উদ্ধৃত করে বলতে চাই: "[...] তাহলে আপনি পরিসংখ্যানগত দুর্বলতা অনুশীলন করছেন Most বেশিরভাগ সময় এটি সম্ভবত ঠিক থাকবে"। এই ধারণাটি ছড়িয়ে পড়ার ঝুঁকি রয়েছে এবং লোকেরা এটি হিসাবে উপলব্ধি করতে পারে: যে কেউ পরিসংখ্যান করতে পারে (যদি আপনি আমাকে জিজ্ঞাসা করেন তবে এটি মূলত ভুল, যিনি পরিসংখ্যানের পৃষ্ঠায় কিছুটা আঁচড়ান)। প্রশ্নটি হল, আমরা কীভাবে আশ্বাস দেব যে প্রকাশিত কাজটি পরিসংখ্যান বিশ্লেষণের ক্ষেত্রে সঠিক? কারণ আমি ভাবতে শুরু করি যে সেখানে কতগুলি নিবন্ধ আছে যা কোনও পরিসংখ্যানবিদ পাস করেনি ...
অ্যাডাম রবিনসন

@ অ্যাডামরবিনসন, উপরে আমার সংযোজনটি দেখুন।
গ্রেগ তুষার

এটি বরং অভিজাত। আমি সম্মত হই যে পেশাদার পরিসংখ্যানবিদদের কাছে পরিসংখ্যান বিশ্লেষণ করার দক্ষতা এবং দক্ষতা থাকতে পারে তবে বিজ্ঞানীরাও তাই করতে পারেন। প্রকৃতপক্ষে, পরিসংখ্যানগুলিতে কিছু যুগোপযোগী অগ্রগতি এসেছে বিজ্ঞানীরা (যেমন ফিশার এবং জেফরি) বাস্তব বিশ্বে পরিসংখ্যান অনুশীলন করে।
নিখরচায়


@ নিনসফ্রি, আমি আপনার মন্তব্যগুলি বুঝতে পারি না, বা সম্ভবত আপনি আমার অবস্থান বুঝতে পারেন না। আমি বলছি না যে কেবল পরিসংখ্যানবিদরা অনুমানগুলি / শর্তগুলি দেখে নিতে পারেন, কেবল এগুলি গুরুত্বপূর্ণ যে তারা একটি স্ট্যাটিস্টিস্টের সাথে পরামর্শ করা উচিত, বা অ-পরিসংখ্যানবিদ বিজ্ঞানী (গুলি) কেবল সংখ্যাগুলি প্লাগ করার বাইরে বিষয়গুলি বুঝতে যথেষ্ট পরিসংখ্যান শিখবেন একটি সূত্র / কম্পিউটারে। ব্যক্তিগতভাবে আমি চিকিত্সা / ইঞ্জিনিয়ারিং / ইত্যাদিতে দক্ষতার সাথে আরও অনেক পরিসংখ্যান নাবালিকাকে দেখতে চাই, তবে পরিসংখ্যানগুলির পিছনে থাকা ধারণাগুলি সম্পর্কে আরও ভাল বোঝার সাথে।
গ্রেগ স্নো

28

ঠিক আছে, হ্যাঁ, অনুমানগুলি গুরুত্বপূর্ণ - যদি সেগুলি মোটেই গুরুত্বপূর্ণ না হয় তবে আমাদের সেগুলি তৈরি করার দরকার নেই, তাই না?

প্রশ্নটি তারা কতটা গুরুত্বপূর্ণ - এটি প্রক্রিয়া এবং অনুমানগুলির মধ্যে পরিবর্তিত হয় এবং আপনার ফলাফলগুলি সম্পর্কে আপনি কী দাবি করতে চান (এবং আপনার শ্রোতাদের সান্নিধ্য এমনকি এমনকি অসঙ্গততা - যেমন দাবিতেও হয়))

সুতরাং এমন পরিস্থিতির উদাহরণের জন্য যেখানে অনুমানের সমালোচনা করা যায়, পরিবর্তনের একটি এফ-পরীক্ষায় স্বাভাবিকতা অনুমানকে বিবেচনা করুন; এমনকি বিতরণে মোটামুটি পরিমিত পরিবর্তন প্রক্রিয়াটির বৈশিষ্ট্যগুলিতে (প্রকৃত তাৎপর্য স্তর এবং শক্তি) উপর মোটামুটি নাটকীয় প্রভাব ফেলতে পারে। যদি আপনি দাবি করেন যে আপনি যদি সত্যিই ২৮% স্তরে থাকেন তবে আপনি ৫% পর্যায়ে একটি পরীক্ষা চালিয়ে যাচ্ছেন, আপনি কিছুটা অর্থেই কীভাবে আপনার পরীক্ষা-নিরীক্ষা চালিয়েছিলেন সে সম্পর্কে মিথ্যা বলে একই রকম কাজ করছেন। আপনি যদি এই জাতীয় পরিসংখ্যান সম্পর্কিত সমস্যাগুলি গুরুত্বপূর্ণ না মনে করেন তবে তাদের উপর নির্ভর করবেন না এমন যুক্তি তৈরি করুন। অন্যদিকে, আপনি যদি পরিসংখ্যান সম্পর্কিত তথ্য সমর্থন হিসাবে ব্যবহার করতে চান, আপনি সেই সমর্থনটিকে ভুলভাবে উপস্থাপন করতে পারেন না।

অন্যান্য ক্ষেত্রে, বিশেষ অনুমানগুলি খুব কম সমালোচনামূলক হতে পারে। আপনি যদি লিনিয়ার রিগ্রেশনটিতে গুণাগুণটি অনুমান করছেন এবং এটি যদি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হয় এবং আপনি দক্ষতার বিষয়ে যত্নশীল না হন তবে আপনার যত্ন নেই, সমকামী ধারণা অনুধাবন করে কিনা তা জরুরী নয়। তবে আপনি যদি এটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ বলতে চান বা আত্মবিশ্বাসের ব্যবধানটি দেখাতে চান তবে হ্যাঁ, এটি অবশ্যই গুরুত্বপূর্ণ matter


2
অনুমানের গুরুত্বের পরিসংখ্যানিক দৃষ্টিভঙ্গি থেকে গ্লেন_ব এর মন্তব্যটি ভালই বলেছে। আমি মনে করি যদিও এটিও লক্ষ করা উচিত, অনুমানের তদন্তগুলি প্রকাশের উদ্দেশ্যে কিছুটা আলাদা বিষয়, যে অনুমানের লঙ্ঘন কেবল ততটাই গুরুত্বপূর্ণ, যতটা পর্যালোচক বা সম্পাদকরা তাদের বিষয়টির যত্ন নিচ্ছেন। উদাহরণ হিসাবে ফলাফলের পেছনের তত্ত্বটি প্রকাশনার জন্য যথেষ্ট যোগ্যতা সরবরাহ করতে পারে, যেখানে আশাবাদটি যে বিশ্লেষণের বিষয়গুলি ভবিষ্যতের প্রকাশনা দ্বারা সমাধান করা যেতে পারে।
জোনাথন লিসিক

ঠিক আছে, পর্যালোচকরা যদি কাগজটি পরীক্ষা করেন তবে ত্রুটির সাথে দায়বদ্ধ লেখকরা দায়বদ্ধ থাকেন। সুতরাং নিজের স্বার্থে, আপনার চেক করা উচিত ...
কেজেটিল বি হালওয়ারসেন

প্রকৃতপক্ষে, দায়িত্ব সর্বদা লেখকদের সাথে থাকবে। কিন্তু আজকাল লেখকরা অনুপযুক্ত ড্রাইভারদের দ্বারা ধাক্কা খায় যা তাদের দ্রুত এবং নোংরা ফ্যাশনে খুব কমই প্রকাশ করতে বাধ্য করে। আমি একটি পর্যালোচনা-প্রক্রিয়া দেখতে চাই যা সর্বাধিক সমালোচনামূলক পরিসংখ্যানগত অনুমানের ঘোষণার বাধ্যতামূলক করে। আজ এটি বিবেচনা করা হয় যে পরিসংখ্যান বিশ্লেষণ বই অনুসারে করা হয়েছে, তবে আমি বিশ্বাস করি যে এটি সাধারণের চেয়ে বিরল।
অ্যাডাম রবিনসন 21

3
+1 "প্রশ্ন হল তারা কতটা গুরুত্বপূর্ণ" - যা মূলত পুরো বিষয়টি সংক্ষেপে ফেলেছে। আমার এও উল্লেখ করা উচিত যে পরিসংখ্যানগত অনুক্রমের প্রয়োগের ক্ষেত্রে নির্দিষ্ট পরিসংখ্যানগত অনুমানগুলি কতটা লঙ্ঘিত হয়েছে তা জানা সম্ভব নয়। বিশ্লেষণগুলির দৃust়তা যদি আমরা তা কেবল পোস্ট করতে পারি বা বিবেচনা করতে পারি, এবং এটি পরিসংখ্যানচর্চার একটি অপরিহার্য তবে প্রায়শই অবহেলিত দিক।
heropup

18

গ্লেন_ বি একটি দুর্দান্ত উত্তর দেওয়ার সময় , আমি এটিতে কয়েক সেন্ট যোগ করতে চাই।

একটি বিবেচনা হ'ল আপনি সত্যই বৈজ্ঞানিক সত্য পেতে চান কিনা, যার জন্য আপনার ফলাফলগুলি মার্জিত করা এবং আপনার দৃষ্টিভঙ্গিটি ডিফেন্সযোগ্য, বনাম বনাম "প্রকাশিতভাবে প্রকাশনা, কোনওভাবেই আমার শৃঙ্খলে কেউ এই বিষয়গুলির পরীক্ষা করে না" এর সমস্ত বিবরণ সন্ধান করতে হবে would মোড. অন্য কথায়, আপনি নিজের আন্তঃ পেশাদার বিবেককে জিজ্ঞাসা করতে হবে যে আপনি সবচেয়ে ভাল কাজটি করতে পারেন কিনা। আপনার শৃঙ্খলায় স্বল্প পরিসংখ্যানের সাক্ষরতা এবং শিথিল পরিসংখ্যানিক অনুশীলনগুলির উল্লেখ উল্লেখযোগ্য যুক্তি তোলে না। পর্যালোচকরা প্রায়শই অর্ধ-সহায়ক হন যদি তারা এই শিথিল মানগুলির সাথে একই অনুশাসন থেকে আসে তবে কিছু শীর্ষস্থানীয় খাত্রে পর্যালোচনা প্রক্রিয়ায় পরিসংখ্যানগত দক্ষতা আনার সুস্পষ্ট উদ্যোগ রয়েছে

তবে আপনি যদি ছদ্মবেশী "প্রকাশনা-বা-পরিশ" সালামি স্লাইসার হন তবে অন্য বিবেচনাটি মূলত আপনার গবেষণা খ্যাতির সুরক্ষা। যদি আপনার মডেলটি ব্যর্থ হয় এবং আপনি এটি জানেন না, আপনি যারা আরও বেশি পরিশ্রুত যন্ত্রের সাহায্যে মডেল চেকগুলির ফাটলটিতে কুড়ালটি চালাতে পারেন তাদের দ্বারা নিজেকে প্রত্যাখ্যানের ঝুঁকির মুখোমুখি করছেন। ঠিক আছে, বিজ্ঞান সম্প্রদায় যেমন নামী দার্শনিক প্রয়োজনীয়তা এবং পুনরুত্পাদনযোগ্যতার সত্ত্বেও বিজ্ঞানের সম্প্রদায়টি অন্য কারও গবেষণার পুনরুত্পাদন করার প্রচেষ্টাতে খুব কমই ব্যস্ত থাকে বলে মনে হয়। (আমি বেশ কয়েকটি কাগজপত্র লেখার সাথে জড়িত ছিলাম যা মূলত শুরু হয়েছিল, "ওহে আমার really শ্বর, তারা কি আসলেই করেছিল?"এটি লিখুন? ", এবং সমালোচনা এবং সমকালীন পর্যালোচনা প্রকাশিত আধা-পরিসংখ্যান পদ্ধতির পরিমার্জনের প্রস্তাব দিয়েছিলেন।) তবে, পরিসংখ্যানগত বিশ্লেষণগুলির ব্যর্থতাগুলি প্রকাশিত হলে প্রায়শই বড় এবং অপ্রীতিকর ছড়িয়ে পড়ে।


আমি সত্যিই এই পদ্ধতির পছন্দ করি: পেশাদার বিবেক এবং আমি বিশ্বাস করি অনেকের বিবেক আছে তবে এখনও জ্ঞানের অভাব রয়েছে; তবে এটি তাদের উপাত্ত উপস্থাপন থেকে বাধা দেবে না যেন এটি পুরোপুরি সম্পন্ন হয়েছে। মজার বিষয় হচ্ছে, আপনি একটি বিজ্ঞানের নিবন্ধের উদ্ধৃতি দিচ্ছেন যা এটিকে স্পষ্টভাবে ব্যাখ্যা করে: "[...] ব্যাপক উদ্বেগ যে ডেটা বিশ্লেষণে প্রাথমিক ভুলগুলি অনেক প্রকাশিত গবেষণা ফলাফলের অপ্রতিরোধ্যতায় অবদান রাখছে।" আমি সত্যই মনে করি যে আমরা সাধারণ মানুষ, আমরা পরিসংখ্যানগত পদ্ধতিগুলির অসুবিধাটিকে সত্যই সম্মান করি না এবং এটি উপরে বর্ণিত হিসাবে একটি ক্রমবর্ধমান সমস্যা হওয়া উচিত।
অ্যাডাম রবিনসন 21

1
আমার বর্তমান গবেষণা গোষ্ঠীতে, আমরা 15 জন গবেষক (জীববিজ্ঞানী, চিকিত্সক) এবং তাদের মধ্যে কিছু সত্যই উত্পাদনশীল তবে কোনওটি পরিসংখ্যানবিদ নয়। সমস্ত জুনিয়র গবেষকরা আর বা এসএএস ইনস্টল করেছেন এবং সাধারণত ইন্টারনেটে মাত্র কয়েকটি টিউটোরিয়াল পড়ার পরে গণনা করেন। এটি একটি বড় সমস্যা।
অ্যাডাম রবিনসন

4
@ অ্যাডামরবিনসন, আপনি সিভিতে এই বিষয়ে জিজ্ঞাসা করেছেন এমনটিই আপনার বিবেকের কথা বলে। বৈজ্ঞানিক কম্পিউটিংয়ের কিছুটা সম্পর্কিত ইস্যুতে (এবং নিজস্ব সি / ফোর্টরান / আর কোড লিখেছেন বিজ্ঞানীরা সফটওয়্যার বিকাশের সেরা অনুশীলনগুলির প্রয়োগের অভাব) - সম্পর্কে আপনার আরও একটি প্রকৃতির লিংক, প্রকৃতি / নিউজ / ২০১০ /101013/ful/467775a.html
স্টাসকে

3
বিজ্ঞান সম্প্রদায় হিসাবে, নামকরণ ও প্রজননযোগ্যতার নামমাত্র দার্শনিক প্রয়োজনীয়তা সত্ত্বেও, অন্য কারও গবেষণা পুনরুত্পাদন করার প্রয়াসে খুব কমই ব্যস্ত হয় আমি এই বক্তব্যের সাথে সম্পূর্ণরূপে একমত।
রবার্ট স্মিথ

সফ্টওয়্যার- carpentry.org , "স্বেচ্ছাসেবক অলাভজনক সংস্থা যা গবেষকদের বেসিক কম্পিউটিং দক্ষতা শেখানোর জন্য নিবেদিত", এর বেশ ভাল টিউটোরিয়াল এবং সেমিনার রয়েছে।
ডেনিস

9

অনুমানের লঙ্ঘনের প্রকৃতি ভবিষ্যতের গবেষণার জন্য একটি গুরুত্বপূর্ণ সূত্র হতে পারে। উদাহরণস্বরূপ, কক্সের বেঁচে থাকার বিশ্লেষণে আনুপাতিক-ঝুঁকি অনুমানের লঙ্ঘন স্বল্পমেয়াদী বেঁচে থাকার ক্ষেত্রে একটি বৃহত প্রভাবের সাথে পরিবর্তিত হতে পারে তবে দীর্ঘ মেয়াদে খুব কম প্রভাব ফেলতে পারে। এটি স্ট্যাটিস্টিকাল পরীক্ষায় আপনার অনুমানের বৈধতা পরীক্ষা করে আপনি পেতে পারেন এমন অপ্রত্যাশিত তবে সম্ভাব্য গুরুত্বপূর্ণ তথ্য।

সুতরাং আপনি নিজেকে অন্তর্নিহিত অনুমানগুলি পরীক্ষা না করলে কেবল সাহিত্যেরই নয়, একটি সম্ভাব্য বিপর্যয় নিজেই করেন। যেহেতু উচ্চ-মানের জার্নালগুলির আরও পরিশীলিত পরিসংখ্যান পর্যালোচনার প্রয়োজন শুরু হয় আপনি এটি করার জন্য নিজেকে আরও ঘন ঘন আহ্বান করবেন। আপনি এমন অবস্থানে থাকতে চান না যেখানে একটি পরিসংখ্যান পর্যালোচক দ্বারা প্রয়োজনীয় পরীক্ষা আপনার কাগজের মূল বিষয় হিসাবে কী ভেবেছিল তা হ্রাস করে।


আমি এই মন্তব্যটির সাথে পুরোপুরি একমত, যা আমি মনে করি খুব গুরুত্বপূর্ণ।
অ্যাডাম রবিনসন

9

আমি মধ্যবর্তী দৃষ্টিকোণ থেকে উত্তর দেব। আমি কোনও পরিসংখ্যানবিদ নই, আমি রসায়নবিদ। তবে, আমি গত 10 বছর কেমিমেট্রিক্স = কেমিস্ট্রি সম্পর্কিত ডেটার জন্য পরিসংখ্যানগত ডেটা বিশ্লেষণে বিশেষীকরণ করেছি।

আমি কেবল বিশ্বাস করি যে গবেষকরা তাদের পরিসংখ্যান যথাযথভাবে করছেন না।

সম্ভবত এটি ক্ষেত্রে।


সংক্ষিপ্ত সংস্করণ:

এখন অনুমান সম্পর্কে। আইএমএইচও এখানকার পরিস্থিতি এক বিবৃতিতে এর সাথে মোকাবিলা করার পক্ষে অনেক বিজাতীয়। লঙ্ঘনটি নিরীহ বা সমালোচিত কিনা তা বিচার করার জন্য অ্যাপ্লিকেশনটির দ্বারা ঠিক কী অনুমানের প্রয়োজন এবং কোনভাবে এটি লঙ্ঘন হওয়ার সম্ভাবনা রয়েছে তা উভয়েরই বোঝা। এবং এটি প্রয়োগের জ্ঞানের পাশাপাশি পরিসংখ্যান উভয়ই প্রয়োজন।
তবে একজন চিকিত্সক হিসাবে অচিহ্নিতযোগ্য অনুমানের মুখোমুখি হওয়ায়, আমার পাশাপাশি আরও কিছু প্রয়োজন: আমি একটি "দ্বিতীয় প্রতিরক্ষা প্রতিরক্ষা" রাখতে চাই যা উদাহরণস্বরূপ আমাকে লঙ্ঘন করতে পেরেছে যে এটি লঙ্ঘনটি আসলে সমস্যা সৃষ্টি করছে কিনা বা এটি নির্দোষ is


দীর্ঘ সংস্করণ:

  • ব্যবহারিক দৃষ্টিকোণ থেকে কিছু সাধারণ অনুমান প্রায় কখনও পূরণ হয় না। কখনও কখনও আমি ডেটা সম্পর্কে বুদ্ধিমান ধারণা তৈরি করতে পারি তবে প্রায়শই সমস্যাগুলি একটি পরিসংখ্যানের দিক থেকে এত জটিল হয়ে যায় যে সমাধানগুলি এখনও জানা যায়নি। এতক্ষণে আমি বিশ্বাস করি যে বিজ্ঞান করার অর্থ আপনি কেবলমাত্র আপনার নির্দিষ্ট অনুশাসনেই নয়, সম্ভবত অন্যান্য শাখায়ও (এখানে: প্রয়োগিত পরিসংখ্যান) সম্ভবত সীমিতভাবে আঘাত করবেন।

  • অন্যান্য পরিস্থিতিতে রয়েছে যেখানে নির্দিষ্ট লঙ্ঘনগুলি সাধারণত নিরীহ হিসাবে পরিচিত - যেমন এলডিএর জন্য সমান সমবায় সহকারে বহুভিত্তিক স্বাভাবিকতাটি এলডিএ অনুকূল হয় তা দেখাতে হবে, তবে এটি সুপরিচিত যে প্রজেকশনটি একটি হিউরিস্টিক অনুসরণ করে যা প্রায়শই ভাল সঞ্চালনও করে যদি অনুমান পূরণ হয় না। এবং কোন লঙ্ঘনগুলি সমস্যার কারণ হতে পারে: এটি আরও জানা যায় যে বিতরণে ভারী লেজগুলি কার্যকরভাবে এলডিএর সাথে সমস্যা সৃষ্টি করে।
    দুর্ভাগ্যক্রমে, এ জাতীয় জ্ঞান খুব কমই এটি একটি কাগজের ঘনীভূত লেখায় রূপান্তরিত করে, তাই লেখকরা আবেদনের বৈশিষ্ট্যগুলির পাশাপাশি মডেলটির বিষয়ে বিবেচনা করার পরে তাদের মডেলটির জন্য সিদ্ধান্ত নিয়েছিলেন কিনা বা তারা কেবল যে কোনও মডেল বেছে নিয়েছিল কিনা তা পাঠকের কোনও ধারণা নেই has তারা পেরিয়ে এসেছিল।

  • কখনও কখনও ব্যবহারিক দৃষ্টিভঙ্গি (হিউরিস্টিক্স) বিকশিত হয় যে ব্যবহারিক দৃষ্টিকোণ থেকে খুব কার্যকর হতে দেখা যায়, এমনকি যদি তাদের পরিসংখ্যানগত বৈশিষ্ট্যগুলি বোঝার জন্য কয়েক দশক সময় লাগে (আমি পিএলএসের কথা ভাবছি)।

  • অন্যান্য জিনিস যা ঘটে (এবং আরও বেশি হওয়া উচিত) তা হ'ল লঙ্ঘনের সম্ভাব্য পরিণতিগুলি পর্যবেক্ষণ করা যেতে পারে (পরিমাপ করা), যা কোনও সমস্যা আছে কিনা তা সিদ্ধান্ত নিতে দেয়। অ্যাপ্লিকেশনটির জন্য, আমার মডেল যতক্ষণ না এটি যথেষ্ট ভাল ততক্ষণ সর্বোত্তম কিনা সে বিষয়ে আমি পাত্তা দিই না।
    কেমোমেট্রিক্সে, আমাদের পূর্বাভাসের পরিবর্তে শক্তিশালী ফোকাস রয়েছে। মডেলিং অনুমানগুলি পূরণ না হলে এবং এটি খুব সুন্দর পালানোর প্রস্তাব দেয়: এই অনুমানগুলি নির্বিশেষে, আমরা মডেলটি ভালভাবে কাজ করে কিনা তা মাপতে পারি। একজন চর্চাকারীর দৃষ্টিকোণ থেকে, আমি বলব যে আপনি যদি মডেলিংয়ের সময় আপনার পছন্দ মতো কিছু করতে চান তবে আপনি যদি একটি সৎ রাষ্ট্রীয়-আধুনিকীকরণের প্রতিবেদন করেন।
    বর্ণালী সম্পর্কিত ডেটাগুলির কেমোমেট্রিক বিশ্লেষণের জন্য, আমরা এমন একটি স্থানে রয়েছি যেখানে আমরা অবশিষ্টাংশগুলিতে নজর রাখি না কারণ আমরা জানি যে মডেলগুলি খুব সহজেই ফিট হয়ে যায়। পরিবর্তে আমরা পরীক্ষার ডেটা পারফরম্যান্স (এবং সম্ভবত প্রশিক্ষণের ডেটা প্রিডিটিভ পারফরম্যান্সের পার্থক্য) দেখি।

  • এমন আরও কিছু পরিস্থিতি রয়েছে যেখানে আমরা অনুমান করতে পারি না যে কোনটি অনুমানের ফলে কতটা লঙ্ঘন ঘটেছিল তা মডেলটির ভাঙ্গনের দিকে নিয়ে যায়, তবে আমরা অনুমানের গুরুতর লঙ্ঘনের পরিণতিগুলি সরাসরি পরিমাপ করতে সক্ষম হয়েছি।
    পরবর্তী উদাহরণ: আমি যে স্টাডি ডেটাটি নিয়ে সাধারণত আলোচনা করি তা হ'ল নমুনা আকারের নীচে মাত্রার অর্ডার যে স্ট্যাটিস্টিকাল রুলস অফ-থাম্ব প্রতি পার্থক্যের ক্ষেত্রে (স্থিতিশীল অনুমানের নিশ্চয়তার জন্য) প্রস্তাব দেয় recommend তবে পরিসংখ্যানের বইগুলি সাধারণত এই অনুমানটি পূরণ করতে না পারলে অনুশীলনে কী করা উচিত সে সম্পর্কে খুব বেশি চিন্তা করে না। বা কীভাবে আপনি আসলে এই ক্ষেত্রে সমস্যায় রয়েছেন তা মাপবেন না। তবে: এই জাতীয় প্রশ্নগুলিকে আরও প্রয়োগযোগ্য শাখায় চিকিত্সা করা হয়। দেখা যাচ্ছে, প্রায়শই মডেল স্থিতিশীলতা পরিমাপ করা বা আপনার ভবিষ্যদ্বাণীগুলি অস্থির কিনা তা কমপক্ষে বেশ সহজেই সহজ হয় (বৈধতা এবং মডেলটির স্থিতিশীলতা পুনর্নির্মাণের জন্য এখানে সিভিতে পড়ুন)। অস্থির মডেলগুলিকে স্থিতিশীল করার উপায় রয়েছে (যেমন ব্যাগিং)।

  • "প্রতিরক্ষা দ্বিতীয় রেখার" উদাহরণ হিসাবে পুনরায় মডেলিং বৈধতা বিবেচনা করুন। সাধারণ এবং শক্তিশালী ধারণাটি হ'ল সমস্ত সার্গেট মডেল পুরো ডেটা সেটটিতে প্রশিক্ষিত কোনও মডেলের সমতুল্য। যদি এই অনুমান লঙ্ঘিত হয় তবে আমরা সুপরিচিত হতাশাবাদী পক্ষপাতিত্ব পাই। ২ য় লাইনটি হ'ল কমপক্ষে সারোগেট মডেলগুলি একে অপরের সমতুল্য, তাই আমরা পরীক্ষার ফলাফলগুলি পুল করতে পারি।


তবে শেষ কথা নয়, আমি "গ্রাহক বিজ্ঞানী" এবং পরিসংখ্যানবিদদের একে অপরের সাথে আরও কথা বলতে উত্সাহিত করতে চাই । পরিসংখ্যানগত ডেটা বিশ্লেষণ আইএমএইচও এমন কিছু নয় যা একমুখী ফ্যাশনে করা যায়। কিছু সময়ে, প্রতিটি পক্ষের অন্য পক্ষের কিছু জ্ঞান অর্জন করতে হবে। আমি মাঝে মাঝে পরিসংখ্যানবিদ এবং রসায়নবিদ এবং জীববিজ্ঞানীদের মধ্যে "অনুবাদ" করতে সহায়তা করি। একজন পরিসংখ্যানবিদ জানতে পারবেন যে মডেলটির নিয়মিতকরণ প্রয়োজন। তবে লাসো এবং একটি রিজের মধ্যে চয়ন করতে, তাদের তথ্যের বৈশিষ্ট্যগুলি জানতে হবে যা কেবল রসায়নবিদ, পদার্থবিদ বা জীববিজ্ঞানী জানতে পারে।


6

পরিসংখ্যান সম্পর্কে সিভি পরিসংখ্যানবিদরা এবং উত্সাহী ব্যক্তিরা যদি সক্ষম না হন তবে এই পরিসংখ্যানগুলি বোঝার প্রয়োজনীয়তার উপর জোর দেওয়া সমস্ত উত্তর সম্পর্কে আমি অবাক হই না Give আমি নীতিগতভাবে এই উত্তরগুলির সাথেও একমত।

যাইহোক, বর্তমানে প্রকাশের চাপ এবং বর্তমানে পরিসংখ্যানগত অখণ্ডতার জন্য নিম্নমানের বিষয়টি বিবেচনা করার সময়, আমাকে বলতে হবে যে এই উত্তরগুলি বেশ নির্বোধ। আমরা সারা দিন তাদের কী করা উচিত তা বলতে পারি (যেমন আপনার অনুমান পরীক্ষা করে দেখুন) তবে তারা কী করবে তা কেবলমাত্র প্রাতিষ্ঠানিক উত্সাহের উপর নির্ভর করে। ওপি নিজেই বলেছে যে তিনি মডেলের ধারণা অনুধাবন না করে ২০ টি নিবন্ধ প্রকাশের ব্যবস্থা করেন। আমার নিজের অভিজ্ঞতা দেওয়া, আমি এটি বিশ্বাস করা কঠিন মনে করি না।

এইভাবে আমি ওপির প্রশ্নের সরাসরি উত্তর দিয়ে শয়তানের উকিলকে খেলতে চাই। এটি কোনওভাবেই এমন উত্তর নয় যা "ভাল অনুশীলন" কে উত্সাহ দেয় তবে এটি এমন একটি যা প্রতিফলিত করে যে কীভাবে ব্যঙ্গতার ইঙ্গিত দিয়ে জিনিসগুলি অনুশীলন করা হয়।

এটি অতিরিক্ত প্রচেষ্টা মূল্য?

না, যদি লক্ষ্যটি প্রকাশ করা হয় তবে মডেলটি বোঝার জন্য এটি সমস্ত সময় ব্যয় করা উপযুক্ত নয়। সাহিত্যে কেবল প্রচলিত মডেলটি অনুসরণ করুন। এইভাবে, 1) আপনার কাগজটি আরও সহজে পর্যালোচনাগুলি পাস করবে এবং 2) "পরিসংখ্যানগত অক্ষমতা" এর জন্য উন্মুক্ত হওয়ার ঝুঁকি খুব কম, কারণ আপনাকে প্রকাশ করা মানে অনেক সিনিয়র ব্যক্তি সহ পুরো ক্ষেত্রটি উন্মোচিত করা।

এটি সম্ভবত এমন নয় যে সমস্ত প্রকাশিত ফলাফলের সিংহভাগই এই অনুমানগুলিকে সম্মান করে না এবং সম্ভবত সেগুলি মূল্যায়নও করে নি? এটি সম্ভবত একটি ক্রমবর্ধমান সমস্যা যেহেতু ডাটাবেসগুলি প্রতিদিন বড় হয় এবং একটি ধারণা রয়েছে যে ডেটা যত বড় হবে, অনুমান এবং মূল্যায়ন তত কম গুরুত্বপূর্ণ।

হ্যাঁ, সম্ভবত এটি প্রকাশিত ফলাফলগুলি সত্য নয়। আমি প্রকৃত গবেষণায় যত বেশি জড়িত, ততই আমি সম্ভবত এটির সম্ভাবনা বলে মনে করি।


1
আমি মনে করি আপনার কয়েকটি খুব ভাল পয়েন্ট রয়েছে যা উপরে বর্ণিত নয়; যথা জার্নালগুলি প্রকাশের চাপ এবং জার্নালগুলি জার্নালটি পূরণ করার জন্য নিবন্ধগুলি সন্ধান করার চাপ দেয়। সম্পাদকদের কাছে নিবন্ধ প্রকাশের জন্য না পাওয়া দুঃস্বপ্ন এবং গবেষকরা অবশ্যই তাদের অস্তিত্বের জন্য প্রকাশ করতে পারেন publish যাইহোক, একটি পদ্ধতিগত দৃষ্টিকোণ থেকে, আমি যত বেশি গবেষণায় জড়িত থাকব ততই আমি বিশ্বাস করি যে সর্বাধিক প্রকাশিত ফলাফলগুলি ভুল / কম সঠিক / অসম্পূর্ণ একটি ভিন্ন মাত্রায় (একটি পরিসংখ্যানের দিক থেকে))
অ্যাডাম রবিনসন 21

4

সংক্ষিপ্ত উত্তর হলো 'না." পরিসংখ্যানগত পদ্ধতিগুলি অনুমানের সেটগুলির অধীনে তৈরি করা হয়েছিল যা ফলাফলগুলি বৈধ হওয়ার জন্য পূরণ করা উচিত। এরপরে যুক্তি দাঁড়ায় যে অনুমানগুলি যদি পূরণ না করা হয় তবে ফলাফলগুলি বৈধ হতে পারে না। অবশ্যই, মডেল অনুমানের লঙ্ঘন সত্ত্বেও কিছু অনুমান এখনও শক্তিশালী হতে পারে। উদাহরণস্বরূপ, আইআইএ অনুমানের লঙ্ঘন করা সত্ত্বেও বহু-জাতীয় লগইট ভাল সম্পাদন করে বলে মনে হচ্ছে (নীচে রেফারেন্সে ক্রপকোর [২০১১] গবেষণামূলক প্রবন্ধ দেখুন)।

বিজ্ঞানী হিসাবে, আমাদের বাধ্যবাধকতা রয়েছে যে আমরা যে ফলাফলগুলি রেখেছি তা বৈধ কিনা তা নিশ্চিত করার জন্য, যদিও ক্ষেত্রের লোকেরা অনুমানগুলি পূরণ হয়েছে কিনা তা বিবেচনা করে না। এটি কারণ বিজ্ঞান এই ধারণা নিয়ে তৈরি করা হয়েছে যে বিজ্ঞানীরা বিষয়গুলির সত্যের অনুসরণে সঠিক উপায়ে কাজ করবেন। আমরা আমাদের সহকর্মীদের জার্নালে প্রেরণের আগে তাদের কাজগুলি পরীক্ষা করার জন্য বিশ্বাস করি । আমরা কোনও পাণ্ডুলিপি প্রকাশের আগে দক্ষতার সাথে পর্যালোচনা করার জন্য রেফারিকে বিশ্বাস করি । আমরা ধরে নিইগবেষক এবং রেফারি উভয়ই জানেন যে তারা কী করছেন, যাতে পিয়ার-পর্যালোচিত জার্নালগুলিতে প্রকাশিত কাগজগুলির ফলাফলগুলিতে বিশ্বাস করা যায়। আমরা জানি এই সাহিত্য তুমি কোথায় শেষ আপনার মাথা কম্পন ও শ্রদ্ধেয় পত্রিকাতে স্পষ্টত চেরি-বাছাই করা ফলাফলের আপনার চোখ ঘূর্ণায়মান ( "প্রবন্ধগুলি নিছক পরিমাণের উপরে ভিত্তি করে বাস্তব জগতে সত্য সবসময় নয় জামে প্রকাশিত এই কাগজ ?! ")।

সুতরাং না, গুরুত্বটি অত্যধিক বিবেচনা করা যায় না, বিশেষত যেহেতু লোকেরা আপনাকে বিশ্বাস করে - বিশেষজ্ঞ - আপনার যথাযথ পরিশ্রম করার জন্য। লোকেরা আপনার ফলাফলের বৈধতা ব্যাখ্যা করতে সহায়তা করার জন্য আপনার কাগজের "সীমাবদ্ধতা" বিভাগে এই লঙ্ঘনগুলি সম্পর্কে আপনি কমপক্ষে কথা বলতে পারেন।

উল্লেখ

ক্রপকো, জে। 2011. রাজনৈতিক গবেষণা (গবেষণামূলক) জন্য আলাদা পছন্দ এবং সময়-সিরিজ ক্রস-বিভাগ পদ্ধতি সম্পর্কিত নতুন পদ্ধতি । ইউএনসি-চ্যাপেল হিল, চ্যাপেল হিল, এনসি।


আমি এই মূল্যবান মন্তব্যে একমত। তবে আপনি কি ভাবেন না যে "মে" "ইন" অবৈধ হতে পারে না "এই কারণেই লোকেরা তাদের সম্পর্কে খুব বেশি মাথা ঘামায় না। আমি বিশ্বাস করি যে অনুমানের একমাত্র অস্তিত্বই বিশ্লেষণ পক্ষপাতকে প্ররোচিত করতে পারে যা এই সমস্যাটির সাথে সম্পর্কিত to
অ্যাডাম রবিনসন

টিআইএল ক্রপকো একজন সিভি ব্যবহারকারী।
মনিকা পুনরায়

@ অ্যাডামরবিনসন, আমি মনে করি লোকেরা তাদের নিয়ে মাথা ঘামায় না কারণ তারা কীভাবে বা কেন ফলাফল অবৈধ হতে পারে তা পুরোপুরি বুঝতে পারে না। সমস্যার একটি বিশাল অংশ "প্রয়োগিত" ক্ষেত্রে পরিসংখ্যান শিক্ষার মধ্যে রয়েছে। আমার নিজস্ব প্রশিক্ষণ একটি প্রয়োগের ক্ষেত্রে is আমার একনোমেট্রিক্স-লাইট ক্লাসগুলি পূর্ণ একনোমেট্রিক্স ক্লাস হওয়ার বিষয়ে কোনও ভান করে না এবং তাদের "উন্নত গবেষণা পদ্ধতি" বা এর মতো কিছু বলা হত। কোনও পরিসংখ্যানের পূর্বশর্ত না থাকায় স্টাটা আদেশ ও ফলাফলের ব্যাখ্যায় বেশি সময় ব্যয় করার পক্ষে অধ্যাপকরা মডেল অনুমানের উপর নজর রাখতেন।
মারকুইস ডি কারাবাস 16

@ অ্যাডামরবিনসন, প্রথমবার যখন আমি স্নাতক প্রোগ্রামে ছিলাম তখন এটি একটি প্রয়োগ ক্ষেত্রের জন্যও ছিল, তবে ক্লাসগুলি বায়োস্ট্যাটিস্টিস্টরা শিখিয়েছিলেন। বায়োস্ট্যাটিস্টিনিশিয়ানরা মডেল অনুমানগুলি এবং আমাদের যে বিভিন্ন চেকগুলি করার কথা বলেছিলেন তা সম্পর্কে গভীরভাবে শিখিয়েছিলেন, কারণ ক্লাসের কিছু শিক্ষার্থী বায়োস্টাটিক্সের ছাত্র ছিলেন। তবে এটি স্পষ্ট ছিল যে এই ক্লাসগুলিতে থাকা বাকি শিক্ষার্থীরা বুঝতে পারছিল না যে আমরা কেন এই অনুমানগুলি পরীক্ষা করে দেখছি, কারণ অধ্যাপকরা যে ভাষায় শিক্ষার্থীরা বুঝতে পেরেছিলেন সে ভাষায় গুরুত্বটি প্রকাশ করেনি।
মারকুইস ডি কারাবাস

1
@ মার্কুইসডেকারবাস, সম্মত এগুলি না বোঝা একটি মৌলিক বিষয়, স্পষ্টতই। যাইহোক, আমি মাঝে মাঝে ভাবছি যে এটি ডেটা ম্যানিপুলেশনে ব্যয় করা প্রচুর পরিমাণের কারণে না হয়েছিল, যা অনুমানগুলি গ্রহণ করার জন্য লোকেদের আকাঙ্ক্ষা করে।
অ্যাডাম রবিনসন

2

আপনার যদি খুব উন্নত পরিসংখ্যানের প্রয়োজন হয় তবে এটি সম্ভবত আপনার ডেটা একটি জগাখিচুড়ি কারণ মনোবিজ্ঞানের উল্লেখ না করে বেশিরভাগ সামাজিক বিজ্ঞানের ক্ষেত্রে এটি ঘটে। যে ক্ষেত্রগুলিতে আপনার ভাল ডেটা রয়েছে আপনার খুব কম পরিসংখ্যানের প্রয়োজন। পদার্থবিজ্ঞানের একটি খুব ভাল উদাহরণ।

গ্যালিলিওর তাঁর বিখ্যাত মহাকর্ষীয় ত্বরণ পরীক্ষার এই উদ্ধৃতিটি বিবেচনা করুন:

কাঠের moldালাই বা স্ক্যানলিংয়ের একটি টুকরো, প্রায় 12 হাত লম্বা, আধ হাত প্রস্থ এবং তিনটি আঙুল-প্রস্থ পুরু, নেওয়া হয়েছিল; এর প্রান্তে প্রস্থে একটি আঙুলের চেয়ে কিছুটা বেশি একটি চ্যানেল কেটে দেওয়া হয়েছিল; এই খাঁজটিকে খুব সোজা, মসৃণ এবং মসৃণ করে তৈরি করেছি এবং এটিকে পারচমেন্টের সাথে রেখাযুক্ত করে যতটা সম্ভব মসৃণ এবং মসৃণ করে তোলা হয়েছে, আমরা এটির সাথে শক্ত, মসৃণ এবং খুব গোলাকার ব্রোঞ্জের বলটি ঘুরিয়েছিলাম। এই বোর্ডটি একটি opালু অবস্থানে রেখে, এক প্রান্তটি অন্য এক বা দুই হাতের ওপরে উপরে তুলে দিয়ে আমরা বলটি ঘুরিয়ে দিয়েছিলাম, যেমনটি আমি কেবল বলছিলাম, চ্যানেল বরাবর, লক্ষণীয়ভাবে, বর্তমানে বর্ণনা করার মতো একটি পদ্ধতিতে, প্রয়োজনীয় সময় বংশোদ্ভূত করা সময়টিকে যথার্থতার সাথে পরিমাপ করার জন্য আমরা এই পরীক্ষাকে একাধিকবার পুনরাবৃত্তি করেছিলাম যাতে দুটি পর্যবেক্ষণের মধ্যে বিচ্যুতি কখনও নাড়ি-বীটের দশমাংশ ছাড়িয়ে যায় না। এই অপারেশনটি সম্পাদন করে এবং এর নির্ভরযোগ্যতার জন্য নিজেকে আশ্বস্ত করে আমরা এখন বলটিকে চ্যানেলের দৈর্ঘ্যের এক-চতুর্থাংশ ঘুরিয়েছি; এবং এর উত্থানের সময়টি পরিমাপ করার পরে আমরা এটি দেখতে পেয়েছি যে পূর্ববর্তীটির প্রায় অর্ধেক। এরপরে আমরা অন্যান্য দূরত্বের চেষ্টা করেছিলাম, পুরো দৈর্ঘ্যের সময়টিকে অর্ধেকের সাথে, বা দুই-তৃতীয়াংশ, বা তিন-চতুর্থাংশের সাথে, বা কোনও ভগ্নাংশের জন্য তুলনায়; এই ধরনের পরীক্ষায়, পুরো একশবার পুনরাবৃত্তি করে আমরা সর্বদা দেখতে পেলাম যে ফাঁকা স্থানগুলি একে অপরের কাছে সময়ের স্কোয়ার হিসাবে ছিল এবং এটি বিমানের সমস্ত প্রবণতার জন্য, অর্থাৎ চ্যানেলের জন্য সত্য ছিল, যার সাথে আমরা ঘুরিয়েছিলাম বল। আমরা আরও লক্ষ্য করেছি যে উত্থানের সময়গুলি, বিমানের বিভিন্ন প্রবণতার জন্য একে অপরের কাছে যথাযথভাবে অনুপাত নিয়েছিল যা আমরা পরে দেখব,

সময় পরিমাপের জন্য, আমরা একটি উন্নত অবস্থানে স্থাপন করা জলের একটি বড় পাত্রটি নিযুক্ত করেছি; এই জাহাজের নীচে ছোট ব্যাসের একটি পাইপ সোল্ডার করা হয়েছিল যা একটি ছোট পাতলা জল সরবরাহ করেছিল যা আমরা প্রতিটি বংশদ্ভূতকালে একটি ছোট গ্লাসে সংগ্রহ করি, তা চ্যানেলের পুরো দৈর্ঘ্যের জন্য বা তার দৈর্ঘ্যের অংশের জন্য; এইভাবে সংগৃহীত জলটি খুব নিখুঁত ভারসাম্যের উপরে, প্রতিটি উত্থানের পরে ওজন করা হত; এই ওজনের পার্থক্য এবং অনুপাত আমাদের সময়ের পার্থক্য এবং অনুপাত দিয়েছে, এবং এটি এমন নির্ভুলতার সাথে যে অপারেশনটি বহুবার, বহুবার পুনরাবৃত্তি করা হলেও ফলাফলগুলির মধ্যে কোনও প্রশংসনীয় তাত্পর্য ছিল না

আমার পাঠ্য দ্বারা হাইলাইট নোট। এটিই ভাল ডেটা। এটি একটি ভাল তত্ত্বের উপর ভিত্তি করে একটি সুপরিকল্পিত পরীক্ষা থেকে আসে। আপনার আগ্রহী বিষয়গুলি আহরণের জন্য আপনার কোনও পরিসংখ্যানের প্রয়োজন নেই that তখন কোনও পরিসংখ্যান ছিল না, কম্পিউটারও ছিল না। ফলাফল? একটি সুন্দর মৌলিক সম্পর্ক, যা এখনও ধরে রেখেছে, এবং 6 তম গ্রেডারের দ্বারা বাড়িতে পরীক্ষা করা যেতে পারে।

আমি এই দুর্দান্ত পৃষ্ঠা থেকে উদ্ধৃতি চুরি করেছি ।

আপডেট: সিলভারফিশ মন্তব্যে, পরীক্ষামূলক কণা পদার্থবিজ্ঞানের পরিসংখ্যানের উদাহরণ এখানে । খুব বেসিক, হাহ? সবেমাত্র এমবিএ স্তর ছাড়াই। দ্রষ্টব্য, তারা কীভাবে love ভালবাসে :) তা গ্রহণ করুন, পরিসংখ্যানবিদরা!χ2


2
"যে ক্ষেত্রগুলিতে আপনার ভাল তথ্য রয়েছে আপনার ক্ষেত্রে খুব অল্প পরিসংখ্যানের প্রয়োজন Phys পদার্থবিজ্ঞানের একটি খুব ভাল উদাহরণ" " আমি বিষয়টি দেখতে পাচ্ছি, তবে এটি উল্লেখ করার মতো যে কণা পদার্থবিদদের কাছে প্রচুর পরিমাণে ডেটা রয়েছে এবং এগুলি বিশ্লেষণের জন্য পরিপূর্ণ পরিসংখ্যানের কৌশলগুলি সম্পূর্ণ বিকাশ করেছে।
সিলভারফিশ

@ সিলভারফিশ, আপনি কি আমাকে সেখানে উন্নত পরিসংখ্যানের উদাহরণ দিতে পারেন? আমি যা দেখেছি তা আমাকে খুব বেশি প্রভাবিত করে না। আমার মতে, গড় প্রতিযোগিতা পিএইচডি শিক্ষার্থী বিশ্বমানের কণা পদার্থবিজ্ঞানের চেয়ে আরও পরিসংখ্যান জানবে। পদার্থবিজ্ঞানীরা যে বিষয়ে সত্যই ভাল তা স্ট্যাটিস্টিকাল মেকানিক্সের মতো জিনিস, তবে এটি আমরা "অ্যাডভান্সড স্ট্যাটাস" বলব না তার থেকে অনেকটাই আলাদা। আমি সম্পূর্ণরূপে আপনার সাথে একমত যে তাদের ডেটাসেটগুলি মন বগল, তারা "বিগ ডেটা" বিরক্তিকর বাজে শব্দ হওয়ার আগে তারা বড় ডেটা শুরু করেছিল।
আকসকল 10'15

1
তাদের "আত্মবিশ্বাসের ব্যবধান" বিশেষত প্যারামিটারগুলির জন্য বেশ আকর্ষণীয়ভাবে গ্রহণ করা হয়েছে যা নেতিবাচক হতে পারে না, উদাহরণস্বরূপ দেখুন en.wikedia.org/wiki/CLs_upper_limits_%28
পার্টিকেল_ফিজিক্স

(আমি মনে করি যে কণা পদার্থবিজ্ঞানী হতে হবে এমন সমস্ত পরিসংখ্যানের প্রতিনিধি হিসাবে প্রথম দিনটিকে একটি প্রাথমিক পাঠ্যক্রম গ্রহণ করা অন্যায় হতে পারে!)
সিলভারফিশ

@ আকসাল, আমার ব্যক্তিগত উপলব্ধিটি হল যে প্রায় পাঁচ হাজার-মাত্রিক সংহত হওয়ার পরে খুব কম মডেল অনিশ্চয়তা, যেমন, হার্ড সায়েন্স যেখানে মডেলগুলি শ্রডঞ্জার সমীকরণ আপনাকে যা দেয় তা হ'ল বায়েশিয়ান পদ্ধতিগুলি বিস্মিত করে। অর্থনীতিতে, সম্ভাব্য প্রধান মডেলের অপব্যবহারের পক্ষে দৃ is়ভাবে অনুভূত গবেষণাগুলির মনোনিবেশের ভিত্তিতে বায়সিয়ান পদ্ধতি খুব কমই টিকে থাকবে। (আমি আন্ডারগ্রাজুয়েট ডিগ্রি দ্বারা একজন পদার্থবিজ্ঞানী, যদিও 20+ বছরে কোনও পদার্থবিজ্ঞান করেনি, এবং এখন কাজের লাইনে একটি পরিমাণগত সামাজিক বিজ্ঞানীও
রয়েছেন

2

এই প্রশ্নটি পেশাদার সততার ক্ষেত্রে বলে মনে হচ্ছে।

সমস্যাটি মনে হয় যে হয়: (ক) পর্যাপ্ত ব্যক্তিদের দ্বারা পরিসংখ্যান বিশ্লেষণের পর্যাপ্ত সমালোচনামূলক মূল্যায়ন হয় না বা (খ) সাধারণ জ্ঞানের একটি ক্ষেত্রে পরিসংখ্যানগত ত্রুটি সনাক্ত করার জন্য অপ্রতুল (টাইপ 2 ত্রুটির মতো)?

আমি যখন বিশেষজ্ঞের সীমানার কাছাকাছি থাকি তখন একটি বিশেষজ্ঞদের ইনপুট করার জন্য আমার দক্ষতার ক্ষেত্রটি সম্পর্কে আমি যথেষ্ট জানি। আমি লোকদের এফ-পরীক্ষার মতো জিনিস (এবং এক্সেলের মধ্যে আর-স্কোয়ারড) পর্যাপ্ত জ্ঞান ছাড়াই ব্যবহার করতে দেখেছি।

আমার অভিজ্ঞতায়, শিক্ষাব্যবস্থা, পরিসংখ্যান প্রচারের আমাদের উত্সাহে, সরঞ্জামগুলি অতি-সরল করে তুলেছে এবং ঝুঁকি / সীমাবদ্ধতাকে কমিয়ে দিয়েছে। এটি কি এমন একটি সাধারণ থিম যা অন্যরা অভিজ্ঞতার মুখোমুখি হয়েছিল এবং পরিস্থিতিটি ব্যাখ্যা করবে?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.