গবেষক ১,০০০ রিগ্রেশন চালান, গবেষক মাত্র ১ রান করেন, উভয়ই একই ফলাফল পান - তাদের কি আলাদা অনুমান করা উচিত?


12

কল্পনা করুন যে কোনও গবেষক একটি ডেটাসেট অন্বেষণ করছেন এবং 1000 টি আলাদা আলাদা চাপ চালাচ্ছেন এবং তিনি তাদের মধ্যে একটি আকর্ষণীয় সম্পর্ক খুঁজে পেয়েছেন।

এখন কল্পনা করুন একই ডেটা সহ অন্য একজন গবেষক মাত্র 1 রিগ্রেশন চালিয়েছেন এবং দেখা যাচ্ছে যে এটি একই গবেষণাকারী এটির জন্য 1000 রিগ্রেশন নিয়েছিল। গবেষক 2 গবেষককে চেনেন না।।

গবেষক 1 কি গবেষক 2-এর চেয়ে আলাদা ধারণা তৈরি করতে হবে? কেন? উদাহরণস্বরূপ, গবেষক 1 একাধিক তুলনা সংশোধন করা উচিত, কিন্তু গবেষক 2 না করা উচিত?

যদি গবেষক 2 আপনাকে প্রথমে তার একক প্রতিরোধের বিষয়টি দেখায়, আপনি কী অনুগ্রহ করবেন? যদি সেই গবেষক 1 আপনাকে তার ফলাফলগুলি দেখায়, আপনি কি নিজের অনুমান পরিবর্তন করবেন? যদি তাই হয় তবে বিষয়টি কেন উচিত?

পিএস 1 : যদি অনুমান গবেষকদের নিয়ে কথা বলা সমস্যাটিকে বিমূর্ত করে তোলে, তবে এই সম্পর্কে চিন্তা করুন: কল্পনা করুন যে আপনি উপলব্ধ সেরা পদ্ধতির সাহায্যে আপনার কাগজের জন্য কেবল একটি প্রতিরোধের জন্য দৌড়ে এসেছিলেন। তারপরে আর একজন গবেষক আপনার একই দমনটি খুঁজে না পাওয়া পর্যন্ত একই ডেটা সহ 1000 টি আলাদা রিগ্রেশন অনুসন্ধান করেছিলেন । আপনার দুজনকে আলাদা আলাদা অনুমান করা উচিত? প্রমাণ উভয় ক্ষেত্রে একই বা না? আপনি যদি অন্য গবেষকের ফলাফল জানতেন তবে আপনার কি অনুমান পরিবর্তন করা উচিত? জনসাধারণের কীভাবে এই দুটি গবেষণার প্রমাণ মূল্যায়ন করা উচিত?

পিএস 2: দয়া করে নির্দিষ্ট হওয়ার চেষ্টা করুন এবং সম্ভব হলে একটি গাণিতিক / তাত্ত্বিক ন্যায়সঙ্গততা সরবরাহ করুন!


1
একটি বৈধ তুলনা হতে আপনাকে সমস্ত নাল এবং বিকল্প অনুমান নির্দিষ্ট করতে হবে। গবেষক 2 কেবলমাত্র 1 টি অনুমান পরীক্ষা করতে পারেন যখন গবেষক 1 সম্ভবত আপনাকে 1000 এর মধ্যে 1 ধরণের 1 ত্রুটি না করার সম্ভাবনাটি নিয়ন্ত্রণ করতে চায় that যদি এটি একইসাথে অনুমান হয় যা আপনি করতে চান তবে আপনাকে পি-মান সমন্বয় করতে হবে। গবেষক 2 এর একটি পরীক্ষা আছে এবং সামঞ্জস্যের প্রয়োজন নেই। গবেষক 1 এর জন্য আপনি কি একই ডেটাতে বিভিন্ন মডেল ফিট করছেন বা 1000 টি ডাটা সেটের জন্য একটি মডেল ফিট করছেন?
মাইকেল আর চেরনিক

1
@ মিশেল চেরনিক কেবল একটি ডেটাसेट আছে t গবেষক 1 তার পছন্দ মতো একটি না পাওয়া পর্যন্ত একই ডেটাসেটের জন্য 1000 মডেলের ফিট করে। গবেষক 2 কেবল লাগানো 1. উভয় গবেষক একই ডেটা ব্যবহার করেন। সুতরাং আপনি কি বলবেন যে এই দুই গবেষককে ঠিক একই ডেটাসেট দিয়ে বিভিন্ন জিনিস শেষ করতে হবে? গবেষক 2 তার বিশ্লেষণে যথাযথভাবে আত্মবিশ্বাসী হওয়া উচিত, যখন একাধিক তুলনার কারণে গবেষক 1 তার পি-মান / আত্মবিশ্বাসের ব্যবধানগুলি বাড়িয়ে তুলবেন?
স্ট্যাটস্লিয়ার

আপনি যদি আমার যুক্তি অনুসরণ করেন তবে তারা এই অর্থে করেন যে কেবল গবেষক 2 একটি একক অনুমান পরীক্ষা করছেন যখন গবেষক 1 1000 টি অনুমান পরীক্ষা করছেন এবং তার দ্বারা পরীক্ষিত সমস্ত অনুমানের জন্য এটি নিয়ন্ত্রণ করা প্রয়োজন .. এতে দুটি পৃথক সমস্যা জড়িত। "কেবল একটি আকর্ষণীয় সম্পর্ক সন্ধান করা" বলতে যা বোঝায় তা এখনও অস্পষ্ট। হতে পারে আপনি ভাবেন যে আপনি একটি বিপরীতমুখী পরিস্থিতি তৈরি করেছেন। আমি মনে করি না যে আপনার আছে।
মাইকেল আর চেরনিক

1
@ মিশেল চের্নিক কীভাবে একই একই তথ্যের জন্য প্যারাডক্স নয় ঠিক একই মডেলের সাথে দুটি ভিন্ন সিদ্ধান্তে পৌঁছায়? আপনি যদি দুটি পৃথক কাগজ পড়ে থাকেন তবে আপনি কী উপসংহারে পৌঁছবেন?
স্ট্যাটস্লিয়ার

1
@ মিশেল চের্নিক আমি করেছিলাম এবং আমি মনে করি যে আপনি এটিকে সঠিক বলে মনে করছেন --- হুবুহু একই ডেটা, একই একই মডেলের সাথে দুটি পৃথক সিদ্ধান্তে পৌঁছেছে। উত্তরে আমার মন্তব্য দেখুন।
স্ট্যাটস্লিয়ার

উত্তর:


3

1000

আমার মনে হয় যা ঘটছে ... উপরোক্ত প্রশ্নটি থেকে গবেষকদের পূর্বের তথ্যগুলি সম্পর্কে আমরা কী শিখতে পারি ? - গবেষক 1 এর সম্ভবত মডেলগুলির জন্য ফ্ল্যাট রয়েছেP(Mk|I1)=11000P(M1|I2)=1M1

M1P(M1|DI)>>P(M1|I)9991M1100010000pvalue<108

100102,000,000

দুটি ব্যক্তির সাথে মূলত কোনও ভুল নেই যা বিভিন্ন তথ্য দিয়ে শুরু হয় এবং একই ডেটা দেখার পরে বিভিন্ন সিদ্ধান্তে অবিরত থাকে। তবে ... একই ডেটা দেখে তাদের একত্রে আরও কাছাকাছি এনে দেবে, তাদের "মডেল স্পেস" ওভারল্যাপ সরবরাহ করে এবং ডেটা এই "ওভারল্যাপিং অঞ্চল" সমর্থন করে।


সুতরাং আপনার দাবির মূল অংশটি হ'ল তাদের পৃথক অনুকরণ করা উচিত কারণ তাদের বিভিন্ন প্রিয়ার রয়েছে, এবং না কারণ তারা "ডেটা অন্বেষণ করেছেন", সঠিক?
স্ট্যাটসিলনার

যাই হোক, কিভাবে হবে আপনি প্রমাণ মূল্যায়ন? 1 টি গবেষক 1 টি কতগুলি মডেল লাগিয়েছেন সে সম্পর্কে আপনি যত্ন করবেন? যদি তাই হয় তবে কেন?
স্টটস্লায়নার

আমি অগত্যা মডেলগুলির সংখ্যাটি খাপ খাইয়ে দেখব না , তবে মডেলটি ব্যবহৃত হচ্ছে কি না তা কিছুটা সুনিশ্চিততার সাথে পরিচিত। আমি সংক্ষেপে উল্লেখ হিসাবে, আমি যুক্তিসঙ্গত বিকল্প ছিল কিনা তা জানতে চাই। উদাহরণস্বরূপ, যদি গবেষক 1 কোনও ভেরিয়েবল বাদ / যুক্ত হওয়ার বিষয়ে "লাইন বল" সিদ্ধান্ত নেন, তবে আমি সেই উল্লেখটি দেখতে চাই।
সম্ভাব্যতাব্লোগিক

1
আপনি কেন উল্লিখিত দেখতে চান, যে কোনওভাবে আপনার পূর্ব পরিবর্তন করবে? আপনি কি তাকে আগে প্রক্সি হিসাবে ব্যবহার করছেন? আপনি যে ম্যাপিং তৈরি করছেন তা আমার কাছে পরিষ্কার নয়। কোনও নির্দিষ্ট গবেষকের কারণগুলি আপনার অনুমানের জন্য কেন গুরুত্বপূর্ণ, কেননা এটি ডেটা উত্পন্নকরণের প্রক্রিয়াটি মোটেই প্রভাবিত করে না?
স্টটস্লায়নার

1
আমরা এখানে ডেটাসেটটিকে গবেষকের বাহ্যিক হিসাবে বিবেচনা করছি, তিনি তা সংগ্রহ করেননি, এবং উভয় গবেষক একই ডেটা ব্যবহার করেন। এটি মনে হয় যে কারণগুলি মনোবিজ্ঞানের প্রতিরূপে তৈরি করা যায় না, কারণ তারা কেবলমাত্র পাগল অনুমানের বিচার করার জন্য প্রমাণের মান হিসাবে আলগা তাত্পর্যটি ব্যবহার করেন যে কোনও যুক্তিসঙ্গত ব্যক্তি / বিজ্ঞানী তাদের অগ্রাধিকারকে হাস্যকর বলে মনে করতে পারেন। আমাদের কেসটি এখানে দেখুন, যদি আমাদের উদাহরণে পরীক্ষা করা হাইপোথিসিসটি এমন একটি শক্তির উত্থাপনের বিষয়টিকে হাস্যকর কিছু মনে করে, তবে আমরা কী 1 বা 1000 প্রতিক্রিয়া চালিয়েছি তা বিবেচনা করে?
স্ট্যাটস্লায়নার

7

আপনি গাণিতিক চিকিত্সা চেয়ে যা চেয়েছেন তার চেয়ে পরিসংখ্যানগত ব্যাখ্যাটি খুব কম স্পষ্ট।

গণিত পরিষ্কারভাবে সংজ্ঞায়িত সমস্যা সম্পর্কে। যেমন একটি নিখুঁত পাশা ঘূর্ণায়মান, বা একটি কলস থেকে বল অঙ্কন।

পরিসংখ্যান প্রয়োগ করা হয় গণিতে যেখানে গণিত একটি গাইডলাইন সরবরাহ করে তবে এটি সঠিক (সঠিক) সমাধান নয়।

এক্ষেত্রে এটা স্পষ্ট যে পরিস্থিতি একটি গুরুত্বপূর্ণ ভূমিকা পালন করে। আমরা যদি একটি রিগ্রেশন সম্পাদন করি এবং তারপরে শক্তিটি প্রকাশের জন্য কিছু গণিত (গণিত) গণনা করি তবে পি মানটির ব্যাখ্যা (পরিসংখ্যান) এবং মান কী?

  • গবেষক 1 দ্বারা সম্পাদিত 1000 রিগ্রেশনগুলির ক্ষেত্রে ফলাফলটি আরও দুর্বল কারণ যেহেতু যখন আমাদের সত্যিকারের কোনও ক্লু থাকে না এবং কেবলমাত্র ডেটা অন্বেষণ করি তখন এই ধরণের পরিস্থিতি দেখা দেয়। পি মান হ'ল একটি ইঙ্গিত যে কিছু থাকতে পারে।

    সুতরাং পি মানটি গবেষক ১ দ্বারা সম্পাদিত রিগ্রেশনটিতে স্পষ্টতই কম মূল্যবান And (এবং যদি আপনি ভেবে থাকেন যে গবেষক 1 এবং গবেষক 2 এর মধ্যে পার্থক্য যথেষ্ট ছিল না, তবে একাধিক তুলনার জন্য গবেষক 1 টি যে কীভাবে পি মানটি সংশোধন করতে পারে তার প্রচুর উপায়ে চিন্তা করুন)

  • গবেষক 2 দ্বারা সম্পাদিত একক প্রতিরোধের ক্ষেত্রে ফলাফলটি আরও দৃ stronger় প্রমাণ। কিন্তু এটি কারণ কারণ নিজের প্রতিরোধের পক্ষে দাঁড়ায় না। আমরা কারণে অন্তর্ভুক্ত করা আছে কেন গবেষক 2 শুধুমাত্র একটি একক রিগ্রেশন করেনি। এটি হতে পারে কারণ ইতিমধ্যে বিশ্বাস করার জন্য তার একার (অতিরিক্ত) কারণ ভাল ছিল (কারণ) একক রিগ্রেশন তথ্যগুলির জন্য একটি ভাল মডেল।

  • গবেষক 1 এবং 2 দ্বারা সম্পাদিত রিগ্রেশনগুলির সেটিংটি অনেক আলাদা এবং একই সমস্যার জন্য আপনি একইসাথে উভয়ের মুখোমুখি হন না । যদি এটি হয় তবে হয়

    • গবেষক 2 খুব ভাগ্যবান ছিল

      এটি এতটা অস্বাভাবিক নয় এবং সাহিত্যের ব্যাখ্যা দেওয়ার সময় আমাদের এটির জন্য আরও ভাল সংশোধন করা উচিত, পাশাপাশি আমাদের গবেষণার মোট ছবি প্রকাশের উন্নতি করা উচিত। যদি গবেষক 2 এর মতো এক হাজার গবেষক থাকেন এবং আমরা কেবল তাদের মধ্যে একজনকেই একটি সাফল্য প্রকাশ করতে দেখব, তবে অন্য 999 গবেষকের ব্যর্থতা আমরা দেখতে পাইনি বলে আমরা ভুল করে বিশ্বাস করতে পারি যে আমাদের গবেষক 1 এর মতো মামলা নেই 1

    • গবেষক 1 ততটা স্মার্ট ছিলেন না এবং কিছুটা রিগ্রেশনের জন্য অবিশ্বাস্যভাবে অতিরিক্ত প্রয়োজনে অনুসন্ধান করেছিলেন যদিও তিনি সম্ভবত প্রথম থেকেই জানতে পারতেন যে এটিই একক হওয়া উচিত ছিল এবং তিনি আরও শক্তিশালী পরীক্ষা করতে পারতেন।

      বহিরাগতদের যারা গবেষক 1 এর চেয়ে বেশি চৌকস (প্রথম থেকেই অতিরিক্ত 999 রেজিস্ট্রেশনগুলির বিষয়ে চিন্তা করবেন না) এবং কাজটি সম্পর্কে পড়েন, তারা ফলাফলের তাত্পর্যকে আরও শক্তি দিতে পারে, তবে এখনও তিনি ততটা শক্তিশালী নন যে তিনি তার পক্ষে করবেন গবেষক 2 ফলাফল।

      যদিও গবেষক ১৯৯ অতিরিক্ত অতিরিক্ত রিগ্রেশনগুলি সংশোধন করার সময় খুব রক্ষণশীল হতে পেরেছিলেন, তবে আমরা এই সত্যটি উপেক্ষা করতে পারি না যে গবেষণাটি জ্ঞানের শূন্যতায় হয়েছিল এবং প্রকারের চেয়ে 1 ধরণের ভাগ্যবান গবেষক খুঁজে পাওয়ার সম্ভাবনা অনেক বেশি is 2।

একটি আকর্ষণীয় সম্পর্কিত গল্প: জ্যোতির্বিদ্যায়, যখন তারা উচ্চতর নির্ভুলতার সাথে মহাজাগতিক পটভূমি পরিমাপের জন্য আরও ভাল উপকরণের পরিকল্পনা করছিলেন, সেখানে গবেষকরা কেবলমাত্র অর্ধেক তথ্য প্রকাশ করার পক্ষে যুক্তি দেখিয়েছিলেন। এটি কারণ তথ্য সংগ্রহের জন্য কেবল একটি শট। একবার সমস্ত নিবন্ধগুলি কয়েক ডজন বিভিন্ন গবেষক দ্বারা সম্পাদন করা হয়েছে (এবং তাত্ত্বিকের অবিশ্বাস্য প্রকরণ এবং সৃজনশীলতার কারণে, অবশ্যই ডেটাগুলিতে প্রতিটি সম্ভাব্য, এলোমেলো, গাঁথনের উপযুক্ত কিছু আছে), সম্পাদন করার কোনও সম্ভাবনা নেই যাচাই করার জন্য নতুন পরীক্ষা (এটি হ'ল যদি আপনি সম্পূর্ণ নতুন মহাবিশ্ব তৈরি করতে সক্ষম না হন)।


1
@ মার্তিজজন ওয়েটারিংয়ের জন্য +1 হিসাবে আমি আমার মন্তব্যে বলেছি সমস্যাটি গাণিতিকভাবে ভালভাবে উত্থাপিত হয়নি। আমি এই ধারণাটি পেয়েছি যে ওপি ভাবলো যে একটি প্যারাডক্স আছে কারণ দুটি গবেষককে একই মডেল পছন্দ করতে পরিচালিত করা হবে তবে একাধিক তুলনা ইস্যুর প্রয়োজনের কারণে 1000 রিগ্রেশন করা এককে শাস্তি দেওয়া হয়েছে। আমি এটিকে মোটেই প্যারাডক্স হিসাবে দেখছি না (পরিষ্কার নয় তবে আমি মনে করি ওপি করেছে)। আপনি একটি খুব সুন্দর লিখিত এবং সঠিক উত্তর দিয়েছেন যা স্বতঃস্ফূর্তভাবেও ব্যাখ্যা করে যে দুটি মামলা কেন পৃথক। আমি মনে করি ওপি আপনার উত্তর দেওয়া উচিত!
মাইকেল আর চেরনিক


1
এছাড়াও, আমি জানি এটি একটি সাধারণ অনুশীলন, তবে আপনি কি ফলাফল বলতে অন্যের তুলনায় "শক্তিশালী প্রমাণ" বলে ঝামেলা পোষণ করেন না, যখন তারা একই ডেটা উত্পন্ন প্রক্রিয়া থেকে সঠিক একই মডেল এবং ডেটা হয়? তৃতীয় পক্ষের ডেটাটির দিকে কতটা তাকাচ্ছিল তা কেবল ভিন্ন, এবং এটির সাথে ডিজিপি বা সমস্যা সম্পর্কে আপনার পূর্ব বিশ্বাসের সাথে কোনও সম্পর্ক নেই। গবেষক 2 বিশ্লেষণ উদাহরণস্বরূপ, গবেষক 1 এর অজ্ঞতা দ্বারা দাগী করা উচিত?
স্ট্যাটস্লায়নার

1
@ মার্তিজজন ওয়েটারিংস গবেষকের অভিপ্রায়টি কেন ডেটা ব্যাখ্যার জন্য বিবেচনা করা উচিত? যদি আপনি এটি একজন হিউরিস্টিক হিসাবে ব্যবহার করেন, একজন বিশেষজ্ঞ হিসাবে কোনও বিশেষজ্ঞের ফলাফলের ব্যাখ্যা করে থাকেন তবে এটি ঠিক আছে। তবে ডেটা বিশ্লেষণকারী কোনও বিজ্ঞানীর কাছে মনে হয় গবেষকের অভিপ্রায়টি আপনার প্রমাণের ব্যাখ্যায় কোনও ফলদায়ক হওয়া উচিত নয়।
স্ট্যাটস্লিয়ার

1
সুতরাং মনে হচ্ছে আপনি গবেষকের আচরণটি আপনার পূর্বের জন্য প্রক্সি হিসাবে ব্যবহার করছেন । গবেষক যদি ১০০০ টি রিগ্রেশন দৌড়ান, তবে এটি সেই নির্দিষ্ট অনুমানের চেয়ে কম সময়ের সাথে মিলবে। যদি তিনি মাত্র 1 রান করেন তবে এটি এই অনুমানের একটি উচ্চতর পূর্বের সাথে মিলবে correspond যদি আপনার দুটি ক্ষেত্রে থাকে তবে আপনি কোনটি আগে ব্যবহার করবেন তা জানেন না।
স্টটস্লায়নার

1

ছোট গল্প: আপনার প্রশ্নের উত্তর দেওয়ার জন্য আমাদের কাছে পর্যাপ্ত তথ্য নেই কারণ ব্যবহৃত পদ্ধতিগুলি বা সংগৃহীত ডেটা সম্পর্কে আমরা কিছুই জানি না।

দীর্ঘ উত্তর ... এখানে আসল প্রশ্নটি প্রতিটি গবেষক করছেন কিনা:

  • কঠোর বিজ্ঞান
  • কঠোর সিউডোসায়েন্স
  • তথ্য অনুসন্ধান
  • ডেটা ড্রেজিং বা পি-হ্যাকিং

তাদের পদ্ধতিগুলি তাদের ফলাফলগুলির ব্যাখ্যার শক্তি নির্ধারণ করবে। এটি কারণ কিছু পদ্ধতি অন্যদের তুলনায় কম শব্দ হয়।

কঠোর বিজ্ঞানে আমরা একটি হাইপোথিসিস বিকাশ করি, বিভ্রান্তিকর পরিবর্তনশীলগুলি চিহ্নিত করি, আমাদের অনুমানের বাইরে ভেরিয়েবলের জন্য নিয়ন্ত্রণ বিকাশ করি, পরীক্ষার পদ্ধতিগুলি পরিকল্পনা করি, আমাদের বিশ্লেষণী পদ্ধতিটি পরিকল্পনা করি, পরীক্ষা করি / ডেটা সংগ্রহ করি এবং তারপরে ডেটা বিশ্লেষণ করি। (দ্রষ্টব্য যে পরীক্ষা হওয়ার আগে বিশ্লেষণাত্মক পদ্ধতিগুলি পরিকল্পনা করা হয়)। এটি সবচেয়ে কঠোর কারণ আমাদের অবশ্যই এমন ডেটা এবং বিশ্লেষণ গ্রহণ করতে হবে যা অনুমানের সাথে একমত নয়। আকর্ষণীয় কিছু পাওয়ার পরে পদ্ধতির পরিবর্তন করা গ্রহণযোগ্য নয়। অনুসন্ধানগুলি থেকে যে কোনও নতুন অনুমানকে আবার একই প্রক্রিয়াটির মধ্য দিয়ে যেতে হবে।

সিউডোসায়েন্সে আমরা প্রায়শই ইতিমধ্যে সংগ্রহ করা ডেটা নিয়ে থাকি। এটি নৈতিকভাবে ব্যবহার করা আরও কঠিন কারণ ফলাফলগুলিতে বায়াস যুক্ত করা আরও সহজ। তবে এটি এখনও নৈতিক বিশ্লেষকদের জন্য বৈজ্ঞানিক পদ্ধতি অনুসরণ করা সম্ভব। যদিও সঠিক নিয়ন্ত্রণ স্থাপন করা কঠিন হতে পারে এবং এটির গবেষণা এবং উল্লেখ করা দরকার।

তথ্য অনুসন্ধান বিজ্ঞানের উপর ভিত্তি করে নয়। কোন নির্দিষ্ট অনুমান আছে। বিভ্রান্তিকর কারণগুলির একটি অগ্রাধিকার মূল্যায়ন নেই। এছাড়াও, একই তথ্য ব্যবহার করে ফিরে যাওয়া এবং বিশ্লেষণ পুনরায় করা শক্ত, কারণ ফলাফলগুলি পূর্ববর্তী জ্ঞান বা মডেলিংয়ের দ্বারা কলঙ্কিত হতে পারে এবং বৈধতার জন্য ব্যবহার করার জন্য কোনও নতুন ডেটা নেই। অনুসন্ধানের বিশ্লেষণ থেকে প্রাপ্ত সম্ভাব্য সম্পর্কগুলি পরিষ্কার করার জন্য একটি কঠোর বৈজ্ঞানিক পরীক্ষা করার পরামর্শ দেওয়া হয়।

ডেটা ড্রেজিং বা পি-হ্যাকিং হ'ল যেখানে একজন "বিশ্লেষক" অপ্রত্যাশিত বা অজানা উত্তরের প্রত্যাশায় একাধিক পরীক্ষা করে বা ফলাফল পেতে ডেটা ম্যানিপুলেট করে। ফলাফলগুলি সাধারণ কাকতালীয় হতে পারে, বিভ্রান্তিকর পরিবর্তনশীল (গুলি) এর ফলাফল হতে পারে, বা অর্থবোধক প্রভাবের আকার বা শক্তি নাও থাকতে পারে।

প্রতিটি সমস্যার জন্য কিছু প্রতিকার রয়েছে তবে সেই প্রতিকারগুলি যত্ন সহকারে মূল্যায়ন করতে হবে।


1
আমি বিশ্বাস করি আপনি প্রশ্নে অপ্রয়োজনীয় শব্দ যোগ করছেন। ধরুন তারা উপলব্ধ সর্বোত্তম পদ্ধতি ব্যবহার করেছে। তাদের দ্বারা ডেটা সংগ্রহ করা হয়নি, তবে একটি পরিসংখ্যান সংস্থা দ্বারা, তাই তাদের ডেটা সংগ্রহের কোনও নিয়ন্ত্রণ ছিল না। একমাত্র পার্থক্য হ'ল প্রতিটি গবেষক ডেটা কতটা অন্বেষণ করেছিলেন। এর মধ্যে একটি প্রচুর অন্বেষণ করেছে, অন্যটি একবার অনুসন্ধান করেছিল l উভয়ই একই ডেটা দিয়ে একই ফাইনাল মডেল পান। তাদের কি আলাদা অনুমান করা উচিত? এবং এটি আপনার অনুমানকে কীভাবে প্রভাবিত করবে ?
স্ট্যাটসিলনার

এটি অতিরিক্ত গোলমাল নয়। গণিত হ'ল গণিত। যদি মডেলগুলি অভিন্ন হয় তবে তারা অভিন্ন। আপনি কীভাবে মডেলগুলি ব্যাখ্যা করেন তা আপনার সমস্যার সাথে অন্তর্ভুক্ত নয় এমন অন্যান্য সমস্ত ভেরিয়েবলের উপর নির্ভরশীল। আপনি যদি অন্য সমস্ত প্রসঙ্গে এবং ডিজাইন বা পরীক্ষাগুলির সমস্ত উত্তর উপেক্ষা করেন তবে উত্তরটি সহজ, উভয় মডেলই সমানভাবে গাণিতিকভাবে সম্পাদন করে এবং উভয়ই বৈজ্ঞানিকভাবে দুর্বল।
অ্যাডাম স্যাম্পসন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.