আমাদের কি সত্যিই "সমস্ত প্রাসঙ্গিক ভবিষ্যদ্বাণী" অন্তর্ভুক্ত করা দরকার?


15

অনুমানের জন্য রিগ্রেশন মডেলগুলি ব্যবহার করার একটি প্রাথমিক ধারণা হ'ল "সমস্ত প্রাসঙ্গিক ভবিষ্যদ্বাণী" ভবিষ্যদ্বাণী সমীকরণের অন্তর্ভুক্ত করা হয়েছে। যুক্তিটি হ'ল একটি গুরুত্বপূর্ণ আসল-বিশ্ব ফ্যাক্টর অন্তর্ভুক্ত করতে ব্যর্থতা পক্ষপাতদুষ্ট সহগ এবং এইভাবে ভুল ইনফারেন্সগুলি (যেমন, বাদ দেওয়া পরিবর্তনশীল পক্ষপাত) বাড়ে।

কিন্তু গবেষণা বাস্তবে, আমি আছে না যে কেউ সহ দেখা প্রতিম কিছু "সমস্ত প্রাসঙ্গিক ভবিষ্যতবক্তা।" অনেক ঘটনার গুরুত্বপূর্ণ কারণগুলির একটি অগণিত ঘটনা রয়েছে, এবং এগুলি সমস্তকে অন্তর্ভুক্ত করা খুব কঠিন, যদি অসম্ভব না হয়। অফ-দ্য-কফ উদাহরণ হ'ল হতাশাকে মডেলিং করে ফেলেছে ফলাফল হিসাবে: কেউ এমন কোনও মডেলের কাছে এমন কিছু তৈরি করেনি যার মধ্যে "সমস্ত প্রাসঙ্গিক চলক" অন্তর্ভুক্ত থাকে: যেমন, পিতামাতার ইতিহাস, ব্যক্তিত্বের বৈশিষ্ট্য, সামাজিক সমর্থন, আয়, তাদের মিথস্ক্রিয়া ইত্যাদি, ইত্যাদি ...

তদ্ব্যতীত, এই জাতীয় জটিল মডেল ফিট করা খুব অস্থির অনুমানের দিকে নিয়ে যায় যদি না খুব বড় আকারের নমুনার আকার থাকে।

আমার প্রশ্নটি খুব সহজ: "সমস্ত প্রাসঙ্গিক ভবিষ্যদ্বাণীকে" অন্তর্ভুক্ত করার অনুমান / পরামর্শটি কি কেবল এমন কিছু যা আমরা "বলি" তবে বাস্তবে কখনই বোঝায় না? যদি তা না হয় তবে আমরা কেন এটি প্রকৃত মডেলিংয়ের পরামর্শ হিসাবে দেব?

এবং এর অর্থ কি বেশিরভাগ সহগগুলি সম্ভবত বিভ্রান্তিকর? (যেমন, ব্যক্তিত্বের কারণ এবং হতাশার উপর একটি গবেষণা যা কেবলমাত্র বেশ কয়েকটি ভবিষ্যদ্বাণী ব্যবহার করে)। অন্য কথায়, আমাদের বিজ্ঞানের সিদ্ধান্তে এটি কতটা বড় সমস্যা?


6
এই তর্কটির একটি সংস্করণ মনোবিজ্ঞান, অর্থশাস্ত্র এবং 19 শতকের জুড়ে সামাজিক বিজ্ঞানে ছড়িয়ে পড়ে। বিজ্ঞানীরা যুক্তি দিয়েছিলেন যে পরিসংখ্যানগত পদ্ধতিগুলি মানুষ এবং সামাজিক ব্যবস্থাগুলির জন্য প্রযোজ্য নয় কারণ মানুষ খুব বৈচিত্রময় এবং জটিল। এই শতাব্দীর শেষের দিকে, দর্শনের উপর ইউটিলিটি জিতে যায়: এমনকি যখন আমরা সমস্ত ভবিষ্যদ্বাণীকারীকে অন্তর্ভুক্ত না করি, তখনও আমরা অনেক কিছু শিখতে পারি। শিরোনাম বাক্যাংশে "প্রাসঙ্গিক" অন্তর্ভুক্তিতে প্রজ্ঞা রয়েছে।
whuber

উত্তর:


18

আপনি ঠিক বলেছেন - "সমস্ত প্রাসঙ্গিক ভবিষ্যদ্বাণীকারী" বলার ক্ষেত্রে আমরা খুব কমই বাস্তববাদী। অনুশীলনে আমরা ভবিষ্যদ্বাণীকারীদের সাথে সন্তুষ্ট হতে পারি যা পরিবর্তনের প্রধান উত্সগুলি ব্যাখ্যা করে । একটি পর্যবেক্ষণ গবেষণায় ঝুঁকিপূর্ণ কারণ বা চিকিত্সা সম্পর্কে অঙ্কন অনুকরণের বিশেষ ক্ষেত্রে, এটি খুব কমই যথেষ্ট। এটার জন্য চাহিদা বিভ্রান্তি জন্য সমন্বয় অত্যন্ত Agressive হতে, ভেরিয়েবল সহ পারে পরিণতি এর সাথে সম্পর্কিত করা এবং পারে চিকিত্সা পছন্দ বা ঝুঁকি আপনি প্রচার করার চেষ্টা করছেন এর সাথে সম্পর্কিত করা।ওয়াই

এটি আগ্রহী যে স্বাভাবিক রৈখিক মডেলটির সাথে বাদ দেওয়া covariates, বিশেষত যদি অর্থোগোনালকে অন্তর্ভুক্ত কোভেরিয়েটগুলিকে কেবল ত্রুটি শব্দটি ব্যাখ্যা করার জন্য বিবেচনা করা যায়। ননলাইনার মডেলগুলিতে (লজিস্টিক, কক্স, আরও অনেক) ভেরিয়েবল বাদ দেওয়া মডেলের অন্তর্ভুক্ত সমস্ত ভেরিয়েবলের প্রভাব পক্ষপাত করতে পারে (উদাহরণস্বরূপ প্রতিকূলতার অনুপাতের অ-সঙ্কোচনের কারণে)।


সহায়ক তথ্যের জন্য আপনাকে ধন্যবাদ। চিকিত্সার প্রভাবগুলি নির্ধারণ করে আলাদা করে রেখে, আমি এই সমস্যাটির ব্যবহারিক প্রভাব সম্পর্কে আরও জানতে চাই। আপনি যদি একটি কাগজ পর্যালোচনা করেন এবং স্পষ্টভাবে গুরুত্বপূর্ণ ভবিষ্যদ্বাণী বাদ দেওয়া থাকে, তা কি প্রত্যাখ্যানের কারণ হতে পারে? আমি এটি জিজ্ঞাসা করেছি কারণ ক।) আমি এই ঘটনার কথা কখনও শুনিনি এবং খ।) সামাজিক বিজ্ঞানীরা প্রায়শই কেবলমাত্র ভবিষ্যদ্বাণীদের অন্তর্ভুক্ত করে যেগুলি তারা (যেমন, গবেষণার বিষয়) এবং "ইতিমধ্যে পরিচিত" বিষয়গুলি সম্পর্কে অবহেলা ( আরও কার্যকর পরিমাপের প্রয়োজনের ভিত্তিতে)।
এটিজে

উদাহরণস্বরূপ, অন্তঃসত্ত্বা ভেরিয়েবলের জন্য কেবল একটি একক ভবিষ্যদ্বাণীযুক্ত একটি সুপ্ত পরিবর্তনশীল মডেলটি দেখা অস্বাভাবিক নয়। এটি কি বাস্তবের ক্ষেত্রগুলিতে পরিসংখ্যানের ক্ষেত্র এবং এর প্রয়োগের মধ্যে ব্যবধানের কথা বলে?
এটিজে

6
এটা সম্ভবত আছে। প্রত্যাখ্যানের আগের প্রশ্নের ভিত্তিতে গুরুত্বপূর্ণ পরিবর্তনশীল বাদ দেওয়া অন্তর্ভুক্ত থাকবে যার অন্তর্ভুক্তিতে অন্তর্ভুক্ত ভেরিয়েবলগুলির একটি পৃথক ব্যাখ্যা দেওয়া হত, বা যা মডেলটিকে তীব্রভাবে পরিবর্তিত করতে পারে। আমি একবার ফুসফুসের ক্যান্সারের ঝুঁকি নিয়ে এমন একটি কাগজ পর্যালোচনা করেছিলাম যা কেবল কোনও বিষয়ই ধূমপান করেছে কিনা তা কেবল উপলভ্য ছিল এবং লেখকরা ধূমপানের ডোজ (যেমন, প্যাক-বছর) মূল্যায়ন করার চেষ্টা করেন নি। আমি সরাসরি প্রত্যাখ্যান করার পরামর্শ দিয়েছি।
ফ্র্যাঙ্ক হ্যারেল

9

হ্যাঁ, আপনাকে অবশ্যই সমস্ত "প্রাসঙ্গিক চলক" অন্তর্ভুক্ত করতে হবে তবে আপনাকে অবশ্যই এটি সম্পর্কে স্মার্ট হতে হবে। সম্পর্কহীন স্টাফ থেকে আপনার ঘটনাটির প্রভাবকে বিচ্ছিন্ন করতে পারে এমন পরীক্ষাগুলি তৈরির উপায়গুলির বিষয়ে আপনাকে অবশ্যই ভাবতে হবে, যা বাস্তব জগতের (শ্রেণিকক্ষের বিপরীতে) প্রচলিত গবেষণা। আপনি পরিসংখ্যানে Beforeোকার আগে, আপনাকে আপনার ডোমেনে ভারী উত্তোলন করতে হবে, পরিসংখ্যান নয়।

আমি আপনাকে সমস্ত প্রাসঙ্গিক ভেরিয়েবলগুলি অন্তর্ভুক্ত করার বিষয়ে উদাসীন না হওয়ার জন্য উত্সাহিত করি, কারণ এটি কেবল একটি মহৎ লক্ষ্য নয়, কারণ এটি প্রায়শই সম্ভব। আমরা কেবল এটি বলার খাতিরে এটি বলি না। আমরা সত্যই এটি বোঝাতে চাই। প্রকৃতপক্ষে, সমস্ত প্রাসঙ্গিক চলকগুলিকে অন্তর্ভুক্ত করতে সক্ষম পরীক্ষা-নিরীক্ষা এবং অধ্যয়নের নকশা হ'ল বিজ্ঞান সত্যই আকর্ষণীয় করে তোলে এবং যান্ত্রিক বয়লার প্লেট "পরীক্ষা-নিরীক্ষা" থেকে আলাদা।

আমার বক্তব্যকে অনুপ্রাণিত করার জন্য, আমি গ্যালিলিও কীভাবে ত্বরণ নিয়ে পড়াশোনা করেছিলেন তার একটি উদাহরণ দেব। এখানে তার বাস্তব পরীক্ষার বর্ণনা রয়েছে ( এই ওয়েব পৃষ্ঠা থেকে ):

কাঠের moldালাই বা স্ক্যানলিংয়ের একটি টুকরো, প্রায় 12 হাত লম্বা, আধ হাত প্রস্থ এবং তিনটি আঙুল-প্রস্থ পুরু, নেওয়া হয়েছিল; তার প্রান্তে প্রস্থে একটি আঙুলের চেয়ে কিছুটা বেশি একটি চ্যানেল কেটে দেওয়া হয়েছিল; এই খাঁজটিকে খুব সোজা, মসৃণ এবং মসৃণ করে তৈরি করেছি এবং এটিকে পারচমেন্টের সাথে রেখাযুক্ত করে যতটা সম্ভব মসৃণ এবং মসৃণ করা হয়েছে, আমরা এটির সাথে শক্ত, মসৃণ এবং খুব গোলাকার ব্রোঞ্জের বলটি ঘুরিয়েছিলাম। এই বোর্ডটি একটি opালু অবস্থানে রেখে, এক প্রান্তটি অন্য এক বা দুটি হাতের ওপরে উপরে তুলে দিয়ে আমরা বলটি ঘুরিয়ে দিয়েছিলাম, যেমনটি আমি কেবল বলছিলাম, চ্যানেল বরাবর, লক্ষণীয়ভাবে, বর্তমানে বর্ণনা করার মতো একটি পদ্ধতিতে, প্রয়োজনীয় সময় বংশোদ্ভূত করা সময়টিকে যথার্থতার সাথে পরিমাপ করার জন্য আমরা এই পরীক্ষাকে একাধিকবার পুনরাবৃত্তি করেছি যাতে দুটি পর্যবেক্ষণের মধ্যে বিচ্যুতি কখনও নাড়ি-বীটের দশমাংশ ছাড়িয়ে যায় না। এই অপারেশনটি সম্পাদন করে এবং এর নির্ভরযোগ্যতার জন্য নিজেকে আশ্বস্ত করে আমরা এখন বলটিকে চ্যানেলের দৈর্ঘ্যের এক-চতুর্থাংশ ঘুরিয়েছি; এবং এর উত্থানের সময়টি পরিমাপ করে আমরা এটি দেখতে পেয়েছি যে পূর্ববর্তীটির প্রায় অর্ধেক। এরপরে আমরা অন্যান্য দূরত্বের চেষ্টা করেছিলাম, পুরো দৈর্ঘ্যের সময়টিকে অর্ধেকের সাথে, বা দুই-তৃতীয়াংশ, বা তিন-চতুর্থাংশের সাথে, বা কোনও ভগ্নাংশের জন্য তুলনায়; এই ধরনের পরীক্ষায়, পুরো একশবার বারবার পুনরাবৃত্তি করে আমরা সর্বদা দেখতে পেলাম যে ফাঁকা স্থানগুলি একে অপরের কাছে সময়ের স্কোয়ার হিসাবে ছিল এবং এটি বিমানের সমস্ত প্রবণতার জন্য, অর্থাৎ চ্যানেলের জন্য সত্য ছিল, যার সাথে আমরা ঘুরিয়েছিলাম বল। আমরা আরও লক্ষ্য করেছি যে উত্থানের সময়গুলি, বিমানের বিভিন্ন প্রবণতার জন্য একে অপরের কাছে যথাযথভাবে অনুপাত নিয়েছিল যা আমরা পরে দেখব,

সময়ের পরিমাপের জন্য, আমরা জলের একটি বৃহত পাত্রটি একটি উন্নত অবস্থানে রেখেছি; এই জাহাজের নীচে ছোট ব্যাসের একটি পাইপ সোল্ডার করা হয়েছিল যা একটি ছোট পাতলা জল সরবরাহ করেছিল যা আমরা প্রতিটি বংশদ্ভূতকালে একটি ছোট গ্লাসে সংগ্রহ করি, এটি চ্যানেলের পুরো দৈর্ঘ্যের জন্য বা তার দৈর্ঘ্যের অংশের জন্য; এইভাবে সংগৃহীত জলটি খুব নিখুঁত ভারসাম্যের উপরে, প্রতিটি উত্থানের পরে ওজন করা হত; এই ওজনের পার্থক্য এবং অনুপাত আমাদের সময়ের পার্থক্য এবং অনুপাত দিয়েছে, এবং এটি এমন নির্ভুলতার সাথে যে অপারেশনটি বহুবার, বহুবার পুনরাবৃত্তি করা হলেও ফলাফলগুলির মধ্যে কোনও প্রশংসনীয় তাত্পর্য ছিল না।

=টি2,
টি0=1টি0আমিটিআমি0/আমিটি02/টিআমি2
0আমি=টি02টিআমি2

তিনি কীভাবে সময় মাপলেন সেদিকে মনোযোগ দিন। এটি এতটা অপরিশোধিত যে এটি আজকে অপ্রাকৃত বিজ্ঞানগুলি কীভাবে তাদের ভেরিয়েবলগুলি পরিমাপ করে "গ্রাহক সন্তুষ্টি" বা "ইউটিলিটি" সম্পর্কে ভাবেন তা মনে করিয়ে দেয়। তিনি উল্লেখ করেছেন যে পরিমাপ ত্রুটিটি সময়ের এককের দশম দশকের মধ্যে ছিল, বিটিডাব্লু।

তিনি কি সমস্ত প্রাসঙ্গিক চলক অন্তর্ভুক্ত করেছিলেন? হ্যাঁ সে করেছে. এখন, আপনাকে বুঝতে হবে যে সমস্ত দেহ মাধ্যাকর্ষণ দ্বারা একে অপরের প্রতি আকৃষ্ট হয়। সুতরাং, তত্ত্ব অনুসারে বলটির সঠিক শক্তি গণনা করতে আপনাকে মহাবিশ্বের প্রতিটি দেহকে সমীকরণে যুক্ত করতে হবে। তদুপরি, আরও গুরুত্বপূর্ণ বিষয় তিনি পৃষ্ঠতল প্রতিরোধের, বায়ু টানা, কৌণিক গতিবেগ ইত্যাদি অন্তর্ভুক্ত না এই সমস্ত কি তার পরিমাপকে প্রভাবিত করেছিল? হ্যাঁ. তবে, তিনি যে বিষয়ে পড়াশুনা করছিলেন তার সাথে এগুলি প্রাসঙ্গিক ছিল না কারণ তিনি যে পড়াশুনা করছিলেন তার সম্পত্তির প্রভাবকে বিচ্ছিন্ন করে তাদের প্রভাব হ্রাস করতে বা দূর করতে সক্ষম হয়েছিলেন।

টি2


তার সময় পরিমাপের পদ্ধতি সম্পর্কে এতটা অশোধিত কী? সেটআপটিতে একটি নির্দিষ্ট হার থাকবে যাতে জল বড় পাত্রটি ছেড়ে কাপে প্রবেশ করবে; ধারনা করে যে পাত্রটিতে প্রচুর পরিমাণে জল রয়েছে, সেই হারটি খুব কম পরিবর্তিত হবে change আরও গুরুত্বপূর্ণ বিষয়, এটি পরীক্ষাগুলি জুড়ে ধারাবাহিক থাকবে। এটি আসলে খুব মার্জিত পদ্ধতি প্রদত্ত যা তাদের কাছে স্টপওয়াচ এবং অভিনব স্বয়ংক্রিয় টাইমার নেই then
জ্যাব

@ জ্যাব, অবশ্যই ঘড়িটি বন্ধ করার বা সময়ের পরিমাপের আধুনিক উপায়গুলির তুলনায় এটি অশোধিত course আপনি একদম ঠিক বলেছেন যে গ্যালিলিওর দিনগুলিতে সময় পরিমাপের শিল্পের অবস্থা দেওয়া খুব মার্জিত। যাইহোক, আমি যে বিষয়টিটি বলছিলাম তা হ'ল এইরকম আপাতদৃষ্টিতে কম নির্ভুলতা (একটি অন্তরালের 1/10) এখনও সময় এবং দূরত্বের মধ্যে সম্পর্কটি পর্যবেক্ষণ করার জন্য যথেষ্ট ছিল
আকাকাল

@JAB, পদার্থবিদ্যা হাস্যকর পরিমাপ পদ্ধতি আমার প্রিয় উদাহরণ এক কিভাবে চেরেংকভ তার আবিষ্কৃত হয় বিকিরণ । তার চোখ অন্ধকারের সাথে সামঞ্জস্য না হওয়া পর্যন্ত তিনি অন্ধকার ঘরে বসে থাকবেন, তারপরে আলোটি অদৃশ্য হওয়া অবধি আলো থেকে আগত গর্তটি খুলতে বা বন্ধ করতে চাইবেন। তেজস্ক্রিয়তার মাত্রা সনাক্ত করতে তিনি কত গর্ত খুলেছিলেন তা রেকর্ড করছিলেন। স্পষ্টতই, মানুষের চোখ কয়েক মুঠো ফোটনের মধ্যে পরিমাপ করা আলোর পার্থক্য সনাক্ত করতে পারে! কাগজটি 3 পৃষ্ঠার দীর্ঘ।
আকসকল

6

রিগ্রেশন মডেলটির অনুমানগুলি পুরোপুরি ধরে রাখতে, সমস্ত প্রাসঙ্গিক ভবিষ্যদ্বাণীকে অবশ্যই এতে অন্তর্ভুক্ত করা উচিত। তবে কোনও পরিসংখ্যানগত বিশ্লেষণের কোনও অনুমানই নিখুঁতভাবে ধারণ করে না এবং পরিসংখ্যান অনুশীলনের বেশিরভাগ অংশ "ক্লোজ ইনফ" এর উপর ভিত্তি করে নয়।

পরীক্ষাগুলির নকশা এবং যথাযথ র‌্যান্ডমাইজেশনের মাধ্যমে, মডেলগুলিতে অন্তর্ভুক্ত না থাকা শর্তগুলির প্রভাবটি প্রায়শই উপেক্ষা করা যেতে পারে (র্যান্ডমাইজেশনের সম্ভাবনার দ্বারা সমান ধরে নেওয়া)। তবে, মডেলটিতে অন্তর্ভুক্ত না হওয়া সমস্ত সম্ভাব্য ভেরিয়েবলের জন্য যখন পূর্ণ র্যান্ডমাইজেশনকে অ্যাকাউন্ট করা সম্ভব হয় না তখন সাধারণত রিগ্রেশন ব্যবহৃত হয়, সুতরাং আপনার প্রশ্নটি গুরুত্বপূর্ণ হয়ে ওঠে।

খুব সুন্দর প্রতিটি প্রতিরোধের মডেল সম্ভবত কিছু সম্ভাব্য ভবিষ্যদ্বাণী অনুপস্থিত, তবে আরও কোনও ব্যাখ্যা ছাড়াই "আমি জানি না" কাজ করা পরিসংখ্যানবিদদের কাজ করতে দেবে না, তাই আমরা আমাদের যথাসাধ্য চেষ্টা করি এবং তারপরে কতটা পার্থক্য তা কার্যকর করার চেষ্টা করি অনুমান এবং বাস্তবতার মধ্যে আমাদের ফলাফল প্রভাবিত করবে। কিছু ক্ষেত্রে অনুমানগুলি থেকে পার্থক্য খুব সামান্য পার্থক্য করে এবং আমরা পার্থক্য সম্পর্কে খুব বেশি চিন্তা করি না, তবে অন্যান্য ক্ষেত্রে এটি খুব মারাত্মক হতে পারে।

একটি বিকল্প যখন আপনি জানেন যে এমন ভবিষ্যদ্বাণীকারী থাকতে পারে যা মডেলটির অন্তর্ভুক্ত ছিল না যা প্রাসঙ্গিক হবে তা হ'ল সংবেদনশীলতা বিশ্লেষণ করা। নিরক্ষিত পরিবর্তনশীল (গুলি) এর সাথে সম্ভাব্য সম্পর্কের ভিত্তিতে কতটা পক্ষপাত সম্ভব হবে তা পরিমাপ করে। এই কাগজ:

লিন, ডিওয়াই এবং সোস্যাটি, বিএম এবং ক্রোনমাল, আরএ। (1998): পর্যবেক্ষণ অধ্যয়নগুলিতে নিরপেক্ষ কনফাউন্ডারদের প্রতি সংবেদনশীলতার ফলাফলের সংবেদনশীলতার ফলাফল নির্ধারণ করা। বায়োমেট্রিকস, 54 (3), সেপ্টেম্বর, পিপি 948-963।

সংবেদনশীলতা বিশ্লেষণের কিছু সরঞ্জাম (এবং উদাহরণ) দেয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.