মডেলদের ভূমিকা - বোঝার সংবেদনগুলি


46

আপনি যে ফাংশনটির জন্য প্যারামিটারগুলি পাওয়ার চেষ্টা করছেন তা যদি না জানেন তবে কোনও রিগ্রেশন মডেল কীভাবে ব্যবহার করতে পারে?

আমি একটি গবেষণার অংশ দেখেছি যেখানে বলা হয়েছে যে মায়েরা যারা তাদের বাচ্চাদের বুকের দুধ খাওয়ান তাদের পরবর্তী জীবনে ডায়াবেটিসে আক্রান্ত হওয়ার সম্ভাবনা কম থাকে। গবেষণাটি প্রায় 1000 টি মায়েদের সমীক্ষা এবং বিবিধ কারণের জন্য নিয়ন্ত্রিত এবং লগলাইনার মডেল ব্যবহার করা হয়েছিল।

এখন এর অর্থ কি এই যে তারা ডায়াবেটিসের সম্ভাবনা নির্ধারণ করে এমন সমস্ত কারণগুলি বিবেচনা করে যা একটি দুর্দান্ত ফাংশনে ফিট করে (সম্ভবত এটি) লগ সহ লিনিয়ার মডেলটিতে খুব সুন্দরভাবে অনুবাদ করে এবং মহিলার স্তন খাওয়ানো কিনা তা পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ প্রমাণিত হয়েছিল কিনা?

আমি নিশ্চিত কিছু মিস করছি তবে তারা কীভাবে মডেলটি জানবে?


সবাইকে অনেক ধন্যবাদ। আমি আপনার উত্তরগুলি সম্পর্কে ভাবতে এবং কিছুটা সময় ব্যয় করতে চাই, যদি আপনি আমার মতামতগুলির জন্য আমার শর্তে সেগুলি লেখার চেষ্টা করতে আপত্তি করেন না। প্রক্রিয়াটির এই বিবরণটি টেলর সিরিজ থেকে আসা হিসাবে আমি পছন্দ করি। অর্থনীতিবিদদের জন্য অর্থনীতি ও গণিতের মধ্য দিয়ে আমাকে রেগ্রেশন সম্পর্কিত জ্ঞান বাড়াতে হয়েছিল এবং টেলারের সাথে যোগসূত্রটি এটি অনুপস্থিত বলে উল্লেখযোগ্য।
জোনাথন অ্যান্ড্রুজ

আমি আপনার অ্যাকাউন্টগুলি একীভূত করেছি; কিন্তু দয়া করে, রেজিস্টার তা এখানে stats.stackexchange.com/users/login তাই আপনি এটি আবার আলগা না চাই।

উত্তর:


43

এটি সঠিক রূপের লিনিয়ার অনুমান হিসাবে রিগ্রেশনকে দেখতে সহায়তা করে। ধরা যাক আসল সম্পর্কটি

y=f(x1,...,xk)

x1,...,xkyf

f(x1,...,xk)=f(0,...,0)+i=1kf(0)xkxk+ε,

εα0=f(0,...,0)αk=f(0)xk

y=α0+α1x1+...+αkxk+ε

ε


1
হাই, খুব সুন্দর ব্যাখ্যা তবে আমি টেলর সিরিজের সম্প্রসারণের "সিগমা" অংশটি বোঝার জন্য পরিচালনা করি না। আপনি এখানে পাওয়া এই সমীকরণটি কীভাবে হ্রাস করবেন: mathworld.wolfram.com/TaylorSeries.html "দুটি ভেরিয়েবলের মধ্যে একটি টেলর সিরিজের আসল ফাংশন" এর অধীনে আপনার কাছে?
অরুণ

1
n=1

18

এমপিটাসের উত্তরের পরিপূরক, তবে এখনও অবধি উল্লেখ করা হয়নি এমন উত্তরের অন্য দিকটি হ'ল:

"তারা তা করে না, তবে তারা কিছু মডেল কাঠামো ধরে নিয়ে যাওয়ার সাথে সাথে তারা এটি ডেটার বিপরীতে পরীক্ষা করতে পারে "।

দুটি মূল জিনিস যা ভুল হতে পারে তা হ'ল: ফাংশনের ফর্ম , যেমন লগগুলিতে এটি লিনিয়ারও নয়। সুতরাং আপনি প্রত্যাশিত মানগুলির তুলনায় উপযুক্ত অবশিষ্টাংশ প্লট করে শুরু করবেন। বা শর্তসাপেক্ষ বিতরণ পছন্দ , উদাহরণস্বরূপ পর্যবেক্ষণ গণনা Poisson তুলনায় অত্যধিক ছাপিয়ে। সুতরাং আপনি একই মডেলের নেতিবাচক দ্বিপদী সংস্করণের বিরুদ্ধে পরীক্ষা করতে পারেন বা দেখুন যে অতিরিক্ত কোভারিয়েটগুলি অতিরিক্ত পরিবর্তনের জন্য অ্যাকাউন্টে রয়েছে কিনা।

আপনি বিদেশী, প্রভাবশালী পর্যবেক্ষণ এবং অন্যান্য অনেক কিছুর জন্যও পরীক্ষা করতে চান। এই ধরণের মডেল সমস্যাগুলি পরীক্ষা করার বিষয়ে পড়ার জন্য যুক্তিসঙ্গত স্থানটি ক্যামেরন এবং ত্রিবেদী 1998-এর ch.5 (

যদি এই ডায়াগনস্টিকস নির্দেশ করে যে মডেলটি ডেটা মাপসই করতে ব্যর্থ হয়, আপনি মডেলের প্রাসঙ্গিক দিকটি পরিবর্তন করে পুরো প্রক্রিয়াটি আবার শুরু করতে চাই।


1
+1 এটি হ'ল চাবিটি হ্যান্ড-ওয়েভিং থেকে এটিকে সমস্ত কিছু আটকে রাখে: আপনি জানেন না, তবে আপনি কিছু চেষ্টা করে দেখুন এবং এটি কতটা ভাল মেলে এবং কীভাবে এটি আপনার ডেটা মেলে না।
ওয়েইন

15

একটি দুর্দান্ত প্রথম প্রশ্ন! আমি এমপিক্টাসের উত্তরের সাথে একমত, যেমন সংক্ষিপ্ত উত্তরটি "তারা দেয় না, তবে তারা সঠিক মডেলটির প্রায় সীমাবদ্ধতার আশা করে যা প্রায় সঠিক উত্তর দেয়"।

মহামারীবিজ্ঞানের জাগ্রত ক্ষেত্রে, এই মডেল অনিশ্চয়তা ' রেসিডুয়াল কনফাউন্ডিং ' হিসাবে পরিচিত one দেখুন স্টিভ সাইমনের পৃষ্ঠা 'কি অবশিষ্ট বিভ্রান্তি হয়?' একটি ভাল সংক্ষিপ্ত বিবরণের জন্য, বা হাইকো বেচারের 1992 সালের স্ট্যাটিস্টিকস ইন মেডিসিনে (সাবস্ক্রিপশনটি পুনর্বিবেচনার) কাগজটি দীর্ঘতর, আরও গাণিতিক চিকিত্সার জন্য, বা ডেভেল স্মিথ এবং স্টের্নের আমেরিকান জার্নাল অফ এপিডেমিওলজির সাম্প্রতিক গবেষণাপত্রে (সাবস্ক্রিপশন পুনরুদ্ধার করা হবে) )।

এটি একটি কারণ যা ক্ষুদ্র প্রভাবগুলির মহামারীটি কঠিন এবং ফলাফলগুলি প্রায়শ বিতর্কিত হয় - যদি পরিমাপ করা প্রভাবের আকারটি ছোট হয়, তবে এটির ব্যাখ্যা হিসাবে বাকী বিশৃঙ্খলা বা পক্ষপাতের অন্যান্য উত্সগুলি অস্বীকার করা শক্ত।


1
আমি এই মডেলটির অপব্যবহারের পক্ষে যুক্তি দেব - যা মনে হয় ওপি যে বিষয়ে কথা বলছে তা অবশিষ্ট অবকাশ থেকে কিছুটা পৃথক। বিস্মৃত হওয়ার জন্য একটি সমবায়ু প্রয়োজন। আপনি কেবল একটি এক্সপোজার এবং ফলাফলের ভুল ব্যাখ্যা দিয়ে একটি রিগ্রেশন স্ক্রু করতে পারেন ।
ফোমাইট

13

জর্জ বক্সের "মূলত, সমস্ত মডেলগুলি ভুল, তবে কিছু কার্যকর" রয়েছে এর বিখ্যাত উক্তি রয়েছে । মডেলগুলি এর মতো ফিট করার সময়, আমরা তথ্য উত্পন্নকরণ প্রক্রিয়া এবং শারীরিক, বাস্তব জগত, প্রতিক্রিয়া এবং কোভেরিয়েটগুলির মধ্যে সম্পর্ক সম্পর্কে চিন্তা করার চেষ্টা করি (বা উচিত)। আমরা এই সম্পর্কগুলিকে এমন কোনও মডেলে প্রকাশ করার চেষ্টা করি যা ডেটা ফিট করে। বা এটি অন্য উপায়ে বলতে, তথ্য সঙ্গে সামঞ্জস্যপূর্ণ। যেমন একটি অভিজ্ঞতামূলক মডেল উত্পাদিত হয়।

এটি কার্যকর কি না তা পরে নির্ধারিত হয় - এটি কি ভাল, নির্ভরযোগ্য পূর্বাভাস দেয়, উদাহরণস্বরূপ, মহিলাদের জন্য মডেল ফিট করা যায় না? মডেল সহগগুলি কী ব্যাখ্যাযোগ্য এবং বৈজ্ঞানিক ব্যবহারের? প্রভাব আকারগুলি অর্থবহ?


3

আপনি ইতিমধ্যে যে উত্তরগুলি পেয়েছেন তা উত্তম, তবে আমি একটি এপিডেমিওলজিস্টের দৃষ্টিকোণ থেকে একটি (আশাবাদী) পরিপূরক উত্তর দিতে যাচ্ছি। আমার এ সম্পর্কে সত্যিই তিনটি চিন্তাভাবনা রয়েছে:

প্রথম, তারা না। আরও দেখুন: সমস্ত মডেল ভুল, কিছু মডেল দরকারী। লক্ষ্যটি কোনও একক, নির্দিষ্ট সংখ্যা তৈরি করা নয় যা অন্তর্নিহিত ফাংশনের "সত্য" হিসাবে নেওয়া হয়। লক্ষ্যটি হল এর চারপাশের অনিশ্চয়তার পরিমাপের সাথে সেই ফাংশনটির একটি অনুমান উত্পাদন করা , এটি অন্তর্নিহিত ফাংশনের একটি যুক্তিসঙ্গত এবং দরকারী অনুমান।

এটি বিশেষত বড় প্রভাবের ব্যবস্থাগুলির জন্য সত্য। "সত্য" সম্পর্ক 2.5 বা 3.2 হয় এমন একটি গবেষণার "টেক অফ" বার্তাটি 3.0 এর আপেক্ষিক ঝুঁকি খুঁজে পাওয়া সত্যিই আলাদা নয়। @ অনস্টপ যেমন উল্লেখ করেছেন, এটি ছোট প্রভাবের পরিমাপের প্রাক্কলনগুলির সাথে আরও কঠোর হয়, কারণ স্বাস্থ্য ও নীতিগত অবস্থান থেকে 0.9, 1.0 এবং 1.1 এর মধ্যে পার্থক্য বিশাল হতে পারে ।

দ্বিতীয়ত, বেশিরভাগ এপিডেমিওলজি পেপারগুলিতে একটি প্রক্রিয়া লুকানো আছে। এটি আসল মডেল নির্বাচন প্রক্রিয়া । আমরা যে মডেলটি আমরা শেষ করেছিলাম তার প্রতিবেদন করি, আমরা বিবেচনা করি এমন সমস্ত মডেল নয় (কারণ এটি ক্লান্তিকর হবে, যদি কিছুই না থাকে)। এমন অনেকগুলি মডেল বিল্ডিং পদক্ষেপ, ধারণাগত চিত্র, ডায়াগনস্টিকস, ফিটের পরিসংখ্যান, সংবেদনশীলতা বিশ্লেষণ, কম্পিউটারে শপথ গ্রহণ এবং এমনকি ছোট পর্যবেক্ষণমূলক গবেষণার বিশ্লেষণের সাথে জড়িত হোয়াইট বোর্ডগুলিতে স্ক্রিবলিং রয়েছে।

কারণ আপনি যখন হয় অনুমানের করা, তাদের অনেকেই এছাড়াও অনুমানের আপনি না পরীক্ষা করতে হয়।

তৃতীয়, কখনও কখনও আমরা না। এবং তারপরে আমরা সম্মেলনে যাই এবং একে অপরের সাথে এটি নিয়ে তর্ক করি;)

আপনি যদি ক্ষেত্র হিসাবে এপিডেমিওলজির বাদাম এবং বল্টগুলিতে আগ্রহী হন এবং আমরা গবেষণাটি কীভাবে সম্পাদন করি তবে শুরু করার সেরা জায়গাটি সম্ভবত রথম্যান, গ্রিনল্যান্ড এবং ল্যাশের আধুনিক এপিডেমিওলজি 3 য় সংস্করণ । এটি এপিআই গবেষণা কীভাবে পরিচালিত হয় তার একটি পরিমিত প্রযুক্তিগত এবং খুব ভাল ওভারভিউ।


1
+1, এটি এখানে যা আছে তার একটি ভাল পরিপূরক। আরও অনেক ভাল ইতিমধ্যে বিদ্যমান থাকার পরেও দরকারী অবদান এখনও তৈরি করা যায় তা দেখে ভাল লাগল।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.