একটি স্বাধীন ভেরিয়েবল হিসাবে একটি ক্রিয়াকলাপ সময় ব্যয়


14

আমি লিনিয়ার মডেলটিতে একটি স্বাধীন ভেরিয়েবল হিসাবে কিছু করতে ব্যয় করা সময়কে (উদাহরণস্বরূপ সপ্তাহের দুধ খাওয়ানো) অন্তর্ভুক্ত করতে চাই। তবে কিছু পর্যবেক্ষণ আচরণে মোটেই জড়িত নয়। তাদের 0 হিসাবে কোডিং করা সত্যই সঠিক নয়, কারণ 0 কোনও মান থেকে গুণগতভাবে আলাদা> 0 (যেমন যে মহিলারা বুকের দুধ খাওয়ান না এমন মহিলারা তাদের থেকে খুব আলাদা হতে পারেন, এমনকি যারা খুব বেশি দিন এটি করেন না)। আমি যে সেরাটি নিয়ে আসতে পারি তা হ'ল একটি ডমিগুলির সেট যা ব্যয় করা সময়কে শ্রেণিবদ্ধ করে তবে এটি মূল্যবান তথ্যের অপচয়। শূন্য-স্ফীত পোইসনের মতো কিছুও একটি সম্ভাবনার মতো বলে মনে হচ্ছে তবে এই প্রসঙ্গে এটির মতো দেখতে আমি ঠিক বুঝতে পারি না। যে কেউ কোন পরামর্শ আছে?

উত্তর:


16

@ কেন-বাটলার এর উত্তরে কিছুটা প্রসারিত করতে। অবিচ্ছিন্ন চলক (ঘন্টা) এবং একটি বিশেষ মান (ঘন্টা = 0, বা বুকের দুধ খাওয়ানো) এর জন্য একটি সূচক ভেরিয়েবল উভয় যোগ করে আপনি মনে করেন যে "অ-বিশেষ" মানের জন্য একটি রৈখিক প্রভাব আছে এবং এর মধ্যে একটি পৃথক জাম্প রয়েছে বিশেষ মান হিসাবে পূর্বাভাস ফলাফল। এটি কোনও গ্রাফটি দেখতে (আমার পক্ষে কমপক্ষে) সহায়তা করে। নীচের উদাহরণে আমরা প্রতি সপ্তাহে ঘন্টার একটি ফাংশন হিসাবে প্রতি ঘন্টার মজুরির মডেল করি যা উত্তরদাতারা (সমস্ত মহিলা) কাজ করে এবং আমরা মনে করি যে "স্ট্যান্ডার্ড" সম্পর্কে প্রতি সপ্তাহে 40 ঘন্টা সম্পর্কে কিছু বিশেষ রয়েছে:

এখানে চিত্র বর্ণনা লিখুন

এই গ্রাফটি (স্টাটাতে) উত্পাদিত কোডটি এখানে পাওয়া যাবে: http://www.stata.com/statalist/archive/2013-03/msg00088.html

সুতরাং এই ক্ষেত্রে আমরা অবিচ্ছিন্ন ভেরিয়েবলকে একটি মান 40 নির্ধারণ করেছি যদিও আমরা এটি চেয়েছিলাম যে এটি অন্যান্য মানগুলির থেকে পৃথকভাবে বিবেচিত হবে। একইভাবে, আপনি আপনার সপ্তাহগুলি স্তন্যপান করানোর মান 0 দিবেন যদিও আপনি ভাবেন যে এটি অন্যান্য মানের থেকে গুণগতভাবে পৃথক। আমি নীচে আপনার মন্তব্যের ব্যাখ্যা করি যে আপনি ভাবেন যে এটি একটি সমস্যা। এটি কেস নয় এবং আপনার কোনও ইন্টারঅ্যাকশন শব্দ যুক্ত করার দরকার নেই। প্রকৃতপক্ষে, আপনি যদি চেষ্টা করে থাকেন তবে সেই আন্তঃসংযোগ শব্দটি নিখুঁত কোলাইনারিটির কারণে বাদ দেওয়া হবে। এটি কোনও সীমাবদ্ধতা নয়, এটি আপনাকে কেবল বলে দেয় যে ইন্টারঅ্যাকশন শর্তাদি কোনও নতুন তথ্য যুক্ত করে না।

আপনার প্রতিরোধ সমীকরণটি দেখতে দেখতে বলে:

y^=β1weeks_breastfeeding+β2non_breastfeeding+

যেখানে হল স্তন্যপান করানোর সপ্তাহের সংখ্যা (বুকের দুধ খাওয়ান না তাদের ক্ষেত্রে 0 এর মান সহ) এবং n o n _ b r e a s t f e e d i n g হল একটি সূচক ভেরিয়েবল যা 1 হয় যখন কেউ বুকের দুধ খাওয়ান না এবং অন্যথায় 0 হয়।weeks_breastfeedingnon_breastfeeding

কেউ বুকের দুধ খাওয়ালে কী ঘটে তা বিবেচনা করুন। রিগ্রেশন সমীকরণ এতে সরল করে:

y^=β1weeks_breastfeeding+β20+=β1weeks_breastfeeding+

সুতরাং যারা বুকের দুধ খাওয়ান তাদের জন্য বুকের দুধ খাওয়ানোর সপ্তাহের সংখ্যার মধ্যে কেবল 1 β1

কেউ যখন বুকের দুধ খাওয়াচ্ছেন না তখন কী ঘটছে তা বিবেচনা করুন:

y^=β10+β21+=β2+

সুতরাং আপনাকে বুকের দুধ না খাওয়ানোর প্রভাব দেয় এবং সমীকরণ থেকে কয়েক সপ্তাহের স্তন্যপান করানো হয় dropsβ2

আপনি দেখতে পাচ্ছেন যে কোনও ইন্টারঅ্যাকশন শব্দ যুক্ত করার কোনও ব্যবহার নেই, কারণ সেখানে ইন্টারঅ্যাকশন শব্দটি ইতিমধ্যে (অন্তর্নিহিত) রয়েছে।

যদিও সম্পর্কে অদ্ভুত কিছু রয়েছে যদিও এটি স্তন্যদানকারীদের সাথে বুকের দুধ খাওয়ান না তাদের প্রত্যাশিত ফলাফলের তুলনা করে বুকের দুধ খাওয়ানোর প্রভাবটি পরিমাপ করে তবে কেবল 0 সপ্তাহে ... এটি এক ধরণের "তুলনা" করে তোলে যেমন "ধরণের উপায়, তবে ব্যবহারিক উপযোগিতা তাত্ক্ষণিকভাবে স্পষ্ট নয়। 12 সপ্তাহে (প্রায় 3 মাস) বুকের দুধ খাওয়ানো মহিলাদের সাথে "অ-বুকের দুধ খাওয়ানো" তুলনা করা আরও অর্থবোধ করতে পারে। যে ক্ষেত্রে আপনি শুধু "অ breastfeeders" জন্য মান 12 দিতে W গুলি : _ একটি গুলি টন আমি এন জিβ2weeks_breastfeeding। মান আপনাকে বরাদ্দ সুতরাং অর্থে এটি যাদের "অ সঙ্গে নির্ধারণ করে -ব্রেস্টফিডার "তুলনা করা হয়। কোনও সমস্যার পরিবর্তে এটি আসলে এমন কিছু যা বেশ কার্যকর হতে পারে। "অ-breastfeeders" জন্য রিগ্রেশন সহগ প্রভাবিত করে β 2weeks_breastfeedingβ2


1
আমি উত্তরটির (এবং অন্যদের) প্রশংসা করি, তবে এটি গ্রহণ করতে আমার খুব কষ্ট হচ্ছে। যদি আমি একটি 1: 0 এবং অবিচ্ছিন্ন সময় পরিবর্তনশীল অন্তর্ভুক্ত করি তবে আমি এখনও স্তনবিহীন ফিডারগুলিকে সময়ের জন্য একটি মূল্য নির্ধারণ করতে হবে (অন্যথায় তারা নিখোঁজ সহ-প্রকরণের জন্য বাদ দেয়)। এমনকি 1: 0 ভেরিয়েবলের শর্তসাপেক্ষেও আমি দেখতে পাচ্ছি না যে কীভাবে স্তনহীন-ফিডারগুলি অন্তর্ভুক্ত করে সময় = 0 রিগ্রেশন সহগকে প্রভাবিত করে না। সম্ভবত এই দুটিয়ের মধ্যে পণ্য মিথস্ক্রিয়া শব্দটি যুক্ত করা আরও অর্থবোধ করবে?
ডিএল ডাহলি

@ ডিএলডাহলি এই সন্দেহগুলি মোকাবেলায় আমি আমার উত্তর সম্পাদনা করেছি
মার্টেন বুইস

ঠিক আছে, এটি খুব সহায়ক। আমাকে আরও একটি দ্রুত ফলোআপ জিজ্ঞাসা করতে দাও ... আমি যদি আপনাকে সঠিকভাবে বুঝতে পারি তবে আমি B2 = 1 জনগণকে সময়-মানটি নির্বিশেষে বি 1 এর আনুমানিক মান একই হওয়া উচিত। এটা কি সঠিক?
ডিএল ডাহলি

1
খুব সুন্দর প্রতিক্রিয়া মার্টেন। এখানে একটি অনুরূপ প্রশ্ন / উত্তর এখানে একটি স্বাধীন ভেরিয়েবল যা কেবলমাত্র একটি নির্দিষ্ট সাবগ্রুপের সাথে সম্পর্কিত একইরকম পরিস্থিতি দেখায় ।
অ্যান্ডি ডব্লিউ

1
@ গ্যাভিনএম.জোনস আমি এর নামকরণ করার বা এটি উদ্ধৃত করার প্রয়োজনের কথা কখনও ভাবি নি: এটি কেবল ধারাবাহিক এবং সূচক ভেরিয়েবলের সহজবোধ্য প্রয়োগ। ফলস্বরূপ আপনার কাছে আমার পক্ষে ভাল রেফারেন্স নেই। যে জিনিসটি আমি দ্রুত খনন করতে পারি তা হ'ল ট্রেইম্যান, ডিজে (২০০৯): পরিমাণগত ডেটা বিশ্লেষণ। আইডিয়াস পরীক্ষা করার জন্য সামাজিক গবেষণা করা। সান ফ্রান্সিসকো: জোসে-বাস। , অধ্যায় 7 একই জাতীয় আলোচনা। মডেল একটি ধ্রুবক রয়েছে।
মার্টেন বুইস

6

কিছু সাধারণ: কোনও / কোনওটির জন্য 1/0 সূচক এবং আসল মান দ্বারা আপনার পরিবর্তনশীলকে উপস্থাপন করুন। দুজনকেই রিগ্রেশনে রাখুন।


4

আপনি যদি কোনও সময়-ব্যয় করা (= 1) বনাম কোনও সময় ব্যয়কারী (= 0) এর জন্য বাইনারি সূচক রাখেন এবং তারপরে অবিচ্ছিন্ন চলক হিসাবে ব্যয় করা সময়ের পরিমাণ থাকে তবে "0" বারের আলাদা প্রভাব হবে " 0-1 সূচক দ্বারা "তুলে নেওয়া হয়েছে"


2

আপনি নোজারো সময়ের সাথে 0 সময় ভিত্তিক গ্রুপিংয়ের সাথে মিশ্র-প্রভাব মডেলগুলি ব্যবহার করতে পারেন এবং আপনার স্বাধীন পরিবর্তনশীল রাখতে পারেন


আপনি কি এই কিছুটা প্রসারিত করতে পারেন? অনেক ধন্যবাদ.
ডিএল ডাহলি

একটি মিশ্র প্রভাবগুলির মডেল ধরে নিয়েছে যে এমন একটি উপাদান রয়েছে যা তথ্যকে বিভিন্ন (ভিন্নধর্মী) বালতিতে বিভক্ত করে, যার প্রত্যেকটিতে আমরা ব্যাখ্যামূলক এবং নির্ভরশীল ভেরিয়েবলগুলির মধ্যে পৃথক সম্পর্ক রাখতে পারি (হয় বা যদি বিরতি বা বিরতি এবং opeাল / গুণফল) পদগুলিতে)। en.wikedia.org/wiki/Mixed_model
রেজাখোরশিদি

সুতরাং ব্যক্তিদের ব্যবহার করুন, স্তন্যদানের স্থিতিতে নেস্টেড এবং তারপরে সপ্তাহ-বুকের দুধ খাওয়ানোর ক্ষেত্রে এলোমেলো ?াল? আমি এটি যথেষ্ট সহজেই একটি এসইএম হিসাবে করতে পারি এবং নির্দিষ্ট প্রতিবন্ধকতাগুলি পরীক্ষা করতে পারি। ধন্যবাদ +1
ডিএল ডাহলি

1

যদি আপনি এই সংখ্যাটি 0 হিসাবে র্যান্ডম ফরেস্ট বা নিউরাল নেটওয়ার্ক ব্যবহার করে থাকেন তবে তা ঠিক আছে, কারণ তারা এটি নির্ধারণ করতে সক্ষম হবে যে 0 অন্যান্য মান থেকে স্বতন্ত্রভাবে পৃথক (যদি এটি বাস্তবে আলাদা হয়)। চারপাশের অন্যান্য উপায়ে সময় পরিবর্তনশীল ছাড়াও একটি শ্রেণীবদ্ধ ভেরিয়েবল হ্যাঁ / না যোগ করা হচ্ছে।

তবে সর্বোপরি, এই বিশেষ ক্ষেত্রে আমি আসল সমস্যাটি দেখতে পাচ্ছি না - 0.1 সপ্তাহের বুকের দুধ খাওয়ানো 0 এর কাছাকাছি থাকে এবং এর প্রভাবটিও একই রকম হয়, সুতরাং 0 বলে কিছু না দাঁড়িয়েও এটি আমার কাছে একটানা একটানা পরিবর্তনশীল বলে মনে হচ্ছে something স্বতন্ত্র।


3
প্রথম অনুচ্ছেদের জন্য +1 তবে সামাজিক বিজ্ঞান বা চিকিত্সা সম্পর্কিত তথ্যগুলির সাথে ডিল করা, 0 টি বনাম 0.1 সপ্তাহের কোনও কিছুর প্রভাব প্রধান উদ্বেগ নয়। মুল বক্তব্যটি হ'ল যে সকল মহিলারা স্তন্যপান করানোর চেষ্টা করেন না বা রিপোর্ট করেন না তারা অন্য অনেক ক্ষেত্রে (স্বাস্থ্য সমস্যা, উপার্জন, পারিবারিক পরিস্থিতি, কাজের বাইরে থাকার ক্ষমতা, স্বাস্থ্যসেবাতে অ্যাক্সেস, যেখানে তারা সম্পর্কে তথ্য পেয়েছিলেন) পদ্ধতিতে ভিন্ন হতে পারে প্যারেন্টিং ইত্যাদি) বিশ্বাস করার কোনও কারণ নেই যে এই মহিলাগুলি মায়ের সাথে খুব মিল, যারা বুকের দুধ খাওয়ানোর চেষ্টা করে এবং এটি দ্রুত বন্ধ করে দেয়।
গালা

1
একটি পরিসংখ্যানগত দিক থেকে, এই মডেলগুলিতে স্পষ্ট করে এই অন্যান্য পরিবর্তনগুলি রাখা ভাল তবে এটি 0-তে বিশেষ কিছু হচ্ছে না ধরে নিয়ে সতর্কতা অবলম্বন করা বোধ করি, আমি মনে করি।
গালা

0

টোবিটের মডেলটি আপনি যা চান তা আমার মনে হয়।


5
ফলাফল যখন কিছু প্রান্তিকের উপরে বা নীচে সেন্সর করা হয় তখন টবিটগুলি ব্যবহার করা হয়। উদাহরণস্বরূপ, আমরা নূন্যতম মজুরির নীচে কোনও মজুরি বা কিছু শীর্ষ কোডড মানের চেয়ে আয়ের নিরীক্ষণ করি না। এই অ্যাপ্লিকেশনটি একটি স্বাধীন ভেরিয়েবলের জন্য।
দিমিত্রি ভি। মাস্টারভ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.