চিকিত্সা দ্বারা প্রভাবিত covariate সঙ্গে ভাল ডেটা উদাহরণ প্রয়োজন


19

আমি প্রচুর আর ডেটাসেটগুলি, ডিএএসএল এবং অন্য কোথাও পোস্টিংয়ের দিকে নজর রেখেছি এবং পরীক্ষামূলক তথ্যগুলির জন্য কোভারিয়েন্সের বিশ্লেষণ চিত্রিত আকর্ষণীয় ডেটাসেটের খুব ভাল উদাহরণ খুঁজে পাচ্ছি না। স্ট্যাট পাঠ্যপুস্তকে স্বীকৃত ডেটা সহ অসংখ্য "খেলনা" ডেটাসেট রয়েছে।

আমি একটি উদাহরণ পেতে চাই যেখানে:

  • একটি আকর্ষণীয় গল্প সহ তথ্যগুলি আসল
  • কমপক্ষে একটি চিকিত্সার ফ্যাক্টর এবং দুটি কোভারিয়েট রয়েছে
  • কমপক্ষে একটি কোভারিয়েট চিকিত্সার কারণগুলির এক বা একাধিক দ্বারা প্রভাবিত হয় এবং একজন চিকিত্সা দ্বারা প্রভাবিত হয় না।
  • অগ্রাধিকার হিসাবে পর্যবেক্ষণের চেয়ে পরীক্ষামূলক

পটভূমি

আমার আসল লক্ষ্য হল আমার আর প্যাকেজটির জন্য ভিগনেটে রাখার জন্য একটি ভাল উদাহরণ খুঁজে পাওয়া। তবে বৃহত্তর লক্ষ্য হ'ল সম্প্রদায় বিশ্লেষণে কিছু গুরুত্বপূর্ণ উদ্বেগের চিত্রিত করার জন্য লোকেরা ভাল উদাহরণ দেখতে হবে। নিম্নলিখিত মেক-আপ দৃশ্যের বিষয়টি বিবেচনা করুন (এবং দয়া করে বুঝতে পারেন যে আমার কৃষিক্ষেত্রের জ্ঞানটি সর্বোপরি পর্যাপ্ত)।

  • আমরা একটি পরীক্ষা করি যেখানে সার প্লটগুলিতে এলোমেলোভাবে তৈরি হয় এবং একটি ফসল রোপণ করা হয়। উপযুক্ত ক্রমবর্ধমান সময়ের পরে, আমরা ফসল কাটা এবং কিছু মানের বৈশিষ্ট্য পরিমাপ করি - এটি প্রতিক্রিয়া পরিবর্তনশীল। তবে আমরা ক্রমবর্ধমান সময়কালে মোট বৃষ্টিপাত এবং ফসলের সময় মাটির অম্লতা রেকর্ড করি - এবং অবশ্যই কোন সার ব্যবহার করা হত। এইভাবে আমাদের দুটি সহকারী এবং একটি চিকিত্সা রয়েছে।

ফলস্বরূপ তথ্য বিশ্লেষণের স্বাভাবিক উপায়টি হ'ল ফ্যাক্টর হিসাবে চিকিত্সা সহ একটি লিনিয়ার মডেল ফিট করা এবং কোভেরিয়েটগুলির জন্য সংযোজনমূলক প্রভাব। তারপরে ফলাফলগুলি সংক্ষিপ্ত করতে, একটি গণনা করা "অ্যাডজাস্টেড মানে" (একে একে সর্বনিম্ন-স্কোয়ারের অর্থ), যা প্রতিটি সারের জন্য গড় বৃষ্টিপাত এবং 3 গড় মাটির অম্লতায় মডেল থেকে পূর্বাভাস। এটি সবকিছুকে সমান পদক্ষেপে ফেলেছে, কারণ আমরা যখন এই ফলাফলগুলির সাথে তুলনা করি তখন আমরা বৃষ্টিপাত এবং অম্লতা ধ্রুবক ধারণ করি।

তবে এটি সম্ভবত ভুল কাজ - কারণ সার সম্ভবত মাটির অম্লতা এবং প্রতিক্রিয়াকেও প্রভাবিত করে। এটি সামঞ্জস্য করা মানে বিভ্রান্তিমূলক করে তোলে, কারণ চিকিত্সা প্রভাবটি অম্লতায় তার প্রভাব অন্তর্ভুক্ত করে। এটি পরিচালনা করার একটি উপায় হ'ল মডেলটির বাইরে থেকে অম্লতা আনা, তারপরে বৃষ্টিপাত-সমন্বিত উপায়গুলি একটি ন্যায্য তুলনা সরবরাহ করে। তবে যদি অ্যাসিডিটি গুরুত্বপূর্ণ হয়, তবে এই ন্যায্যতাটি ব্যয়বহুল পরিবর্তনের বৃদ্ধিতে, দুর্দান্ত ব্যয়ে আসে।

মডেলটিতে তার মূল মানগুলির পরিবর্তে অম্লতার একটি সামঞ্জস্যিত সংস্করণ ব্যবহার করে এটিকে ঘিরে কাজ করার উপায় রয়েছে। আমার আর প্যাকেজ lsmeans এর আসন্ন আপডেট এটি একেবারে সহজ করে তুলবে। তবে আমি এটির উদাহরণ দেওয়ার জন্য একটি ভাল উদাহরণ রাখতে চাই। যে কেউ আমাকে কিছু ভাল উদাহরণস্বরূপ ডেটাসেটগুলিতে নির্দেশ করতে পারে আমি তার প্রতি কৃতজ্ঞ, এবং যথাযথভাবে স্বীকৃতি জানাব।


1
এই কোন সন্দেহ উভয় গুরুত্বপূর্ণ এবং মজার প্রশ্ন, এটা যেমন যদি এটা কি সম্পর্কে নিয়ম ফাউল পড়া পারে বলে মনে হয় বিষয়ে : " বিশেষ ডেটাসেট প্রাপ্তির সম্পর্কে প্রশ্ন-বহির্ভূত বন্ধ হয় (তারা খুব বিশেষ হয়)। "
Glen_b -Reinstate মনিকা


1
আমার প্রতিক্রিয়া সম্পর্কে এখন পর্যন্ত আমার ধারণাটি হ'ল আমরা এর মতো অন্যান্য প্রশ্নগুলির পক্ষে এটির পক্ষে দৃ ruling়ভাবে রায় দিয়ে একটি ফাঁকা চেক দিতে সতর্ক, তবে আমরা বেশিরভাগ ক্ষেত্রেই এই নির্দিষ্ট প্রশ্নের পক্ষে এবং এমনকি কিছুটা দেখার জন্যও কিছুটা আগ্রহী আপনি যে ধরণের উত্তর পেতে পারেন (সম্ভবত সেই বিটটি কেবল আমার)। আমরা যা চাইব না তা হ'ল এই প্রশ্নের দরিদ্রভাবে লেখা নকআফস যা ডেটাসেটগুলির জন্য জিজ্ঞাসা করে যা পরিসংখ্যানগুলির সাথে পয়েন্ট প্রমাণ করতে পারে তবে পরিসংখ্যান সম্পর্কে নয় । অর্থাত্, একটি পরিসংখ্যানগত নীতি প্রদর্শনের জন্য সাহায্যের জন্য অনুরোধ করা একটি জিনিস তবে ডোমেন-নির্দিষ্ট ডেটাসেটগুলির জন্য জিজ্ঞাসা করা অন্যটি হবে ...
নিক স্টাওনার

3
ঠিক আছে, একটি ভাল ধারণা মত শোনাচ্ছে। আমি আমার খ্যাতি কমিয়ে দেওয়ার জন্য অতীতে আরও খারাপ কাজ করেছি ...
rvl

2
@ স্টিভস আমি সম্মতি জানাই এটি অনুগ্রহের জন্য ভাল প্রার্থী; সত্যিই আমি এখানে এসেছি নিজেই এটির উপরে একটি রাখার জন্য, কেবল আবিষ্কার করার জন্য রাশ ইতিমধ্যে এটি করেছিল। যদি এক সপ্তাহে কিছু ভাল উত্তর না পাওয়া যায় তবে আমি এটিতে দ্বিতীয় অনুগ্রহ স্থাপন বিবেচনা করতে পারি। রুশ: আকর্ষণীয় প্রশ্নগুলির উপর উদারতাগুলি যথেষ্ট মনোযোগ আকর্ষণ করে যে পরবর্তী উত্সগুলি প্রায়শই প্রায়শই তাদের জন্য অর্থ প্রদান করে, তাই খ্যাতি হ্রাস প্রায়শই প্রথম নজরে মনে হয় তার চেয়ে অনেক কম খাড়া হয়।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


6

আপনি mediationআর প্যাকেজটি পরীক্ষা করতে চাইতে পারেন । এটির মতো পরীক্ষামূলক ডেটা অন্তর্ভুক্ত করে jobsএবং framingযেখানে চিকিত্সার পরিবর্তনশীল চিকিত্সার দ্বারা প্রভাবিত না হয়ে থাকে এমন কোভারিয়েটগুলির পাশাপাশি একটি প্রতিক্রিয়াশীল ভেরিয়েবল এবং covariates (অর্থাত্ চিকিত্সার প্রভাবের মধ্যস্থতাকারী) উভয়কেই প্রভাবিত করে।

আমি মধ্যস্থতা সাহিত্যের দিকে নজর দিয়েছিলাম কারণ আমি যদিও আপনি একটি মধ্যস্থতা অধ্যয়নের ঠিক বর্ণনা করেছেন: ফসলের গুণমানের সারের প্রভাবটি মাটির অম্লতার উপর প্রভাবের মধ্য দিয়ে মধ্যস্থ হয়ে যায়। এমনকি mediationপ্যাকেজে থাকা ডেটাসেটগুলি আপনাকে সন্তুষ্ট না করে, আপনি মধ্যস্থতার সাহিত্যের দিকে নজর দিলে আপনি একটি খুঁজে পেতে পারেন।


ধন্যবাদ। আমি প্যাকেজটি ইনস্টল করেছি এবং এটি দেখব। এবং নতুন কিছু শেখার সুযোগ।
rvl

মজার বিষয় যে সবেমাত্র আমি জেএসএম অধিবেশনে অংশ নিয়েছিলাম তিনটির মধ্যে দু'জনের আলোচনায় কাজের তথ্য উল্লেখ করা হয়েছিল ...
rvl

1
ঠিক আছে, আমি আশা করি আমি কোনওভাবে অনুগ্রহটি বিভক্ত করতে পারি। তবে এই প্যাকেজের কাছে প্রস্তুত ডেটাসেট রয়েছে যা আমি যা চেয়েছিলাম তার সাথে খুব উপযুক্ত, তাই @ মাসাটো নাকাজাওয়া অনুগ্রহ করে। অনেক ধন্যবাদ. framingডেটা ব্যবহার করে , এলসিমানের মিথস্ক্রিয়া প্লটগুলি (একটি লজিস্টিক মডেলের উপর ভিত্তি করে) যখন মধ্যস্থতা পরিবর্তনশীল স্থির থাকে তখন নাটকীয়ভাবে আলাদা হয় যেখানে চিকিত্সা এবং অন্যান্য কোভেরিয়েট দ্বারা পূর্বাভাসিত মানগুলি সেট করা হয়, সুতরাং এটি মধ্যস্থতা গ্রহণ করা কতটা গুরুত্বপূর্ণ তা দেখায় অ্যাকাউন্টে পরিবর্তনশীল।
rvl

1
ধন্যবাদ ডঃ লেন্থ। আসলে আমি আমার প্রবন্ধে আপনার নিবন্ধগুলি উদ্ধৃত করেছি ited আমি সম্মানিত আমি আপনার মতো প্রতিষ্ঠিত পরিসংখ্যানবিদদের পক্ষে যে কোনও উপায়ে সহায়তা করতে সক্ষম হয়েছি।
মাসাতো নাকাজাওয়া

4

আমি ভেবেছিলাম যে আমি মধ্যস্থতা প্যাকেজে ডেটাসেটগুলির সাথে কোনও বিশ্লেষণ কীভাবে প্রকাশ করব । ইন framing, একটি পরীক্ষা করা হয় যেখানে বিষয়গুলি ইমিগ্রেশন সম্পর্কিত কংগ্রেসে একটি বার্তা প্রেরণের সুযোগ পায়। তবে কিছু বিষয় ( treat=1) প্রথমে একটি নিউজ স্টোরি প্রদর্শিত হয়েছিল যা লাতিনোকে নেতিবাচক উপায়ে চিত্রিত করেছে। বাইনারি প্রতিক্রিয়া ছাড়াও (তারা কোনও বার্তা প্রেরণ করুক বা না করুক) আমরা empচিকিত্সা প্রয়োগের পরে বিষয়গুলির আবেগপ্রবণ অবস্থাও পরিমাপ করেছি । পাশাপাশি বিভিন্ন ডেমোগ্রাফিক ভেরিয়েবল রয়েছে।

প্রথমে আসুন প্রয়োজনীয় প্যাকেজগুলি আর-তে লোড করুন এবং লেবেলগুলিকে educসংক্ষিপ্ত স্ট্রিংয়ে পরিবর্তন করুন ।

> library("lsmeans")
> library("mediation")
> levels(framing$educ) = c("NA","Ref","< HS", "HS", "> HS","Coll +")

এখন একটি লজিস্টিক রিগ্রেশন মডেল ফিট করুন

> framing.glm = glm(cong_mesg ~ age + income + educ + emo + gender * factor(treat),
+                   family = binomial, data = framing)

এখানে প্রচলিত স্থায়ী মানে, যেখানে পূর্বাভাস covariates দিয়ে তৈরি করা হয় একটি ডিসপ্লে হয় age, incomeএবং emoসেট তাদের গড় মান হয়:

> lsmip(framing.glm, treat ~ educ | gender, type = "response")

(প্রচলিত "সমন্বিত মানে" এর মিথস্ক্রিয়া প্লট, প্রতিক্রিয়া স্কেলে রুপান্তরিত)

এটি একটি কৌতূহলী ফলাফল কারণ প্রদর্শিত চিকিত্সার প্রভাবগুলি পুরুষদের মতো মহিলাদের ক্ষেত্রেও বিপরীত এবং শিক্ষার প্রভাব যেমনটি আশা করা যায় তেমন একঘেয়ে নয়।

দ্রষ্টব্য, এইচওভার, emoএকটি চিকিত্সা পরবর্তী পরিমাপ। এর অর্থ এই যে চিকিত্সা এটির উপর প্রভাব ফেলতে পারে, অর্থাত্ emoএকটি মধ্যস্থতাকারী কোভারিয়েট; এবং তাই emoধ্রুবক ধরে থাকার সময় প্রতিক্রিয়ার পরিবর্তনশীলগুলির পূর্বাভাসগুলির তুলনা করা অর্থবহ হতে পারে না । পরিবর্তে, আসুন পূর্বাভাসটি কোথায় emoদেওয়া তার পূর্বাভাসিত মানগুলি treatএবং জনসংখ্যার ভেরিয়েবলগুলিতে সেট করা আছে তা দেখুন ।

> lsmip(framing.glm, treat ~ educ | gender, type = "response",
+       cov.reduce = emo ~ treat*gender + age + educ + income)

(মধ্যস্থতার প্রভাবগুলি বিবেচনায় নিয়ে ভবিষ্যদ্বাণীগুলির মিথস্ক্রিয়া প্লট)

এই ফলাফলটি একেবারে পৃথক, এটি emoদৃing়ভাবে মধ্যস্থতার ভূমিকা পালন করে। ( মধ্যস্থতা প্যাকেজের এই প্রভাবগুলির শক্তি নির্ধারণের জন্য কার্যকারিতা রয়েছে।) উপরের পূর্বাভাসগুলি অনুমান করে যে সংবেদনশীল প্রতিক্রিয়া বিবেচনায় নেগেটিভ নিউজ স্টোরিতে প্রকাশিত পুরুষ বিষয়গুলি স্ত্রী বা স্ত্রীদের তুলনায় বার্তা প্রেরণের সম্ভাবনা বেশি নেতিবাচক খবর গল্প। এছাড়াও, এর প্রভাব educ(প্রায়) মনোোটোন হয়।

আমাকে এই আকর্ষণীয় উদাহরণের দিকে ইঙ্গিত করার জন্য এবং কার্যকারণ সম্পর্কে সাম্প্রতিক গবেষণায় আকৃষ্ট করার জন্য @ মাসাটো নাকাগাওয়াকে আবারও ধন্যবাদ জানাই।


3

জিন-এনভায়রনমেন্ট ইন্টারঅ্যাকশন জিডাব্লুএএস স্টাডিজ সন্ধান করুন। সংক্ষিপ্ত বিশ্লেষণ তারা সংক্ষিপ্তভাবে সম্পাদন করে যা আপনি বর্ণনা করেছেন is প্রশ্নটি হল আপনার পরিবেশটি কোনও ফেনোটাইপ (পর্যবেক্ষণযোগ্য বৈশিষ্ট্য) এর সাথে গুরুত্বপূর্ণ? একটি চিন্তার স্কুল সাধারণত সমস্ত পরিবেশ সম্পর্কিত তথ্য উপেক্ষা করে এবং বলে যে আপনার জিনগত মেকআপটি আপনার ফেনোটাইপ বর্ণনা করে। বাস্তুশাস্ত্র অধ্যয়নের সাথে এটি সম্পূর্ণ বিপরীতে যেখানে গল্পটি পরিবেশগত সবকিছু এবং তারা জিনগুলি উপেক্ষা করে। যেহেতু উভয় পক্ষই একই সমস্যাটি বোঝার চেষ্টা করছে, তাই দু'জনকে একত্র করার জন্য সম্প্রতি চেষ্টা করা হয়েছে।

বলুন আমরা বিএমআই পড়ছি। জিনের কারণে স্থির প্রভাব হিসাবে আমরা জেনেটিক ম্যাট্রিক্সের প্রথম কয়েকটি মূল উপাদান গ্রহণ করি। আমরা স্থির প্রভাব হিসাবে সুশিক্ষিতদের জন্য 1 সূচক এবং স্বল্প শিক্ষিতদের জন্য 0 সূচক দিয়ে ফিট করি। শিক্ষার সূচক এবং ব্যক্তি যে সম্প্রদায়ের wealthশ্বর্যের মধ্যে রয়েছে তার মধ্যে যুক্তিসঙ্গত দৃ strong় সম্পর্ক রয়েছে। সুতরাং যে কেউ তর্ক করতে পারে যে স্বল্প আয়ের সম্প্রদায়ের আরও বেশি ফাস্ট ফুড রেস্তোঁরা হওয়ার সম্ভাবনা বেশি। ফাস্টফুড একটি অবেসোজেনিক ট্রিগার হিসাবে কাজ করে .. "আপনার জিনগত সেটআপে এমন কোনও কিছু ট্রিগার করে যা চর্বি জমাতে উত্সাহ দেয়" তাই এটি কোনও আকারে জেনেটিক মেকআপে প্রদর্শিত হবে।

এই জাতীয় ডেটা সিমুলেট করা কোনও সমস্যা নয়। খুঁজে দেখো

http://pngu.mgh.harvard.edu/~purcell/plink/simulate.shtml

এটি আপনাকে লক্ষণগুলির জন্য দায়ী জিডাব্লুএএস (জেনেটিক ইউনিট হিসাবে এটি ভাবুন) ডেটা অনুকরণ করতে দেয়। নির্দেশ না দেওয়া হলে তা লক্ষণ এবং 1000 টি নিয়ন্ত্রণ সহ 1000 জেনারেট করে। এই সিমুলেশনগুলির মধ্যে আদর্শ যা আমি ব্যবহার করি 9990 এসএনপিগুলি লক্ষণ সৃষ্টি করে না এবং 10 এসএনপি করে না। এগুলি কীভাবে সিমুলেটেড হয় সে সম্পর্কে নির্দেশাবলী পড়ুন।

যদি ব্যক্তি স্থূলকায় হয় তবে আউটপুটটি 1 হবে এবং যদি তিনি 0 না হন। স্থূলতার স্তরের সাথে কিছু যুক্তিসঙ্গত পারস্পরিক সম্পর্কের ভিত্তিতে শিক্ষার কারণগুলি (সমাপ্ত কলেজ শিক্ষার / কলেজ শিক্ষার সমাপ্ত না হওয়া) অনুকরণ করুন।

আশাকরি এটা সাহায্য করবে!!!


ধন্যবাদ। এখনও কিছু বাস্তব ডেটা খুঁজে নিচ্ছি ... প্লাস আমি নিশ্চিত না যে জিডব্লিউএএস স্টাডিজ কী is DUH, লিঙ্কটি অনুসরণ করে সন্ধান করা হয়েছে।
rvl

যদিও আমি অন্য একজন উত্তরদাতাকে অনুদান দিয়েছি, আমি এই পরামর্শটির প্রশংসা করি এবং এটি অনুসরণ করার ইচ্ছা করি। ধন্যবাদ।
rvl

1

আমি ফ্রেয়াকোনমিক্স পড়ার এবং তাদের কাজের উপর ভিত্তি করে থাকা কাগজপত্রগুলি সন্ধান করার এবং আপনি সেই ডেটা ধরতে পারবেন কিনা তা দেখার পরামর্শ দিচ্ছি। তাদের কাছে সত্যই আকর্ষণীয় ডেটাসেটগুলির জন্য কিছু আকর্ষণীয় কাজ রয়েছে এবং কিছু ক্ষেত্রে তারা ডেটাতে সীমাবদ্ধতা সত্ত্বেও হাইপোথেসিসগুলি পরীক্ষা করার জন্য খুব চতুর উপায়গুলি খুঁজে বের করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.