শ্রেণীবদ্ধ ভেরিয়েবলগুলির স্তর 'জানেন না / অস্বীকার করেছেন' এর চিকিত্সা করা হচ্ছে

9

আমি লজিস্টিক রিগ্রেশন ব্যবহার করে ডায়াবেটিস প্রেডিকশন মডেলিং করছি। ব্যবহৃত ডেটাসেটটি হ'ল সেন্টার ফর ডিজিজ কন্ট্রোল (সিডিসি) এর আচরণগত ঝুঁকি ফ্যাক্টর নজরদারি সিস্টেম (বিআরএফএসএস )। স্বাধীন ভেরিয়েবলগুলির মধ্যে একটি হ'ল ব্লাড প্রেসার। এটি নিম্ন স্তরের 'হ্যাঁ', 'না', 'জানেন না / অস্বীকার করেছেন' এর সাথে শ্রেণিবদ্ধ। মডেলটি তৈরি করার সময় আমি কি জানি না / অস্বীকার করব না? মডেল থেকে এই সারিগুলি রাখা বা সরিয়ে ফেলতে কী তফাত হয়?

logistic missing-data

— user3897
সূত্র

6

সর্বশেষ জাতীয় হাসপাতালের স্রাব জরিপের তথ্য বিশ্লেষণ করার সময় আমি ঠিক একই প্রশ্নটি নিয়ে ভাবছিলাম । বেশ কয়েকটি ভেরিয়েবলের বৈবাহিক অবস্থা এবং পদ্ধতির ধরণের মতো যথেষ্ট পরিমাণে অনুপস্থিত মান রয়েছে। এই বিষয়টি আমার নজরে আসে কারণ এই বিভাগগুলি আমি চালিয়ে যাচ্ছিলাম বেশিরভাগ লজিস্টিক রিগ্রেশন বিশ্লেষণে শক্তিশালী (এবং উল্লেখযোগ্য) প্রভাব সহ প্রদর্শিত হয়েছিল showed

কেউ কেন অবাক হওয়ার দিকে ঝুঁকছেএকটি অনুপস্থিত কোড দেওয়া হয়েছে বৈবাহিক স্থিতির ক্ষেত্রে, উদাহরণস্বরূপ, এটি প্রশংসনীয় যে এই তথ্য সরবরাহ করতে ব্যর্থতা আর্থ-সামাজিক অবস্থান বা রোগের ধরণের মতো গুরুত্বপূর্ণ কারণগুলির সাথে যুক্ত হতে পারে। আপনার উচ্চ রক্তচাপের ক্ষেত্রে, আমাদের জিজ্ঞাসা করা উচিত কেন মানটি জানা বা প্রত্যাখ্যান করা হবে না? এটি প্রতিষ্ঠানের অনুশীলনের সাথে সম্পর্কিত হতে পারে (সম্ভবত শিথিল পদ্ধতিগুলি প্রতিফলিত করে) বা এমনকি ব্যক্তিদের সাথে (যেমন ধর্মীয় বিশ্বাস)। সেই বৈশিষ্ট্যগুলি ডায়াবেটিসের সাথে যুক্ত হতে পারে be অতএব, এই মূল্যবোধগুলি অনুপস্থিত হিসাবে কোডিং না করে (এর ফলে তাদের পুরোপুরি বিশ্লেষণ থেকে বাদ দেওয়া) বা মানগুলি (যেগুলি তারা প্রদত্ত তথ্যকে কার্যকরভাবে মাস্ক করে এবং ফলাফলকে পক্ষপাতিত্ব করতে পারে) চিহ্নিত করার চেষ্টা করার পরিবর্তে আপনার যেমন আছে তেমন বুদ্ধিমান বলে মনে হচ্ছে। আসলে এটি করা আর কোনও কঠিন নয়: আপনাকে কেবল এটি নিশ্চিত করতে হবে যে এই পরিবর্তনশীলটিকে শ্রেণিবদ্ধ হিসাবে বিবেচনা করা হয় এবং আপনি রিগ্রেশন আউটপুটটিতে আরও একটি গুণফল পাবেন। তদুপরি, আমি সন্দেহ করি বিআরএফএসএস ডেটাসেটগুলি এত বড় যে আপনাকে পাওয়ার সম্পর্কে চিন্তা করতে হবে না।

— whuber
সূত্র

2

এছাড়াও, ডেকে এর আসল অর্থ হতে পারে, অর্থাত্ সেই ব্যক্তিরা স্বাস্থ্য সচেতন নয় এবং ঝুঁকিপূর্ণও হতে পারে।

— ব্র্যান্ডন বার্টেলসেন

2

প্রথমে আপনাকে ভাবতে হবে যদি নিখোঁজ তথ্যগুলি এলোমেলোভাবে (এমসিএআর) থেকে নিখোঁজ হয়, র্যান্ডম (এমএআর) এ নিখোঁজ হয় বা মোছা হিসাবে র্যান্ডম (এমএনএআর) অনুপস্থিত (অন্য কথায় সম্পূর্ণ ক্ষেত্রে বিশ্লেষণ) পক্ষপাতদুষ্ট ফলাফল হতে পারে। বিকল্পগুলি হ'ল বিপরীত সম্ভাবনা ওজন, একাধিক প্রত্যাবর্তন, পূর্ণ সম্ভাবনা পদ্ধতি এবং দ্বিগুণ-শক্তিশালী পদ্ধতি। চেইন সমীকরণ (এমআইএসএস) এর সাথে একাধিক অনুদান যদি প্রায়শই সহজ উপায় হয়।

— GaBorgulya
সূত্র

ধন্যবাদ. এটি একটি সমীক্ষার ডেটা এবং আমি নিশ্চিত নই যে এটি এমআর বা এমএনআর কিনা। উদাহরণস্বরূপ, একটি পরিবর্তনশীল আছে যা 1) "" কোনও ব্যক্তির ডায়াবেটিস আছে কিনা? " এবং অন্য পরিবর্তনশীল (2) তিনি ইনসুলিন নিচ্ছেন কিনা? আমি দেখতে পাচ্ছি যে পরিবর্তনশীল (2) এর প্রবেশ কেবল তখনই হয় যখন ভেরিয়েবল (1) 'হ্যাঁ' হয় (অর্থাত্ কোনও ব্যক্তি ডায়াবেটিক) ther অন্যদিকে (2) খালি থাকে। ডায়াবেটিস ক্ষেত্রে প্রতিক্রিয়া হিসাবে অতিরিক্ত (২) 'হ্যাঁ', 'না', 'জানেন না / অস্বীকার করেছেন'। তাহলে আমি কীভাবে শূন্য কোষগুলি এবং 'জেনে / অস্বীকার করি না' জরিপের প্রতিক্রিয়াগুলি চিকিত্সা করব?

— ব্যবহারকারীর 3897

আমি একাধিক অনুশাসন সম্পর্কে শিখতে চাই এবং একটি অনলাইন শেখার সামগ্রী খুঁজছিলাম। আপনি এমআই এর জন্য কিছু শিখন উপাদান প্রস্তাব করতে পারেন?

— ব্যবহারকারীর 3897

0

আপনার কী মনে করার কোনও কারণ আছে যে ডায়াবেটিসের সাথে অধ্যয়ন বিষয়গুলি DK / R প্রতিক্রিয়াটির সাথে শেষ হওয়ার সম্ভাবনা বেশি বা কম ছিল? যদি না হয় (এবং আপনি কী করেছেন তা জানতে পেরে আমি বিস্মিত হব), মডেল ডাব্লু / ও-তে এই পূর্বাভাসক সহ এই কেসগুলি বাদ দিলে শব্দ হবে। এটি হ'ল "হ্যাঁ" বনাম "না" ডায়াবেটিসের আনুমানিক সম্ভাবনাকে কীভাবে প্রভাবিত করে তার মূল্যায়নে আপনি আরও নির্ভুলতার সাথে শেষ করবেন (কারণ আপনি "হ্যাঁ" বা "না" এর প্রভাবকে মডেল করার চেষ্টা করবেন কেবল "হ্যাঁ" বনাম "না" এর বিপরীতে বনাম এলোমেলো ডিকে / আর প্রতিক্রিয়াগুলি)। সবচেয়ে সোজা বিকল্প হ'ল ডি কে / আর প্রতিক্রিয়াযুক্ত কেসগুলি বাদ দেওয়া। ধরে নেওয়া যে তাদের "হ্যাঁ / না" প্রতিক্রিয়াগুলি এলোমেলোভাবে অনুপস্থিত ছিল, সেগুলি বাদ দিলে "হ্যাঁ" বনামের প্রভাব সম্পর্কে আপনার অনুমানের পক্ষপাতিত্ব করা হবে না will "কোন।" তবে এই পদ্ধতির সাহায্যে আপনার নমুনার আকার হ্রাস হবে এবং এভাবে ভবিষ্যদ্বাণীকারীদের ক্ষেত্রে পরিসংখ্যানিক শক্তি হ্রাস পাবে। আপনার যদি এই ভেরিয়েবলের উপর প্রচুর DK / R থাকে তবে আপনি একাধিক অনুবর্তনের দ্বারা "হ্যাঁ" / "না" প্রতিক্রিয়াগুলি অঙ্কন করতে চাইতে পারেন (সম্ভবত সবচেয়ে বেশি, সম্ভবত কেবলমাত্র ডিফেন্সেবল মিসিং-ভ্যালু ইম্পুটেশন কৌশল)।

— dmk38
সূত্র