গণনা ডেটা হিসাবে স্কেল ভেরিয়েবল - সঠিক না?


10

ইন এই কাগজ (সেন্ট্রাল পাবমেড মাধ্যমে অবাধে উপলব্ধ), লেখক একটি 10-আইটেমটি প্রদর্শণের উপকরণ উপর স্কোর মডেল নেতিবাচক দ্বিপদ রিগ্রেশন ব্যবহার 0-40 করেন। এই পদ্ধতি গণনা ডেটা ধরে, যা পরিষ্কারভাবে এখানে ক্ষেত্রে হয় না। এই পদ্ধতির গ্রহণযোগ্য কিনা তা নিয়ে আমি আপনার মতামত চাই, কারণ আমি কখনও কখনও আমার কাজে একই উপকরণ বা অনুরূপ ব্যবহার করি। যদি তা না হয় তবে আমি কোনও গ্রহণযোগ্য বিকল্প আছে কিনা তা জানতে চাই। নীচে আরও বিশদ:

ব্যবহৃত স্কেল হ'ল অ্যালকোহল ইউজ ডিসঅর্ডারস আইডেন্টিফিকেশন টেস্ট (এডিডিআইটি), অ্যালকোহল ব্যবহারের ব্যাধি এবং বিপজ্জনক / ক্ষতিকারক মদ্যপানের জন্য স্ক্রিনিংয়ের উপকরণ হিসাবে ডিজাইন করা 10-আইটেমের প্রশ্নপত্র। উপকরণটি 0 থেকে 40 পর্যন্ত স্কোর করা হয় এবং ফলাফলগুলি খুব বেশি বাম-স্কিউড হয় are

আমার বোধগম্য হিসাবে, গণনা তথ্য ব্যবহার করে ধরে নেওয়া যায় যে "গণনা করা" সমস্ত মান একে অপরের থেকে স্বতন্ত্র - রোগীদের প্রতিদিন জরুরি ওয়ার্ডে আসা রোগী, একটি নির্দিষ্ট গ্রুপে হতাহতের সংখ্যা ইত্যাদি - তারা সবাই একে অপর থেকে স্বতন্ত্র, যদিও অন্তর্নিহিত পরিবর্তনশীলগুলির উপর নির্ভরশীল। তদুপরি, আমি মনে করি গণনা তথ্য ব্যবহার করার সময় সর্বাধিক অনুমোদিত গণনা হতে পারে না, যদিও আমি মনে করি যে তাত্ত্বিক সর্বোচ্চটি যখন ডেটাতে পরিলক্ষিত সর্বাধিকের তুলনায় খুব বেশি হয় তখন এই অনুমানটি শিথিল করা যায়?

অডিডি স্কেল ব্যবহার করার সময়, আমাদের একটি সত্য গণনা নেই। আমাদের সর্বোচ্চ 40 স্কোর সহ 10 টি আইটেম রয়েছে যদিও উচ্চ স্কোরটি অনুশীলনে খুব কমই দেখা যায়। আইটেমের স্কোর স্বাভাবিকভাবে একে অপরের সাথে সম্পর্কিত হয়।

গণনা ডেটা ব্যবহার করার জন্য প্রয়োজনীয় অনুমানগুলি লঙ্ঘন করা হয়। কিন্তু এটি কি এখনও একটি গ্রহণযোগ্য পদ্ধতির? অনুমানের লঙ্ঘন কতটা গুরুতর? এমন কিছু পরিস্থিতি রয়েছে যার অধীনে এই পদ্ধতিকে আরও গ্রহণযোগ্য বলে বিবেচনা করা যেতে পারে? এই পদ্ধতির কোনও বিকল্প রয়েছে যা স্কেল পরিবর্তনগুলিকে বিভাগগুলিতে হ্রাস করতে জড়িত না?

উত্তর:


4

অডিডিট যন্ত্রটি মূলত একটি লিকার্ট স্কেল। প্রশ্নগুলির একটি সেট (লিকার্ট আইটেম), প্রায়শই পাঁচ-পয়েন্ট স্কেলের উত্তরগুলির সাথে কিছু অন্তর্নিহিত ঘটনাটি জানার জন্য ডিজাইন করা হয়। প্রশ্নের সেটগুলির প্রতিক্রিয়ার যোগফল, লিকার্ট স্কেল, তারপরে অন্তর্নিহিত ঘটনাটির পরিমাপ হিসাবে ব্যবহৃত হয়। যদিও লিকার্ট আইটেমগুলি প্রায়শই " দৃ agree়ভাবে একমত" হওয়ার জন্য "দৃ strongly়ভাবে অসম্মতি" আকারে থাকে তবে এই " আই ডিটেন্টিফিকেশন টি এস্ট" এর মধ্যে " মদ ইউ সি ডি ইস্টারস" এর দিকে প্রবণতা পরিমাপের আবেদনটি সহজ।

লিকার্ট স্কেল উইকিপিডিয়া পৃষ্ঠায় উল্লিখিত হিসাবে , "স্বতন্ত্র লিকার্ট আইটেমগুলি অন্তর-স্তরের ডেটা হিসাবে বিবেচনা করা যেতে পারে, বা সেগুলি আদেশ-শ্রেণিবদ্ধ তথ্য হিসাবে বিবেচনা করা উচিত কিনা সেগুলি সম্পর্কে দৃ strong় বিশ্বাসের সাথে সাহিত্যে যথেষ্ট মতবিরোধের বিষয় কিনা? সর্বাধিক প্রযোজ্য পদ্ধতি " এই বিতর্কটি সম্ভবত ৮০++ বছরের বেশিরভাগ সময় পেরিয়ে গেছে যখন লিকার্ট প্রথম স্কেলটি প্রস্তাব করেছিল: স্কেল সমতুল্য পাশাপাশি প্রতিটি পদক্ষেপ কি স্কেলগুলি তৈরি করে এমন আইটেমগুলির মধ্যে? ইস্যু ক্রস যাচাই উপর সুরাহা, এর উত্তর হিসেবে হয়েছে এই প্রশ্নের , নিকটতম প্রশ্নগুলির একটির এই সাইটে জিজ্ঞাসা।

আপনি যদি এই ধারণাটি স্বীকার করেন যে স্কেলটি ধাপগুলি অভিন্ন (তবে হাতের কাছে প্রয়োগের জন্য ইউনিফর্মের পর্যাপ্ত পরিমাণে সম্ভবত এটিডিটি হিসাবে 10 টি আলাদা আইটেম যুক্ত করে গড়ে নেওয়া হয়েছে), তবে বিশ্লেষণের কয়েকটি পন্থা সম্ভব। একটি হ'ল স্কেলটির প্রতিক্রিয়াটিকে ধাপে প্রতিটি পদক্ষেপের উপরে উঠার একই সম্ভাবনা সহ, স্কেলটি সরিয়ে নেওয়ার জন্য বেছে নেওয়া বা না বেছে নেওয়া এক ধরণের পদক্ষেপ হিসাবে বিবেচনা করা।

এটি @ মাইকলওরেন্সের ২০১০ সালের প্রশ্নে " এন-পয়েন্ট লাইকার্ট স্কেল ডেটা একটি দ্বিপদী প্রক্রিয়া থেকে এন ট্রায়াল হিসাবে" ভাবতে সহায়তা করে। যদিও এই প্রশ্নের প্রতিক্রিয়াগুলি এই ধারণার ভয়াবহ সমর্থনকারী ছিল না, তবুও দ্রুত একটি 2014 এর সমীক্ষা খুঁজে পাওয়া খুব কঠিন ছিল না যা বিভিন্ন দ্বিপদী সম্ভাব্যতার সাথে উপ-জনগোষ্ঠীকে আলাদা করতে এই পদ্ধতির সফলভাবে ব্যবহার ও প্রসারিত করেছিল। যদিও দ্বিপদী প্রক্রিয়া প্রায়শই গণনা ডেটা মডেল করার জন্য ব্যবহৃত হয়, তবে এটি "অ্যালকোহল ইউজ ডিসঅর্ডারস" এর স্কেল ধরে কোনও ব্যক্তি গ্রহণ করা পদক্ষেপের সংখ্যা, গণনা মডেল করতে ব্যবহার করা যেতে পারে।

@ স্পোর্টি দ্বিতীয় অনুচ্ছেদে লিঙ্কিত প্রশ্নের উত্তরে যেমন উল্লেখ করেছেন , দ্বিপদী মডেলের একটি সীমাবদ্ধতা এটি প্রতিক্রিয়াটির গড় এবং তারতম্যের মধ্যে একটি বিশেষ সম্পর্ক চাপিয়ে দেয়। নেতিবাচক দ্বিপদ অপসারণ যে সহজ দ্বিপদ মডেল দ্বারা উপলব্ধ সহজ ব্যাখ্যার ক্ষতি সঙ্গে সীমাবদ্ধতা। বিশ্লেষণে, অতিরিক্ত পরামিতিগুলির উপযুক্ত হতে হবে যা কেবল মাত্র এক ডিগ্রি স্বাধীনতার ব্যবহার করে। বিপরীতে, ৪০ টি লিকার্ট-আইটেম পদক্ষেপের প্রতিটি এবং লিকার্ট স্কেলে তাদের যোগফলের জন্য পৃথক সম্ভাব্যতা উল্লেখ করার চেষ্টা করা দু: খজনক হবে।

@ ম্যাথেগ্রাভস যেমন এই প্রশ্নের উত্তরে উল্লেখ করেছেন যে, নেতিবাচক দ্বিপদী মডেলটি উপযুক্ত কিনা তা অবশিষ্টাংশগুলি পরীক্ষা করেই সবচেয়ে ভাল উত্তর দেওয়া যায়। ইন মূল অধ্যয়ন যে উন্নত নিরীক্ষা, 40-পয়েন্ট স্কেলে 8 বা তার বেশি একটি মান বেশ যুক্তিসঙ্গত নির্দিষ্টতা এবং "বিপজ্জনক বা ক্ষতিকর এলকোহল ব্যবহার," 6 বিভিন্ন দেশ জুড়ে জন্য ধরা সেই পার্থক্য জন্য সংবেদনশীলতা ছিল। সুতরাং সম্ভবত উচ্চ-ঝুঁকিপূর্ণ এবং নিম্ন-ঝুঁকিপূর্ণ জনসংখ্যার ভিত্তিতে একটি দ্বি-জনসংখ্যার দ্বিপদী মডেল, উপরে সংযুক্ত 2014 এর সমীক্ষাটি আরও ভাল হবে।

অডিডিটিতে আগ্রহী তাদের বিশেষভাবে সেই মূল অধ্যয়নটি পরীক্ষা করা উচিত। উদাহরণস্বরূপ, যদিও সকালের পানীয়ের প্রয়োজন মদ্যপানের ফ্রিকোয়েন্সি থেকে সম্পূর্ণ আলাদা কিছু পরিমাপ করে বলে মনে হচ্ছে, যেমন @ সিএনইস্টার ইঙ্গিত করেছেন, সকালের পানীয়টি মদ্যপানের পরিমাণের পরিমাপের সাথে একটি স্কেল 0.73 এর একটি ওজনযুক্ত গড় সম্পর্কযুক্ত। (যার ফলে অ্যালকোহলের ব্যবহারের অসুবিধাগুলির সাথে বন্ধুত্ব হয়েছে এমন ব্যক্তির জন্য এটি অবাক হওয়ার মতো কিছু নয়)) একাধিক সংস্কৃতি জুড়ে নির্ভরযোগ্যভাবে ব্যবহার করা যেতে পারে এমন একটি সরঞ্জাম বিকাশের জন্য প্রয়োজনীয় ট্রেডঅফসের একটি দুর্দান্ত উদাহরণ বলে মনে হয় অডিট।


একটি ভাল উত্তরের জন্য আপনাকে ধন্যবাদ। 20000 জনেরও বেশি লোকের আমার নিজের অডিডিটি ডেটা দেখার সময় আকৃতিটি নেতিবাচক দ্বিপদী বিতরণের নিকটে দেখায় যাতে এই বিতরণীয় অনুমানটি ব্যবহার করা যুক্তিসঙ্গত হতে পারে, বা সম্ভবত একটি পিয়াসন-পিসন মডেল ব্যবহার করা যেতে পারে? 40 বার্নোল্লি ট্রায়ালগুলির মধ্যে কে সাফল্য হিসাবে পয়েন্টগুলি বিবেচনা করে আমরা দ্বিপদী বন্টন ব্যবহার করি, তাহলে কী আমাদের অতিমাত্রায় ছাড়িয়ে নিয়ে গুরুতর সমস্যা হবে না? এটি আমার ডেটাতে দেখায়। আধা-দ্বিপদী কি বিকল্প হতে পারে?
জোনবি

আপনি কেন 0-40 অডিডি স্কোরকে মডেলিং করছেন এবং ফলাফলগুলিতে আপনি কী যুক্তিবাদী ব্যাখ্যা দিতে চান তা অনেকটাই নির্ভর করে। যদি আপনি চান সমস্ত ডিস্ট্রিবিউশন প্যারামিটারের নিজস্ব সীমিত ব্যাখ্যার সাথে অন্যান্য ভেরিয়েবলের সাথে অডিডি স্কোরের একটি সম্পর্ক থাকে, তবে এমন একটি বিতরণ ব্যবহার করুন যা ভাল আচরণের অবশিষ্টাংশ সরবরাহ করে; আপনার পরামর্শ যুক্তিসঙ্গত। ডেটাতে একক দ্বিপদী ফিট করা সমস্যাযুক্ত তবে বিভিন্ন পি সহ 2 টি দ্বিপদী (উচ্চ ঝুঁকিযুক্ত এবং কম ঝুঁকিপূর্ণ গ্রুপ) এর মিশ্রণ তথ্যমূলক হতে পারে। বিষয় সম্পর্কে আপনার জ্ঞানের ভিত্তিতে আপনার রায় ব্যবহার করুন।
এডিএম

2

নেতিবাচক দ্বিপদ বিন্যাস "সংক্রামক" বিযুক্ত ইভেন্টের জন্য পছন্দ করা হয়। বিচ্ছিন্ন ইভেন্টগুলি স্বাধীন হলে একটি পইসন বিতরণ ব্যবহৃত হয়। এই ডিস্ট্রিবিউশনগুলি মূলত পয়েন্টের সাথে একটি পয়েন্ট প্রতিস্থাপন করে কাটাও মোটামুটি সহজ ।x=40x40

একটি সাধারণ মন্তব্য হিসাবে, বিভিন্ন স্বাদে রিগ্রেশন প্যারামিটারগুলির (যেমন নিয়মিতকরণ) এবং বিভিন্ন শব্দ মডেলের জন্য পৃথক পৃথক পৃথক পৃথক পৃথক প্রাইয়ার রয়েছে। স্ট্যান্ডার্ড ন্যূনতম স্কোয়ারের রিগ্রেশনটিতে একটি গাউসিয়ান শোনার মডেল রয়েছে, negativeণাত্মক দ্বিপদী রিগ্রেশনটিতে নেতিবাচক দ্বিপদী শব্দের মডেল রয়েছে so কোনও রিগ্রেশন মডেল উপযুক্ত কিনা তা সঠিক পরীক্ষা হ'ল বেঁচে থাকা শব্দের প্রত্যাশিত বন্টন আছে কি না।

সুতরাং আপনি আপনার ডেটাতে নেতিবাচক দ্বিপদী রিগ্রেশন প্রয়োগ করতে পারেন, অবশিষ্টাংশগুলি গণনা করতে পারেন এবং তারপরে এগুলি নেতিবাচক দ্বিপদী সম্ভাব্যতার প্লটে প্লট করতে পারেন এবং মডেলটি যথাযথ কিনা তা উপলব্ধি পেতে পারেন। যদি শব্দটি অন্য কোনও উপায়ে কাঠামোগত হয় তবে আমাদের এমন শব্দের মডেল সন্ধান করতে হবে যা সেই কাঠামো আরও ঘনিষ্ঠভাবে ফিট করে।

উত্পাদক মডেল থেকে শব্দের কাঠামোর পক্ষে যুক্তি সহায়ক - আমাদের যদি জানা থাকে যে ডেটাটি অ্যাডিটিভের পরিবর্তে গুণক হয়, উদাহরণস্বরূপ, আমরা সাধারণের পরিবর্তে লগনারমেলে পৌঁছাতে পারি - তবে যদি প্রত্যাশিত জেনারেটাল মডেল এবং শব্দের কাঠামো একমত হয় না, ডেটা দিয়ে যান, প্রত্যাশা নয়।


আকর্ষণীয়, আমি জানতাম না যে ঘটনাগুলি "সংক্রামক" হতে পারে। অনুশীলনে x = 40 এর পরিবর্তে x> 40 এর অর্থ কী? কীভাবে আমি আর-তে নেতিবাচক দ্বিপদী সম্ভাব্যতা প্লট করব? আমি মনে করি আপনি লাগানো মানগুলির বিরুদ্ধে প্লট অবশিষ্টাংশগুলি বোঝাচ্ছেন না? আপনি কি কিউকিউ প্লটের মতো বোঝাতে চাইছেন?
জোনবি

@ জোনবি ধরুন আপনার কাছে r = 1 এবং সাফল্যের সম্ভাবনা পি = .9 সহ নেতিবাচক দ্বিপদী রয়েছে। 40 টি ট্রায়াল হুবহু বেঁচে থাকার সম্ভাবনা হ'ল 0.148%; 40 বা ততোধিক বিচারের বেঁচে থাকার সম্ভাবনা 1.48%। সুতরাং কেউ [0,40] এর জন্য নেতিবাচক দ্বিপদী ব্যবহার করে [0,40] ডোমেনে একটি সুগঠিত সম্ভাব্যতা সংজ্ঞায়িত করতে পারে এবং তারপরে [40] সেট করে যাতে এটি একের সমান হয়, কারণ negativeণাত্মক দ্বিপদী বিতরণ ভাল - এটি 40 বা তার বেশি হওয়ার সম্ভাবনা তৈরি হয়।
ম্যাথিউ গ্রেভস

@ জোনবি হুবহু, আমার অর্থ কিউকিউ প্লটের মতো। আমি আর এর আগে এটি করিনি, তবে আমি আশা করি এই লিঙ্কটি সাহায্য করবে।
ম্যাথু গ্রেভস

1
আমি অডিডি স্কোরগুলির সাথে কিছু ডেটাতে একটি পরীক্ষা করেছি। কিউকিউ প্লট তৈরি করার সময়, আমাকে নেতিবাচক দ্বিপদী বিতরণ থেকে ফলাফলের এলোমেলো ভেক্টর তৈরি করতে হবে। আমার / রিগ্রেশন মডেল দ্বারা মিউ / থিটা দেওয়া হয়েছে, তবে কীভাবে "আকার" ব্যবহার করব তা আমি কীভাবে জানতে পারি? আমি দুঃখিত যদি এটি একটি আর-নির্দিষ্ট প্রশ্ন থাকে তবে যাইহোক, আপনার কি খুব ভাল রেফারেন্স রয়েছে যা আমি ধরণের ধরণের বিভিন্ন আইটেমের সংশ্লেষ করে এই ধরণের স্কেলগুলিতে নেতিবাচক দ্বিপদী (এবং অন্যান্য বিতরণ) প্রয়োগ করার বিষয়ে আরও পড়তে পারি একই প্রক্রিয়া?
জোনবি

আমি এখন কিছু অতিরিক্ত পরীক্ষা-নিরীক্ষা করেছি। আমি দুটি ভেরিয়েবল সহ একটি ডেটাসেট সিমুলেটেড: এক্স এবং ওয়াই। 50% হ'ল x = 0, 50% হ'ল x = 1। যারা x = 0 তাদের y = 1 এর জন্য 0.2 সম্ভাবনা থাকে এবং যারা x = 1 তাদের y = 1 এর 0.4 সম্ভাবনা থাকে। আমি তখন একটি লজিস্টিক রিগ্রেশন চালিয়েছিলাম এবং অবশিষ্টাংশগুলিতে নজর রেখেছি। এটিকে দ্বিপাক্ষিকভাবে বিতরণ করা হবে না। আসলে, তারা (অবশ্যই) 4 নির্দিষ্ট মান গ্রহণ করে on আপনি কি নিশ্চিত যে অবশিষ্ট অবধি সর্বদা বন্টন অনুমানের সাথে মেলে? কারণ এই উদাহরণে, এটি স্পষ্টতই ভুল।
জোনবি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.