পাঁচ পয়েন্ট লাইকার্ট আইটেমের উপর গ্রুপ পার্থক্য


22

এই প্রশ্নটি অনুসরণ করে : কল্পনা করুন যে আপনি দুটি গ্রুপের (যেমন, পুরুষ এবং মহিলা) মধ্যবর্তী প্রবণতার মধ্যে 5-পয়েন্ট লাইকার্ট আইটেমের (যেমন, সন্তুষ্টি সন্তুষ্ট: সন্তুষ্ট সন্তুষ্ট) মধ্যে পার্থক্যের জন্য পরীক্ষা করতে চান gine আমি মনে করি একটি টি-টেস্ট বেশিরভাগ উদ্দেশ্যে যথেষ্ট সঠিক হতে পারে তবে গ্রুপ গ্রুপের মধ্যে পার্থক্যের একটি বুটস্ট্র্যাপ পরীক্ষা প্রায়শই আত্মবিশ্বাসের ব্যবধানগুলির আরও সঠিক অনুমান সরবরাহ করে provide আপনি কোন পরিসংখ্যানের পরীক্ষা ব্যবহার করবেন?


2
একটি সম্পর্কিত প্রশ্ন: লোকেরা প্রায়শই এই জাতীয় ডেটার জন্য ননপ্যারমেট্রিক ম্যান-হুইটনি পরীক্ষা ব্যবহার করে। যেহেতু কেবল পাঁচটি সম্ভাব্য মান রয়েছে, তাই প্রচুর পরিমাণে বাঁধা র‌্যাঙ্ক থাকবে। মান-হুইটনি পরীক্ষা বাঁধা র‌্যাঙ্কের জন্য সামঞ্জস্য করে, তবে বিশাল সংখ্যক সম্পর্ক থাকা অবস্থায় এই সমন্বয়টি কি কাজ করে?
হার্ভি মোটুলস্কি

5
আপনি পারে প্রকাশিত সাম্প্রতিক এই নিবন্ধে আগ্রহী হতে পারেন, পাঁচ-পয়েন্টের লিকার্ট আইটেমস: টি পরীক্ষা বনাম মান-হুইটনি- উইলকক্সন , জেএমপি / বিবিএলআরআরএ
chl

আমি নিশ্চিত নই যে চি-স্কোয়ার পরীক্ষাটি উপযুক্ত কিনা, এটি গ্রুপ এবং আইটেমগুলির মধ্যে কোনও নির্ভরতা আছে কিনা তা পরীক্ষা করে (গ্রুপগুলির মধ্যে বিভিন্ন বিতরণ)।
পে-পি-আরি

উত্তর:


12

ক্লাসন ও ডর্মোডি লাইকার্ট আইটেমগুলির জন্য পরিসংখ্যানগত পরীক্ষার বিষয়টি ( স্বতন্ত্র লাইকার্টের ধরণের আইটেমগুলির দ্বারা পরিমাপ করা ডেটা বিশ্লেষণ ) বিষয়ে আলোচনা করেছিলেন । আমি মনে করি যে দুটি ডিস্ট্রিবিউশন একই রকম দেখায় (বেলের আকারের এবং সমান বৈকল্পিক) বুটস্ট্র্যাপযুক্ত পরীক্ষা ঠিক আছে। তবে শ্রেণীবদ্ধ তথ্য (যেমন ট্রেন্ড বা ফিশার পরীক্ষা, বা অর্ডিনাল লজিস্টিক রিগ্রেশন) এর জন্য একটি পরীক্ষা আকর্ষণীয় হবে কারণ এটি আইটেমের বিভাগগুলিতে প্রতিক্রিয়া বিতরণের জন্য যাচাই করতে দেয়, শ্রেণিবদ্ধ ডেটা অ্যানালাইসিসে অ্যাগ্রেস্টির বইটি দেখুন ( লগিট মডেলগুলির জন্য অধ্যায় 7) বহুজাতিক প্রতিক্রিয়া )।

এগুলি বাদ দিয়ে, আপনি এমন পরিস্থিতিগুলি কল্পনা করতে পারেন যেখানে দুটি দলের মধ্যে প্রতিক্রিয়া বিতরণ দৃ strongly়ভাবে ভারসাম্যহীন হলে টি-টেস্ট বা অন্য কোনও প্যারাম্যাট্রিক পরীক্ষা ব্যর্থ হবে। উদাহরণস্বরূপ, গ্রুপ এ থেকে সমস্ত লোক যদি 1 বা 5 উত্তর দেয় (সমান অনুপাতের ক্ষেত্রে) যেখানে বি গ্রুপের সমস্ত লোক 3 উত্তর দেয়, তবে আপনি গ্রুপ-গ্রুপের মধ্যে অভিন্নরূপে শেষ করেন এবং পরীক্ষাটি মোটেই অর্থবহ নয় যদিও এই ক্ষেত্রে সমকামিতা অনুমানের মূলত লঙ্ঘন করা হয়।


ক্লাসন এবং ডর্মোডি নিবন্ধটি দুর্দান্ত দেখাচ্ছে। আপনার প্রতিক্রিয়া বিতরণ মন্তব্য মনন আকর্ষণীয়। আমি সম্মত হই যে বিতরণগুলির মধ্যে পার্থক্যগুলি আগ্রহী হতে পারে। তবে আপনি যদি জনসংখ্যার গোষ্ঠীগুলির অর্থগুলি আলাদা ছিল কিনা তাতেই আগ্রহী হন তবে বিতরণগুলি এ জাতীয় সাম্যকে কী উত্থাপন করেছিল তা বিবেচ্য নয়।
জেরোমি অ্যাংলিম

এই ক্ষেত্রে, আপনি ধরে নিচ্ছেন যে আপনার লিকার্ট স্কেল (অন্য কথায়, এর মধ্যে অনুভূত পার্থক্য, যেমন অনেক সন্তুষ্ট এবং "ঠিক" সন্তুষ্ট) আদর্শভাবে আচরণ করে এবং উভয় জনগোষ্ঠীর মধ্যে একই অর্থ হিসাবে বিবেচিত হয়। সুতরাং আপনি স্পষ্টভাবে ধারণাটি নিচ্ছেন যে এটি একটি সংখ্যার স্কেল, তবে আমি সম্মত হই যে এটি প্রায়শই প্রয়োগিত গবেষণায় যেমন বিবেচিত হয়, বিশেষত যদি অংশগ্রহণকারীরা একই দেশ থেকে আসে। আমার বক্তব্যটি কেবল শ্রেণিবদ্ধ ডেটা বিশ্লেষণের দৃষ্টিভঙ্গির উপর জোর দেওয়ার জন্য ছিল, যেমনটি ফ্যাক্টর বিশ্লেষণ traditionতিহ্যের মধ্যে সাধারণত পাওয়া যায়, যেমন প্রশ্ন # 10 এর আমার জবাব।
chl

আমি ধরে নিয়েছি যে লিকার্ট আইটেমটিতে প্রতিক্রিয়া জানানো নমুনার গড়টি সাধারণত অন্তর্নিহিত মাত্রায় গ্রুপের অবস্থানের একটি অর্থপূর্ণ সংক্ষিপ্তসার। যখন লিকার্ট আইটেমটির অর্থ গোষ্ঠীগুলির মধ্যে পদ্ধতিগতভাবে পরিবর্তিত হয় সে সম্পর্কে ভাবতে আগ্রহী। অবশ্যই, এই সমস্যাটি কেবল লিকার্ট আইটেমের বাইরেও সম্ভবত কোনও সাবজেক্টিভ পরিমাপ পদ্ধতিতে প্রসারিত।
জেরোমি অ্যাংলিম

8

প্রশ্নে থাকা ডেটাসেটের আকারের উপর নির্ভর করে কোনও বুটস্ট্র্যাপের জন্য ক্রমুয়েশন পরীক্ষা করা ভাল যে এটি অনুমানের (এবং একটি সঠিক সিআই) সঠিক পরীক্ষা দিতে সক্ষম হতে পারে।


4

আইএমএইচও আপনি লিকার্ট স্কেলের জন্য একটি টি-টেস্ট ব্যবহার করতে পারবেন না। লিকার্ট স্কেলটি নিয়মিত এবং কেবল একটি ভেরিয়েবলের মানগুলির সম্পর্কের সম্পর্কে "জানে": যেমন "সম্পূর্ণ অসন্তুষ্ট" "কোনওভাবে অসন্তুষ্ট" এর চেয়েও খারাপ। অন্যদিকে একটি টি-পরীক্ষার মাধ্যম এবং আরও অনেকগুলি গণনা করা দরকার এবং এর জন্য অন্তরীন ডেটার প্রয়োজন। আপনি অন্তর্বর্তী ডেটাতে লিকার্ট স্কেল স্কোরগুলিকে মানচিত্র করতে পারেন ("সম্পূর্ণ অসন্তুষ্ট" 1 এবং তেমনি) তবে "সম্পূর্ণ অসন্তুষ্ট" "কোনওভাবে অসন্তুষ্ট" এর একই দূরত্ব যেমন "কোনওরকম অসন্তুষ্ট" "উভয়ই নয়" থেকেও কেউ নিশ্চিত করে না। যাইহোক: "সম্পূর্ণ অসন্তুষ্ট" এবং "কোনওভাবে অসন্তুষ্ট" এর মধ্যে পার্থক্য কী? সুতরাং শেষ অবধি, আপনি আপনার অরডিনাল ডেটার কোডেড মানগুলিতে একটি টি-টেস্ট করতে চাইবেন তবে এটি কোনও অর্থ দেয় না।


9
... এবং এখনও এটি সম্পন্ন হয়। একটি বিষয় উল্লেখ করার জন্য, এবং হ্যাঁ এটি একটি সামান্য পেডেন্টিক, যদি আপনি কোনও একক লিকার্ট ধরণের আইটেম ব্যবহার করেন যা লিকার্ট স্কেল নয়। পার্থক্যটি অর্থবহ (যদিও প্রশ্নকারী প্রশ্নকর্তা একটি লিকার্ট আইটেমের বিষয়ে কথা বলছেন এবং অভিন্নতা একটি বিষয়) is একটি লিকার্ট স্কেল বেশ কয়েকটি লিকার্ট আইটেমের যোগফল বা গড় গড় ফল। এই পদ্ধতির নির্দিষ্টভাবে অর্ডিনাল ডেটা যে পরিমাণে অর্ডিনাল ছিল তা অফসেট করার জন্য এবং এটিকে ব্যবস্থার স্কেল হিসাবে বিবেচনা করা আরও যুক্তিসঙ্গত করার জন্য বিশেষভাবে তৈরি করা হয়েছিল was
রাসেলপিয়ের্স

3

প্রশ্নাবলীর প্রতিটি আইটেম যদি নিয়মিত হয় এবং আমি মনে করি না যে "দৃ agree়ভাবে সম্মত" এবং "সম্মত" এর মধ্যে পরিমাণগত পার্থক্য কি না তা জানার কোনও উপায় না থাকলে এই বিন্দুটি বিতর্কিত হতে পারে " দৃ strongly়ভাবে অসম্মতিপূর্ণ "এবং" অসম্মতি ", তবে কেন এই সমস্ত সাধারণ স্তরের স্কেলগুলির সংমিশ্রণটি এমন কোনও মান তৈরি করবে যা সত্য বিরতি স্তরের ডেটার বৈশিষ্ট্যগুলি ভাগ করে?

উদাহরণস্বরূপ, যদি আমরা হতাশার আবিষ্কারগুলির ফলাফলগুলি ব্যাখ্যা করে থাকি তবে "20" এর স্কোর প্রাপ্ত ব্যক্তি "স্কোর" সহকারীর চেয়ে দ্বিগুণ হতাশায় পড়েছেন তা বোঝা যায় না 10 "। এর কারণ প্রশ্নাবলীর প্রতিটি আইটেম হতাশার মাত্রার প্রকৃত পার্থক্য পরিমাপ করছে না (ধরে নিচ্ছেন যে হতাশা স্থিতিশীল, উদ্দেশ্যমূলক, জৈবিক ব্যাধি) তবে বরং ব্যক্তির একটি নির্দিষ্ট বক্তব্যের সাথে চুক্তির বিষয়গত রেটিং। যখন জিজ্ঞাসা করা হয়, "আপনি কীভাবে হতাশ হয়ে বলবেন যে আপনার মেজাজ 1-4-এর স্কেল, 1 টি খুব হতাশাগ্রস্থ এবং 4 জন একেবারে হতাশ নয়", আমি কীভাবে জানব যে একজন উত্তরদাতাদের 1 এর সাবজেক্টিভ রেটিং অন্য উত্তরদাতাদের মতো ? অথবা আমি কীভাবে জানতে পারি যে 4 এবং 3 এর মধ্যে পার্থক্যটি ব্যক্তির ক্ষেত্রে 3 এবং 4 এর মতই ' ডিপ্রেসনের বর্তমান স্তরের.যদি আমরা এর কোন কিছুই জানতে না পারি, তবে এই সমস্ত অর্ডিনাল আইটেমগুলির সংমিশ্রণকে অন্তর স্তরের ডেটা হিসাবে বিবেচনা করার কোনও মানে হয় না। এমনকি যদি ডেটা একটি সাধারণ বিতরণ গঠন করে তবে আমি মনে করি না যে স্কোরের মধ্যে পার্থক্যগুলিকে অন্তর্বর্তী স্তরের ডেটা হিসাবে গণ্য করা যদি তাদের পছন্দসই-আইটেমগুলিতে সমস্ত প্রতিক্রিয়া যোগ করে গণনা করা হয় তবে তা উপযুক্ত বলে মনে করি না। ডেটাগুলির একটি সাধারণ বিতরণের অর্থ কেবলমাত্র যে প্রতিক্রিয়াগুলি সম্ভবত বৃহত্তর জনগোষ্ঠীর প্রতিনিধি; এটি বোঝায় না যে তালিকা থেকে প্রাপ্ত মানগুলি অন্তর স্তরের ডেটার গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি ভাগ করে। t মনে হয় স্কোরের মধ্যে পার্থক্যগুলি ব্যবধান স্তরের ডেটা হিসাবে বিবেচনা করা যদি তাদের পছন্দসই আইটেমগুলিতে সমস্ত প্রতিক্রিয়া যোগ করে গণনা করা হয়। ডেটাগুলির একটি সাধারণ বিতরণের অর্থ কেবলমাত্র যে প্রতিক্রিয়াগুলি সম্ভবত বৃহত্তর জনগোষ্ঠীর প্রতিনিধি; এটি বোঝায় না যে তালিকা থেকে প্রাপ্ত মানগুলি অন্তর স্তরের ডেটার গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি ভাগ করে। t মনে হয় স্কোরের মধ্যে পার্থক্যগুলি ব্যবধান স্তরের ডেটা হিসাবে বিবেচনা করা যদি তাদের পছন্দসই আইটেমগুলিতে সমস্ত প্রতিক্রিয়া যোগ করে গণনা করা হয়। ডেটাগুলির একটি সাধারণ বিতরণের অর্থ কেবলমাত্র যে প্রতিক্রিয়াগুলি সম্ভবত বৃহত্তর জনগোষ্ঠীর প্রতিনিধি; এটি বোঝায় না যে তালিকা থেকে প্রাপ্ত মানগুলি অন্তর স্তরের ডেটার গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি ভাগ করে।

আমরা অধ্যয়নরত প্রচ্ছন্ন ভেরিয়েবলগুলির সাথে কথা বলতে আমরা কীভাবে পরিসংখ্যান ব্যবহার করি সে সম্পর্কে আচরণগত বিজ্ঞানগুলিতে আমাদের সাবধান হওয়া উচিত, কারণ এই অনুমানিক গঠনগুলি পরিমাপের জন্য সরাসরি কোনও উপায় নেই, সুতরাং যখন আমরা বিষয়গুলি পরিমিত করার চেষ্টা করি তখন সেখানে উল্লেখযোগ্য সমস্যা দেখা দিতে পারে প্যারামেট্রিক পরীক্ষায়। আবার, কেবলমাত্র যে কারণে আমরা প্রতিক্রিয়ার একটি সেটকে মান নির্ধারণ করেছি তার অর্থ এই নয় যে এই মানগুলির মধ্যে পার্থক্যগুলি অর্থবহ।


1
আপনি যদি আইটেমের স্কোর সংমিশ্রিত করে থাকেন তবে আপনি ইতিমধ্যে পরিমাপের কঠোর অর্ডিনাল স্তরের চেয়ে বেশি ধরে নিয়েছেন। কড়া কথায় বলতে গেলে, সাধারণ পদক্ষেপগুলি অর্থপূর্ণভাবে যুক্ত বা গড় করা যায় না (ঘটনাক্রমে, স্টিভেনস সে সম্পর্কে পরিষ্কার)। একবার এটি হয়ে গেলে, ফলাফল প্রাপ্ত স্কোরগুলিকে বিরতি স্তরের ডেটা হিসাবে গণ্য করা পুরোপুরি যুক্তিসঙ্গত।
গালা

0

লিকার্ট আইটেম স্কেলের টি-টেস্টের তুলনায় আনুপাতিক বৈষম্যের অনুপাত মডেল আরও ভাল।


1
আপনি কি আপনার কারণ ব্যাখ্যা করতে চান? আমি দেখতে পাচ্ছি যে এই জাতীয় মডেল কীভাবে পর্যবেক্ষণ করা প্রতিক্রিয়ার একটি আরও সুনির্দিষ্ট মডেল সরবরাহ করতে পারে। যাইহোক, আমি যে আদর্শিক ব্যবহারিক গবেষণামূলক পরিস্থিতিতে দেখেছি, গবেষকরা আগ্রহ নিয়ে আগ্রহী যে দুটি গ্রুপের অর্থের ক্ষেত্রে আলাদা হয় (উদাহরণস্বরূপ, প্রশিক্ষণ গ্রুপটি নিয়ন্ত্রণের চেয়ে আরও বেশি পারফরম্যান্সের রিপোর্ট করেছিল; এক বছরের পরের বছর পর্যন্ত ছাত্রদের সন্তুষ্টি বেশি ছিল) )। আনুপাতিক প্রতিকূলতা অনুপাত মডেল আমি যতটা সচেতন ঠিক এই প্রশ্নটি পরীক্ষা করে না।
জেরোমি অ্যাংলিম

0

আমি এই প্রসঙ্গে আনুপাতিক বৈষম্য রেশিও মডেলটি ব্যাখ্যা করার চেষ্টা করব যেহেতু এই প্রশ্নের কমপক্ষে 2 টি উত্তরে এটি প্রস্তাবিত এবং ইঙ্গিত করা হয়েছিল।

একটি আনুপাতিক প্রতিকূল মডেলের স্কোর পরীক্ষা উইলকক্সন র‌্যাঙ্কের সমষ্টি পরীক্ষার সমতুল্য।

আরও স্পষ্টভাবে, সাধারণ ফলাফলের জন্য আনুপাতিক প্রতিকূল সংশ্লেষিত লজিস্টিক রিগ্রেশন মডেল (ম্যাককুল্লাগ 1980) এ একক দ্বিধাত্বিক কোভারিয়েটের কোনও প্রভাব না পাওয়ার জন্য স্কোর টেস্টের পরিসংখ্যানটি উইলকক্সন র‌্যাঙ্কের সমষ্টি পরীক্ষার পরিসংখ্যানের সমান দেখানো হয়েছিল। ( জটিল নমুনা জরিপের তথ্যের জন্য উইলকক্সন র‌্যাঙ্ক-সামার পরীক্ষার সম্প্রসারণের প্রমাণ ))

উইলকক্সন র‌্যাঙ্কের সমষ্টি পরীক্ষার মতোই, এই পরীক্ষাটি প্রত্যাশিত মান নির্বিশেষে পৃথক বিতরণ থেকে দুটি নমুনা আঁকা কিনা তা সনাক্ত করে।

যদি আপনি কেবল উইলকক্সন র‌্যাঙ্কের সমষ্টি পরীক্ষার মতো বিভিন্ন প্রত্যাশিত মানগুলির বিতরণ থেকে দুটি নমুনা আঁকেন কিনা তা সনাক্ত করতে চাইলে এই পরীক্ষাটি অবৈধ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.