তালিকাভুক্ত তালিকার তুলনা


15

ধরুন যে দুটি গ্রুপ, এবং n 2 নিয়ে গঠিত প্রতিটি একে একে কমপক্ষে গুরুত্বপূর্ণ থেকে 25 টি আইটেমের একটি সেট দেয়। এই র‌্যাঙ্কিংয়ের তুলনা করার সর্বোত্তম উপায়গুলি কী কী?n1n2

স্পষ্টতই, 25 ম্যান-হুইটনি ইউ পরীক্ষা করা সম্ভব, তবে এর ফলে 25 টি পরীক্ষার ফলাফল ব্যাখ্যা করতে পারে, যা খুব বেশি হতে পারে (এবং, কঠোর ব্যবহারে, একাধিক তুলনার প্রশ্ন উত্থাপন করে)। আমার পক্ষে এটিও সম্পূর্ণ পরিষ্কার নয় যে পদগুলি এই পরীক্ষার সমস্ত অনুমানকে সন্তুষ্ট করে satis

আমি রেটিং বনাম র‌্যাঙ্কিংয়ে সাহিত্যের দিকেও পয়েন্টারগুলিতে আগ্রহী।

কিছু প্রসঙ্গ: এই 25 টি আইটেমগুলি সমস্ত শিক্ষার সাথে সম্পর্কিত এবং দুটি গ্রুপ বিভিন্ন ধরণের শিক্ষক। দুটি গ্রুপই ছোট।

@Ttnphns এর প্রতিক্রিয়াতে সম্পাদনা করুন:

আমি গ্রুপ 1-এ আইটেমের মোট র‌্যাঙ্কটি 2 গ্রুপের সাথে তুলনা করার অর্থ চাইনি - এটি একটি ধ্রুবক হবে, যেমন @ttnphns উল্লেখ করেছে। তবে গ্রুপ 1 এবং গ্রুপ 2 এর র‌্যাঙ্কিং আলাদা হবে; অর্থাৎ, গ্রুপ 1 আইটেম 1 টি গ্রুপ 2 এর চেয়ে বেশি র‌্যাঙ্ক করতে পারে।

আমি তাদের সাথে আইটেম অনুসারে আইটেমের তুলনা করতে পারি, প্রতিটি আইটেমের গড় বা মিডিয়ান র‌্যাঙ্ক পেয়েছি এবং 25 টি পরীক্ষা করতে পারি, তবে আমি ভাবছিলাম যে এটি করার আরও ভাল কোনও উপায় আছে কিনা।


1
যদি প্রতিটি ব্যক্তি 25 টি ভেরিয়েবল জুড়ে 25 টি আইটেমের স্থিতি করে তবে এটি একটি ধ্রুবক (325)। প্রদত্ত যে, আপনি কি বলার অপেক্ষা রাখে না মানে কী the best ways to compare these rankings- কি 2 গ্রুপ BW পার্থক্য ধরণ আপনাকে জানতে চাই?
ttnphns

2
প্রতিটি গ্রুপের জন্য কিমানির মিডিয়ান গণনা করা যেতে পারে? আমি নিজে এটি করে নিই এবং জানি না যে 2 টি ফলাফলের পরিসংখ্যানগত তুলনায় তুলনা করা যেতে পারে (অর্থাত্ জনসংখ্যার প্রতি লক্ষ্য রেখে)।
ttnphns

1
আর একটি বিকল্প পুনরাবৃত্তি হতে পারে নিয়মিত আধিপত্যের ব্যবস্থা করে (যেখানে ইন্টারঅ্যাকশনটি ডাব্লু গ্রুপ ফ্যাক্টর এবং আরএম ফ্যাক্টরটি আপনার ইন্টেরেস হবে); এটি বহু-জাতীয় বিতরণ এবং লগইট লিঙ্কের সাথে জিইই মডেলের মাধ্যমে করা যেতে পারে। তবে, আবারও, যেহেতু 25 টি আইটেম জুড়ে যোগফল একটি ধ্রুবক, আমি এখন এটি বলতে পারি না এটি গাণিতিকভাবে বৈধ কিনা।
ttnphns

2
আমার কাছে বইটি নেই, তবে ডি হ্যান্ডের "পরিমাপ তত্ত্ব এবং অনুশীলন" এমন কিছু সমস্যা নিয়ে আলোচনা করেছে যা এর অনুরূপ মনে হয়। র‌্যাঙ্কিংয়ের "পার্থক্য" সম্পর্কে আপনি বিশেষত কী জানতে চান। উদাহরণস্বরূপ, আপনি কি প্রতিটি গ্রুপের জন্য প্রথমে একটি সামগ্রিক র‌্যাঙ্কিং তৈরি করতে পারবেন না এবং তারপরে র‌্যাঙ্কের পারস্পরিক সম্পর্ক নিতে পারেন?
করোন

2
@ পিটারফ্লম আপনি কি অবশেষে র‌্যাঙ্কের তুলনার সমাধান খুঁজে পেয়েছেন? যদি হ্যাঁ, আপনি কি এটি পোস্ট করতে আপত্তি করবেন? :)
মার্ক হেকম্যান

উত্তর:


6

সারসংক্ষেপ

আমি বিশদ বিভাগে আমার মতামত শেয়ার করি । আমি মনে করি আমরা সত্যিকার অর্থে কী অর্জন করতে চাই সেগুলি সনাক্ত করতে তারা দরকারী।

আমি মনে করি যে এখানে প্রধান সমস্যাটি হ'ল আপনি কোনও র‌্যাঙ্কের মিলের অর্থ কী তা নির্ধারণ করেন নি। অতএব, স্তরগুলির মধ্যে পার্থক্য পরিমাপের কোন পদ্ধতিটি ভাল তা কেউ জানে না।

কার্যকরভাবে, এটি অনুমানের ভিত্তিতে একটি পদ্ধতিটি অস্পষ্টভাবে বেছে নিতে আমাদের ছেড়ে দেয়।

আমি সত্যিই যা প্রস্তাব করি তা হ'ল প্রথমে একটি গাণিতিক অপ্টিমাইজেশনের লক্ষ্য নির্ধারণ করা। তবেই আমরা নিশ্চিত হব যে আমরা আসলে কী চাই তা আমরা জানি কিনা।

আমরা যদি না করি তবে সত্যিকার অর্থে আমরা কী চাই তা জানে না। আমরা পারে প্রায় জানেন আমরা কি চাই, কিন্তু প্রায় বুদ্ধিমান বুদ্ধিমান

আমার টেক্সট বিবরণ মূলত একটি গাণিতিক সংজ্ঞা পৌঁছনো প্রতি একটি পদক্ষেপ পদমর্যাদার আদল । একবার আমরা এটি পেরেক দিয়েছি, আমরা আত্মবিশ্বাসের সাথে এই জাতীয় মিলের পরিমাপের সেরা পদ্ধতিটি বেছে নিতে এগিয়ে যেতে পারি।

বিস্তারিত

আপনার এক মন্তব্যের উপর ভিত্তি করে:

  • " উদ্দেশ্য হ'ল দুটি গ্রুপের র‌্যাঙ্কিং আলাদা হয় কিনা ", পিটার ফ্লুম।

উদ্দেশ্যটির কঠোরভাবে ব্যাখ্যা করার সময় এর উত্তর দিতে :

  • i{1,2,,25}iaibiaiiabib
  • অন্যথায়, র‌্যাঙ্কগুলি আলাদা নয়।

তবে আমি মনে করি না যে আপনি সত্যিই সেই কঠোর ব্যাখ্যা চান । অতএব, আমি মনে করি আপনি যা বলতে চেয়েছিলেন তা হ'ল:

  • ab

ab

n13ab3

তবে এই পদ্ধতি কি উপযুক্ত? এর উত্তর দিতে, আসুন এটি আরও গভীরভাবে দেখুন:

  • a,b3c,d123a,bc,dc,d

  • এটি ধরে নেওয়া হয় যে প্রতিটি সম্পাদনার ব্যয় হপ সংখ্যার সাথে সামঞ্জস্য রেখে লিনিয়ার । এটি কি আমাদের অ্যাপ্লিকেশন ডোমেনের জন্য সত্য? এটি একটি লজিস্টিক সম্পর্ক আরও উপযুক্ত যে হতে পারে ? না কোনও ঘৃণ্য ?

  • 15

একবার আমরা উপরের পয়েন্টগুলিকে সম্বোধন করি এবং দুটি স্তরের মধ্যে যথাযথ মাপকাঠি পৌঁছানোর পরে আমাদের আরও আকর্ষণীয় প্রশ্ন জিজ্ঞাসা করতে হবে, যেমন:

  • ab

5

এটি 'উইলকক্সন স্বাক্ষরিত-র‌্যাঙ্ক পরীক্ষা' ( উইকিপিডিয়া লিঙ্ক ) এর মতো শোনাচ্ছে । ধরে নিই যে আপনার র‌্যাঙ্কের মান একই সেট (যেমন [1, 25]) থেকে এসেছে তবে এটি একটি যুক্ত-পার্থক্য পরীক্ষা (নাল-হাইপোথিসিসের সাথে এই জোড়াটি এলোমেলোভাবে বাছাই করা হয়েছিল)। এনবি এটি একটি ডিস-মিল মিল স্কোর!

উইকি পৃষ্ঠায় লিঙ্কযুক্ত Rএবং Pythonবাস্তবায়ন উভয়ই রয়েছে ।


মজাদার. আমি জোড় পার্থক্য উইলকক্সনের কথা শুনিনি।
পিটার ফ্লুম - মনিকা পুনরায়

3

সতর্কতা: এটি একটি দুর্দান্ত প্রশ্ন এবং আমি উত্তরটি জানি না, সুতরাং এটি "আমার যদি করণীয় হয় তবে আমি কী করতাম" এর চেয়ে বেশি এটি ছিল:

এই সমস্যাটিতে অনেকগুলি ডিগ্রি স্বাধীনতা এবং প্রচুর তুলনা করা যায় যেগুলি করতে পারেন, তবে সীমিত ডেটার সাথে এটি দক্ষতার সাথে ডেটা একত্রিত করার বিষয়। কোন পরীক্ষাটি চালাতে হবে তা যদি আপনি না জানেন তবে আপনি সর্বদা অনুমান ব্যবহার করে একটি "আবিষ্কার" করতে পারেন:

প্রথমে আমরা দুটি ফাংশন সংজ্ঞায়িত করি:

  • ভোটিং ফাংশন : র‌্যাঙ্কিংগুলি কীভাবে স্কোর করা যায় যাতে আমরা একটি গোষ্ঠীর সমস্ত র‌্যাঙ্কিং একত্রিত করতে পারি। উদাহরণস্বরূপ, আপনি শীর্ষ স্থানের আইটেমটিতে 1 পয়েন্ট এবং অন্য সকলকে 0 প্রদান করতে পারেন। আপনি যদিও প্রচুর তথ্য হারাবেন, সুতরাং এমন কিছু ব্যবহার করা আরও ভাল: শীর্ষ স্থান অধিকারী আইটেমটি 1 পয়েন্ট, দ্বিতীয় স্থান 2 পয়েন্ট ইত্যাদি পায় better

  • তুলনা ফাংশন : দুটি গোষ্ঠীর মধ্যে দুটি সংযুক্ত স্কোরের তুলনা কীভাবে করা যায়। যেহেতু উভয়ই ভেক্টর হবেন, তাই পার্থক্যের উপযুক্ত আদর্শ গ্রহণ করা কার্যকর হবে।

এখন নিম্নলিখিতগুলি করুন:

  1. প্রথমে দুটি গ্রুপ জুড়ে প্রতিটি আইটেমের জন্য ভোটিং ফাংশনটি ব্যবহার করে গড় স্কোর গণনা করে একটি পরীক্ষার পরিসংখ্যান গণনা করুন, এটি 25 আকারের দুটি ভেক্টরকে নিয়ে যেতে হবে।
  2. তারপরে তুলনা ফাংশনটি ব্যবহার করে দুটি ফলাফলের তুলনা করুন, এটি আপনার পরীক্ষার পরিসংখ্যান হবে।

সমস্যাটি হ'ল আমরা পরীক্ষার পরিসংখ্যানগুলির নালীর নীচে বিতরণ জানি না যে উভয় গ্রুপই এক। তবে সেগুলি যদি একই হয় তবে আমরা দলবদ্ধভাবে পর্যবেক্ষণগুলি এলোমেলো করে ফেলতে পারি।

n1

প্রক্রিয়াটি প্রায় 1000 বার পুনরাবৃত্তি করুন এবং এখন অনুক্রমের নাল বিতরণ হিসাবে ক্রমশক্তি পরীক্ষার পরিসংখ্যানগুলি ব্যবহার করুন। এটি আপনাকে একটি পি-মান গণনা করার অনুমতি দেবে এবং একটি দুর্দান্ত হিস্টোগ্রাম তৈরি করতে ভুলবেন না এবং আপনার পরীক্ষার পরিসংখ্যানগুলির মতো একটি লাইন আঁকতে ভুলবেন না:

হিস্টগ্রাম অনুগমন পরীক্ষা l1

l1l1l2

হিস্টগ্রাম অনুগমন পরীক্ষা l2

তবে সেটিংটির উপর নির্ভর করে, আমি আশা করি প্রচুর অভ্যন্তরীণ এলোমেলোতা থাকতে পারে এবং ক্যাপচার-সমস্ত পদ্ধতির কাজ করতে আপনার বেশ বড় আকারের নমুনা আকারের প্রয়োজন হবে need আপনার যদি নির্দিষ্ট বিষয় সম্পর্কে পূর্ববর্তী জ্ঞান থাকে তবে আপনি মনে করেন যে দুটি গ্রুপের মধ্যে আলাদা হতে পারে (নির্দিষ্ট আইটেমগুলি বলুন), তবে এটি আপনার দুটি কার্যকারিতা অনুসারে ব্যবহার করুন। (অবশ্যই, আপনি পরীক্ষা চালানোর আগে সাধারনত এটি করুন এবং যত তাড়াতাড়ি কোনও উল্লেখযোগ্য কিছু না পাওয়া পর্যন্ত চেরি-পিক ডিজাইন করবেন না )

আপনি যদি আমার (অগোছালো) কোডটিতে আগ্রহী হন তবে PS আমাকে একটি বার্তা দিন। এখানে যোগ করার জন্য এটি অনেক দীর্ঘ but তবে এটি আপলোড করে আমি খুশি হব।


আমি আসলেই এই ধারণাটি পছন্দ করেছি।
পিটার ফ্লুম - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.