আমি বর্তমানে ধারাবাহিক আচরণগত পরীক্ষাগুলির থেকে ডেটা বিশ্লেষণ করছি যা সকলেই নিম্নলিখিত পরিমাপটি ব্যবহার করে। এই পরীক্ষায় অংশগ্রহণকারীদের ক্লুগুলি নির্বাচন করতে বলা হয় যা (কল্পনাপ্রসূত) অন্যান্য ব্যক্তি 10 টি অ্যানাগ্রামের সিরিজ সমাধানে সহায়তা করতে পারে। অংশগ্রহনকারীদের বিশ্বাস করা হয় যে এই অন্যান্য ব্যক্তিরা হয় এনাগ্রামগুলি সমাধানের ক্ষেত্রে তাদের পারফরম্যান্সের উপর নির্ভর করে অর্থ উপার্জন বা হারাবেন। ক্লুগুলি তারা কতটা সহায়ক সে সম্পর্কে তারতম্য। উদাহরণস্বরূপ, রননিং-এর একটি এনজিগ্রাম নুনগ্রিনের জন্য, তিনটি সূত্র হতে পারে:
- দ্রুত চলমান (অসহায়)
- ম্যারাথন দৌড়ে আপনি যা করেন (সহায়ক)
- সবসময় স্বাস্থ্যকর শখ নয় (অপ্রয়োজনীয়)
পরিমাপটি গঠনের জন্য, আমি বারের সংখ্যা গণনা করি (10 এর মধ্যে) একজন অংশগ্রহণকারী অন্য ব্যক্তির জন্য একটি অপ্রয়োজনীয় ক্লু পছন্দ করে। পরীক্ষা-নিরীক্ষায়, লোকেদের নির্বাচন করা ক্লুগুলির সহায়কতাকে প্রভাবিত করতে আমি বিভিন্ন ধরণের হেরফের ব্যবহার করছি।
সহায়কতা / অপ্রয়োজনীয়তা পরিমাপ মোটামুটি দৃ positive়ভাবে ইতিবাচকভাবে আঁকানো হয়েছে (লোকেদের একটি বৃহত অনুপাত সবসময় 10 সবচেয়ে সহায়ক ক্লু বেছে নেয়), এবং পরিমাপটি একটি গণনা পরিবর্তনশীল হওয়ায় আমি এই ডেটাগুলি বিশ্লেষণ করার জন্য একটি পয়েসন জেনারালাইজড লিনিয়ার মডেল ব্যবহার করছি। যাইহোক, যখন আমি পায়সন রিগ্রেশন সম্পর্কে আরও কিছু পাঠ করেছি, আমি আবিষ্কার করেছি যে পয়সন রিগ্রেশন কোনও বিতরণের গড় এবং তারতম্যটি স্বতন্ত্রভাবে অনুমান করে না, এটি প্রায়শই ডেটা সংকেতের মধ্যে বৈকল্পিকাকে কম করে দেখায়। আমি কুইসিপোসন রিগ্রেশন বা নেগেটিভ বাইনোমিয়াল রিগ্রেশন পয়েসন রিগ্রেশন এর বিকল্পগুলি অনুসন্ধান করতে শুরু করেছি। যাইহোক, আমি স্বীকার করি যে আমি এই ধরণের মডেলগুলির চেয়ে বরং নতুন, তাই আমি এখানে পরামর্শের জন্য আসছি।
এই ধরণের ডেটা ব্যবহারের জন্য কোন মডেলটি ব্যবহার করতে হবে সে সম্পর্কে কারও কি কোনও সুপারিশ রয়েছে? অন্য কোন বিবেচ্য বিষয় যা সম্পর্কে আমার সচেতন হওয়া উচিত (উদাহরণস্বরূপ, একটি নির্দিষ্ট মডেল কি অন্যের চেয়ে বেশি শক্তিশালী?)? আমি নির্বাচিত মডেলটি সঠিকভাবে আমার ডেটা পরিচালনা করছে কিনা তা নির্ধারণের জন্য আমার কী ধরণের ডায়াগনস্টিকের দিকে নজর দেওয়া উচিত?