আমার একটি পুনরাবৃত্ত-পরিমাপের পরীক্ষা রয়েছে যেখানে নির্ভরশীল ভেরিয়েবলটি শতাংশ, এবং আমার স্বাধীন ভেরিয়েবল হিসাবে একাধিক কারণ রয়েছে। আমি glmer
আর প্যাকেজটি lme4
থেকে এটি একটি লজিস্টিক রিগ্রেশন সমস্যা হিসাবে বিবেচনা করতে ব্যবহার করতে চাই (নির্দিষ্ট করে family=binomial
) যেহেতু এটি সরাসরি এই সেটআপটি সামঞ্জস্য করে।
আমার ডেটা দেখতে এমন দেখাচ্ছে:
> head(data.xvsy)
foldnum featureset noisered pooldur dpoolmode auc
1 0 mfcc-ms nr0 1 mean 0.6760438
2 1 mfcc-ms nr0 1 mean 0.6739482
3 0 melspec-maxp nr075 1 max 0.8141421
4 1 melspec-maxp nr075 1 max 0.7822994
5 0 chrmpeak-tpor1d nr075 1 max 0.6547476
6 1 chrmpeak-tpor1d nr075 1 max 0.6699825
এবং এখানে যে आर কমান্ডটি আশা করছিলাম এটি উপযুক্ত হবে:
glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)
এটির সাথে সমস্যাটি হ'ল কমান্ডটি আমার নির্ভরশীল ভেরিয়েবলটি পূর্ণসংখ্যা না হওয়ার বিষয়ে অভিযোগ করে:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
এবং এই (পাইলট) ডেটা বিশ্লেষণ ফলস্বরূপ অদ্ভুত উত্তর দেয়।
আমি বুঝতে পারি binomial
পরিবার কেন পূর্ণসংখ্যার প্রত্যাশা করে (হ্যাঁ-না গণনা করা হয়), তবে মনে হয় সরাসরি শতাংশের ডেটা পুনরায় জমা করা ঠিক হবে। এই কিভাবে করবেন?