আমার একটি পুনরাবৃত্ত-পরিমাপের পরীক্ষা রয়েছে যেখানে নির্ভরশীল ভেরিয়েবলটি শতাংশ, এবং আমার স্বাধীন ভেরিয়েবল হিসাবে একাধিক কারণ রয়েছে। আমি glmerআর প্যাকেজটি lme4থেকে এটি একটি লজিস্টিক রিগ্রেশন সমস্যা হিসাবে বিবেচনা করতে ব্যবহার করতে চাই (নির্দিষ্ট করে family=binomial) যেহেতু এটি সরাসরি এই সেটআপটি সামঞ্জস্য করে।
আমার ডেটা দেখতে এমন দেখাচ্ছে:
> head(data.xvsy)
foldnum featureset noisered pooldur dpoolmode auc
1 0 mfcc-ms nr0 1 mean 0.6760438
2 1 mfcc-ms nr0 1 mean 0.6739482
3 0 melspec-maxp nr075 1 max 0.8141421
4 1 melspec-maxp nr075 1 max 0.7822994
5 0 chrmpeak-tpor1d nr075 1 max 0.6547476
6 1 chrmpeak-tpor1d nr075 1 max 0.6699825
এবং এখানে যে आर কমান্ডটি আশা করছিলাম এটি উপযুক্ত হবে:
glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)
এটির সাথে সমস্যাটি হ'ল কমান্ডটি আমার নির্ভরশীল ভেরিয়েবলটি পূর্ণসংখ্যা না হওয়ার বিষয়ে অভিযোগ করে:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
এবং এই (পাইলট) ডেটা বিশ্লেষণ ফলস্বরূপ অদ্ভুত উত্তর দেয়।
আমি বুঝতে পারি binomialপরিবার কেন পূর্ণসংখ্যার প্রত্যাশা করে (হ্যাঁ-না গণনা করা হয়), তবে মনে হয় সরাসরি শতাংশের ডেটা পুনরায় জমা করা ঠিক হবে। এই কিভাবে করবেন?