Ditionতিহ্যগতভাবে আমরা দ্রাঘিমাংশীয় তথ্য মডেল করতে মিশ্র মডেল ব্যবহার করি, যেমন ডেটা:
id obs age treatment_lvl yield
1 0 11 M 0.2
1 1 11.5 M 0.5
1 2 12 L 0.6
2 0 17 H 1.2
2 1 18 M 0.9
আমরা বিভিন্ন ব্যক্তির জন্য র্যান্ডম ইন্টারসেপ্ট বা opeাল ধরে নিতে পারি। তবে আমি যে প্রশ্নটি সমাধান করতে চাইছি তাতে বিশাল ডেটাসেট জড়িত থাকবে (লক্ষ লক্ষ ব্যক্তি, 1 মাসের দৈনিক পর্যবেক্ষণ, অর্থাত প্রতিটি ব্যক্তির 30 টি পর্যবেক্ষণ থাকবে), বর্তমানে আমি জানিনা প্যাকেজগুলি এই স্তরের ডেটা করতে পারে কিনা তা সম্পর্কে আমি অবগত নই।
আমার কাছে স্পার্ক / মাহআউটে অ্যাক্সেস রয়েছে তবে তারা মিশ্র মডেল সরবরাহ করে না, আমার প্রশ্ন হ'ল এমন কি কোনও উপায়ে আছে যে আমি আমার ডেটাটি সংশোধন করতে পারি যাতে আমি এই ডেটাসেটটি মডেল করতে র্যান্ডমফোরেস্ট বা এসভিএম ব্যবহার করতে পারি?
যে কোনও বৈশিষ্ট্য ইঞ্জিনিয়ারিং কৌশলটি আমি উপকৃত করতে পারি যাতে এটি আরএফ / এসভিএমকে স্বতঃসংযোগ সম্পর্কিত অ্যাকাউন্টে সহায়তা করতে পারে?
অনেক ধন্যবাদ!
কিছু সম্ভাব্য পদ্ধতি কিন্তু সেগুলি স্পার্কে লেখার জন্য আমি সময় সাধ্যের মধ্যে ফেলতে পারি নি
আমি কীভাবে এলোমেলো প্রভাবগুলিকে এলোমেলোভাবে অন্তর্ভুক্ত করতে পারি