আপনি যদি পদক্ষেপের পদ্ধতি ব্যবহার করতে চলেছেন তবে পুনরায় নমুনা দেবেন না। একবার এবং সবার জন্য একটি করে এলোমেলো সাবসামেল তৈরি করুন। এটিতে আপনার বিশ্লেষণ সম্পাদন করুন। আউট-আউট ডেটার বিপরীতে ফলাফলগুলি বৈধ করুন। এটি সম্ভবত বেশিরভাগ "উল্লেখযোগ্য" ভেরিয়েবলগুলি উল্লেখযোগ্য না হয়ে দেখা দেয় turn
( 12/2015 সম্পাদনা করুন: আপনি পুনরায় মডেলিং, পদক্ষেপের পদ্ধতি পুনরাবৃত্তি করে এবং পুনরায় যাচাইকরণের মাধ্যমে সত্যই সাধারণ পদ্ধতির বাইরে যেতে পারেন: এটি আপনাকে ক্রস-বৈধকরণের আকারে নিয়ে যাবে But তবে এ ক্ষেত্রে আরও পরিবর্তনশীলের অত্যাধুনিক পদ্ধতিগুলি রিজ রিগ্রেশন, লাসো এবং ইলাস্টিক নেট এর মতো নির্বাচনটি ধাপে ধাপে রিগ্রেশন করার চেয়ে পছন্দনীয়)
যে ভেরিয়েবলগুলি বোধগম্য হয় তার উপর ফোকাস করুন, যা ডেটা আরও ভাল ফিট করে। 330 রেকর্ডের জন্য যদি আপনার হাতে কয়েক মুখ্য ভেরিয়েবল থাকে তবে আপনার পক্ষে প্রথম স্থানে ওভারফিট করার ঝুঁকি রয়েছে। পদক্ষেপের প্রতিরোধের জন্য মোটামুটি তীব্র প্রবেশ এবং ছেড়ে যাওয়ার মাপদণ্ড ব্যবহার করার বিষয়ে বিবেচনা করুন। এফ টেস্ট বা টি পরীক্ষার জন্য থ্রেশহোল্ডগুলির পরিবর্তে এটি এআইসি বা তে বেস করুন ।সিপিএফটি
(আমি মনে করি আপনি স্বাধীন ভেরিয়েবলগুলির যথাযথ পুনঃপ্রকাশগুলি সনাক্তকরণের জন্য ইতিমধ্যে বিশ্লেষণ এবং অনুসন্ধান চালিয়ে গিয়েছেন, যে আপনি সম্ভবত কার্যকর মিথস্ক্রিয়া সনাক্ত করেছেন এবং আপনি যে প্রতিষ্ঠিত করেছেন যে নির্ভরশীল ভেরিয়েবলের লগাইটের মধ্যে সত্যই একটি লিনিয়ার সম্পর্ক রয়েছে) এবং নিবন্ধকগণ। যদি তা না হয় তবে এই প্রয়োজনীয় প্রাথমিক কাজটি করুন এবং কেবল তখনই ধাপে ধাপে ফিরে আসুন।)
আমি যেমন দিয়েছি যেমন জেনেরিক পরামর্শ অনুসরণ সম্পর্কে সতর্ক থাকুন: --)। আপনার পদ্ধতির বিশ্লেষণের উদ্দেশ্য (ভবিষ্যদ্বাণী? বহির্মুখী? বৈজ্ঞানিক বোঝাপড়া? সিদ্ধান্ত গ্রহণ?) এর পাশাপাশি তথ্যের প্রকৃতি, ভেরিয়েবলের সংখ্যা ইত্যাদির উপর নির্ভর করা উচিত approach