আপনি যদি পুরো ডেটা সেটটি বিশ্লেষণ করতে না চান তবে আপনি সম্ভবত স্তরযুক্ত নমুনা ব্যবহার করতে পারবেন না , তাই আমি একটি বড় সাধারণ এলোমেলো নমুনা নেওয়ার পরামর্শ দেব । এলোমেলো নমুনা গ্রহণ করে , আপনি নিশ্চিত করেছেন যে নমুনাটি গড়ে পুরো ডেটাসেটের প্রতিনিধিত্ব করবে এবং স্ট্যান্ডার্ড ত্রুটি এবং আত্মবিশ্বাসের অন্তরগুলির মতো নির্ভুলতার মানক পরিসংখ্যানগত ব্যবস্থা আপনাকে জানাবে যে আপনার নমুনা অনুমানের সম্ভাবনা জনসংখ্যার কতটা দূরে রয়েছে হতে পারে, তাই কোনও নমুনা জনসংখ্যার প্রতিনিধি হিসাবে যাচাই করার কোনও সত্যিকারের প্রয়োজন নেই যদি আপনার কিছু উদ্বেগ না থাকে যা সত্যই এলোমেলোভাবে নমুনাযুক্ত হয়েছিল।
একটি সাধারণ এলোমেলো নমুনা কত বড়? ঠিক আছে, নমুনা যত বড় হবে আপনার অনুমানগুলি তত বেশি নির্ভুল হবে। আপনার কাছে ইতিমধ্যে ডেটা রয়েছে বলে প্রচলিত নমুনা আকারের গণনাগুলি সত্যিই প্রযোজ্য নয় - আপনি কম্পিউটারের জন্য যতটা ব্যবহারিক ততটুকু ব্যবহার করতে পারেন dat আপনি যদি এমন জটিল জটিল বিশ্লেষণগুলি করার পরিকল্পনা করছেন যা গণনার সময়কে একটি সমস্যা হিসাবে চিহ্নিত করবে, আপনার পিসিতে পেজিং না করেই সাধারণ র্যান্ডম নমুনাটিকে যত বড় বিশ্লেষণ করা যায় তত সহজ করার জন্য একটি সহজ উপায় হবে approachবা অন্যান্য স্মৃতি সমস্যা। থাম্বের একটি নিয়ম আপনার ডেটাসেটের আকারকে আপনার কম্পিউটারের র্যামের অর্ধেকের বেশি সীমাবদ্ধ করার জন্য যাতে এটির ব্যবহারের জন্য জায়গা থাকতে পারে এবং ওএসের জন্য স্থান ছেড়ে যেতে পারে এবং সম্ভবত আরও কয়েকটি ছোট অ্যাপ্লিকেশন (যেমন সম্পাদক এবং ওয়েব ব্রাউজার) )। আর একটি সীমাবদ্ধতা হ'ল 32-বিট উইন্ডোজ অপারেটিং সিস্টেমগুলি কোনও একক অ্যাপ্লিকেশনটির জন্য ঠিকানা স্থানটিকে এর চেয়ে বড় হতে দেয় না231 বাইটস = 2.1 গিগাবাইট, সুতরাং আপনি যদি 32-বিট উইন্ডোজ ব্যবহার করেন তবে 1 জিবি কোনও ডেটাসেটের আকারের একটি যুক্তিসঙ্গত সীমা হতে পারে।
তারপরে প্রতিটি পর্যবেক্ষণের জন্য আপনার কতগুলি ভেরিয়েবল রয়েছে এবং প্রতিটি ভেরিয়েবল কতগুলি বাইট নেয় তা গণনা করার জন্য কিছু সাধারণ পাটিগণিতের বিষয়।