বড় ডেটা ফ্রেমের পুরো আউটপুট দেখার কোনও কারণ নেই। বড় ডেটা ফ্রেমগুলি দেখতে বা পরিচালনা করতে অকারণে আপনার কম্পিউটার সংস্থানগুলির বৃহত পরিমাণ ব্যবহার করবে।
আপনি যা করছেন তা ক্ষুদ্রায়ণে করা যেতে পারে। ডেটা ফ্রেম যখন ছোট হয় তখন ডেটা কোডিং এবং ম্যানিপুলেট করার পক্ষে কাজ করা আরও সহজ। বড় ডেটা নিয়ে কাজ করার সর্বোত্তম উপায় হ'ল একটি নতুন ডেটা ফ্রেম তৈরি করা যা কেবলমাত্র ছোট অংশ বা বৃহত ডেটা ফ্রেমের একটি ছোট নমুনা নেয়। তারপরে আপনি ডেটা অন্বেষণ করতে পারেন এবং ছোট কোড ফ্রেমে আপনার কোডিং করতে পারেন। একবার আপনি ডেটা অন্বেষণ করে এবং আপনার কোডটি কাজ করে নিলে, কেবলমাত্র সেই কোডটি বৃহত্তর ডেটা ফ্রেমে ব্যবহার করুন।
সবচেয়ে সহজ উপায় হ'ল হেড () ফাংশনটি ব্যবহার করে ডেটা ফ্রেম থেকে প্রথম সারির প্রথম এন সংখ্যাটি নেওয়া সহজ। মাথা ফাংশনটি কেবল এন, সারিগুলির সংখ্যা মুদ্রণ করে। আপনি বড় ডেটা ফ্রেমে হেড ফাংশনটি ব্যবহার করে একটি মিনি ডেটা ফ্রেম তৈরি করতে পারেন। নীচে আমি প্রথম 50 টি সারি নির্বাচন করতে এবং তাদের মানটি ছোট_ডিএফ-তে নির্বাচন করার জন্য বেছে নিয়েছি। এটি ধরে নিয়েছে বিগডাটা হ'ল একটি ডেটা ফাইল যা আপনার এই প্রকল্পের জন্য খোলার লাইব্রেরি থেকে আসে।
library(namedPackage)
df <- data.frame(BigData) # Assign big data to df
small_df <- head(df, 50) # Assign the first 50 rows to small_df
এটি বেশিরভাগ সময় কাজ করবে, তবে কখনও কখনও বড় ডেটা ফ্রেমটি পূর্বনির্ধারিত ভেরিয়েবলগুলির সাথে বা ইতিমধ্যে গোষ্ঠীযুক্ত ভেরিয়েবলগুলির সাথে আসে। বড় ডেটা যদি এমন হয় তবে বড় ডেটা থেকে আপনার সারিগুলির একটি এলোমেলো নমুনা নেওয়া দরকার। তারপরে নিম্নলিখিত কোডটি ব্যবহার করুন:
df <- data.frame(BigData)
set.seed(1016) # set your own seed
df_small <- df[sample(nrow(df),replace=F,size=.03*nrow(df)),] # samples 3% rows
df_small # much smaller df