পান্ডায় ডেটাফ্রেমের প্রথম তিনটি সারি আমার মুছতে হবে।
আমি জানি df.ix[:-1]
শেষ সারিটি সরিয়ে ফেলতে হবে, তবে আমি প্রথম এন সারিগুলি কীভাবে সরিয়ে ফেলব তা আমি বুঝতে পারি না।
পান্ডায় ডেটাফ্রেমের প্রথম তিনটি সারি আমার মুছতে হবে।
আমি জানি df.ix[:-1]
শেষ সারিটি সরিয়ে ফেলতে হবে, তবে আমি প্রথম এন সারিগুলি কীভাবে সরিয়ে ফেলব তা আমি বুঝতে পারি না।
উত্তর:
groupby()
? এটি কাজ করে তবে সূচীতে সদৃশ কলামগুলি ফেরত দেয়df=pd.DataFrame({'v':np.arange(10).tolist()*2,'g':['a']*10+['b']*10});df.groupby('g').apply(lambda x: x.iloc[3:])
df=df.iloc[3:9]
?
pd.concat()
। কিছু একটা df2 = pd.concat([df.iloc[:3],df.iloc[10:]])
,।
আমি মনে করি এটি করার আরও সুস্পষ্ট উপায় হ'ল ড্রপ ব্যবহার করা।
বাক্য গঠনটি হ'ল:
df.drop(label)
এবং @ টিএম এবং @ চ্যামজি দ্বারা চিহ্নিত হিসাবে, এটি যথাস্থানে করা যেতে পারে:
df.drop(label, inplace=True)
এটি প্রয়োগের একটি উপায় হতে পারে:
df.drop(df.index[:3], inplace=True)
এবং অন্য "স্থানে" ব্যবহার করুন:
df.drop(df.head(3).index, inplace=True)
drop
এমনকি স্থানে গণনা করা যেতে পারে (অতিরিক্ত নিয়োগ ছাড়াই)। আরও দ্রুত এবং সহজ!
df.drop(label, inplace=True)
আপনি পাইথন স্লাইসিং ব্যবহার করতে পারেন তবে নোট করুন যে এটি স্থান নেই।
In [15]: import pandas as pd
In [16]: import numpy as np
In [17]: df = pd.DataFrame(np.random.random((5,2)))
In [18]: df
Out[18]:
0 1
0 0.294077 0.229471
1 0.949007 0.790340
2 0.039961 0.720277
3 0.401468 0.803777
4 0.539951 0.763267
In [19]: df[3:]
Out[19]:
0 1
3 0.401468 0.803777
4 0.539951 0.763267
pandas
?
df.drop(df.index[[0,2]])
পান্ডা শূন্য ভিত্তিক সংখ্যায়ন ব্যবহার করে, সুতরাং 0 প্রথম সারিতে, 1 দ্বিতীয় সারিতে এবং 2 তৃতীয় সারিতে।
ইনপ0 = পিডি.ড্রেড_সিএসভি ("ব্যাঙ্ক_মার্কেটিং_পুষ্টিত_ভ1 সিএসভি", স্কিপ্রো = ২)
বা আপনি যদি বিদ্যমান ডাটাফ্রেমে করতে চান তবে
কেবল নিম্নলিখিত আদেশটি করুন
header=3
কন্সট্রাকটর আমার যুক্তি, যা হেডার সারি হিসাবে যে সারি সেট হবে: stackoverflow.com/a/51822697/191246