আমি একটি সিএসভি ফাইল থেকে কিছু মেশিন লার্নিং ডেটা লোড করি। প্রথম 2 টি কলাম পর্যবেক্ষণ এবং বাকী কলামগুলি বৈশিষ্ট্য।
বর্তমানে, আমি নিম্নলিখিতগুলি করি:
data = pandas.read_csv('mydata.csv')
যা এরকম কিছু দেয়:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
আমি দুই dataframes এই dataframe যেভাবেই চাই: এক কলাম ধারণকারী a
এবং b
এবং এক কলাম ধারণকারী c
, d
এবং e
।
এরকম কিছু লেখা সম্ভব নয়
observations = data[:'c']
features = data['c':]
আমি নিশ্চিত না যে সেরা পদ্ধতিটি কী। আমার কি দরকার pd.Panel
?
যাইহোক, আমি ডেটাফ্রেম সূচকটি বেশ বেমানান দেখতে পেয়েছি: data['a']
অনুমোদিত, তবে data[0]
তা নয়। অন্যদিকে, data['a':]
অনুমোদিত নয় তবে data[0:]
রয়েছে। এর কোন ব্যবহারিক কারণ আছে কি? এটি প্রদান করে কলামগুলি ইন্ট অনুসারে সূচিত হয় তবে তা সত্যিই বিভ্রান্তিকরdata[0] != data[0:1]
df[5:10]
সারি নির্বাচন করার জন্য যুক্ত করা হয়েছিল ( pandas.pydata.org/pandas-docs/stable/… )