প্রশ্ন ট্যাগ «dataframe»

একটি ডেটা ফ্রেম একটি সারণী তথ্য কাঠামো। সাধারণত, এটিতে ডেটা থাকে যেখানে সারিগুলি পর্যবেক্ষণ এবং কলামগুলি বিভিন্ন ধরণের ভেরিয়েবল হয়। যদিও "ডেটা ফ্রেম" বা "ডেটা ফ্রেম" এই ধারণার জন্য বেশ কয়েকটি ভাষায় (আর, অ্যাপাচি স্পার্ক, ডিডল, ম্যাপেল, পাইথনের পান্ডাস লাইব্রেরি এবং জুলিয়ার ডেটা ফ্রেম লাইব্রেরি) শব্দ ব্যবহৃত হয়েছে, "টেবিল" শব্দটি ব্যবহৃত হয় ম্যাটল্যাব এবং এসকিউএল।

8
পান্ডাস: সমস্ত কলাম নির্বাচন করার সর্বোত্তম উপায় যার নাম এক্স দিয়ে শুরু হয়
আমার একটি ডেটা ফ্রেম রয়েছে: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'foo.fighters': [0, 1, np.nan, 0, 0, 0], 'foo.bars': [0, 0, 0, 0, 0, 1], 'bar.baz': [5, 5, 6, 5, 5.6, 6.8], 'foo.fox': [2, 4, 1, 0, 0, 5], …

6
আইপিথনে পান্ডাস লাইব্রেরি ব্যবহার করে একটি .xlsx ফাইল কীভাবে পড়বেন?
আমি পাইথনের পান্ডাস লাইব্রেরি ব্যবহার করে একটি .xlsx ফাইলটি পড়তে এবং ডেটা পোস্টগ্রাইএসকিউএল টেবিলটিতে পোর্ট করতে চাই। এখন অবধি আমি যা করতে পেরেছি তা হ'ল: import pandas as pd data = pd.ExcelFile("*File Name*") এখন আমি জানি যে পদক্ষেপটি সফলভাবে সম্পাদিত হয়েছে, তবে আমি জানতে চাই যে আমি যে এক্সেল ফাইলটি …

4
প্যানডাস ডেটা ফ্রেমে ইউনিক্স সময়কে পঠনযোগ্য তারিখে রূপান্তর করুন
আমার কাছে ইউনিক্স সময় এবং দাম সহ একটি ডেটাফ্রেম রয়েছে। আমি সূচী কলামটি রূপান্তর করতে চাই যাতে এটি মানব পাঠযোগ্য তারিখগুলিতে প্রদর্শিত হয়। উদাহরণস্বরূপ আমার সূচী কলামে dateযেমন 1349633705রয়েছে তবে আমি এটি 10/07/2012(বা কমপক্ষে 10/07/2012 18:15) হিসাবে দেখাতে চাই । কিছু প্রসঙ্গে, আমি যে কোডটি নিয়ে কাজ করছি এবং যা …


5
অন্য কলাম প্যান্ডাস ডেটা ফ্রেমের উপর ভিত্তি করে কলাম মান বের করুন
আমি এক ধরণের অন্য ভেরিয়েবলের উপর একটি ভেরিয়েবল কন্ডিশনার মান আহরণে আটকে যাচ্ছি। উদাহরণস্বরূপ, নিম্নলিখিত ডেটাফ্রেম: A B p1 1 p1 2 p3 3 p2 4 আমি Aকখন এর মান পেতে পারি B=3? প্রতিবার যখন আমি এর মানটি বের করেছিলাম তখন আমি Aএকটি স্ট্রিং নয়, একটি জিনিস পেয়েছি।
109 python  pandas  dataframe 

8
সারি-সারি একটি আর ডাটাফ্রেম তৈরি করা
আমি আর-তে একটি ডাটাফ্রেম সারি-সারি সারি তৈরি করতে চাই some একটি একক-সারির ডেটাফ্রেম এবং তালিকা সূচকে একের সাথে এগিয়ে নিয়ে যান। অবশেষে, do.call(rbind,)তালিকায়। এটি কাজ করার সময়, এটি খুব জটিল মনে হয়। একই লক্ষ্য অর্জনের জন্য কি সহজ উপায় নেই? স্পষ্টতই আমি applyএমন কেসগুলিকে উল্লেখ করি যেখানে আমি কিছু ফাংশন …
107 list  r  dataframe 

4
একটি ডেটা ফ্রেম স্থানান্তর করুন
আমাকে একটি বড় ডেটা ফ্রেম স্থানান্তর করতে হবে এবং তাই আমি ব্যবহার করেছি: df.aree <- t(df.aree) df.aree <- as.data.frame(df.aree) এটি আমি পেয়েছি: df.aree[c(1:5),c(1:5)] 10428 10760 12148 11865 name M231T3 M961T5 M960T6 M231T19 GS04.A 5.847557e+03 0.000000e+00 3.165891e+04 2.119232e+04 GS16.A 5.248690e+04 4.047780e+03 3.763850e+04 1.187454e+04 GS20.A 5.370910e+03 9.518396e+03 3.552036e+04 1.497956e+04 GS40.A 3.640794e+03 1.084391e+04 …
107 r  dataframe 

5
মোট পান্ডাস কলাম পান
লক্ষ্য আমার কাছে একাধিক কলাম সহ নীচে দেখানো একটি পান্ডাস ডেটা ফ্রেম রয়েছে এবং মোট কলামটি পেতে চাই MyColumn। ডেটা ফ্রেম -df: print df X MyColumn Y Z 0 A 84 13.0 69.0 1 B 76 77.0 127.0 2 C 28 69.0 16.0 3 D 28 28.0 31.0 4 E …
107 python  pandas  dataframe  sum 

5
পান্ডাস ডেটাফ্রেমের মধ্যে একটি কলামকে ইনট থেকে স্ট্রিংয়ে রূপান্তর করা
মিক্সড ইন এবং স্ট্র ডেটা কলাম সহ আমার পান্ডাসে একটি ডেটাফ্রেম রয়েছে। আমি ডেটাফ্রেমের মধ্যে প্রথমে কলামগুলি সংযুক্ত করতে চাই। এটি করতে আমাকে একটি intকলামে রূপান্তর করতে হবে str। আমি নিম্নলিখিত হিসাবে করার চেষ্টা করেছি: mtrx['X.3'] = mtrx.to_string(columns = ['X.3']) অথবা mtrx['X.3'] = mtrx['X.3'].astype(str) তবে উভয় ক্ষেত্রেই এটি কাজ করছে …
106 python  string  pandas  dataframe  int 

4
পান্ডায় dtype ('O') কী?
পান্ডায় আমার একটি ডেটাফ্রেম রয়েছে এবং আমি এর মানগুলির প্রকারগুলি কী তা নির্ধারণ করার চেষ্টা করছি। কলামটি কী ধরণের তা আমি নিশ্চিত নই 'Test'। যাইহোক, আমি যখন দৌড়ে myFrame['Test'].dtype, আমি পেতে; dtype('O') এটার মানে কি?

2
পাইথন পান্ডাস সহ বিনিং কলাম
আমার কাছে সংখ্যাসূচক মান সহ একটি ডেটা ফ্রেম কলাম রয়েছে: df['percentage'].head() 46.5 44.2 100.0 42.12 আমি কলামটি বিন গণনা হিসাবে দেখতে চাই: bins = [0, 1, 5, 10, 25, 50, 100] এর সাথে ডাবের ফল হিসাবে আমি কীভাবে ফলাফল পেতে পারি value counts? [0, 1] bin amount [1, 5] etc …

10
ফিল্টার পাইপার্ক ডাটাফ্রেম কলামের সাথে কোনও মান নেই
আমি একটি পাইস্পার্ক ডেটা ফ্রেম ফিল্টার করার চেষ্টা করছি যার Noneসারি মান হিসাবে রয়েছে : df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] এবং আমি একটি স্ট্রিং মান দিয়ে সঠিকভাবে ফিল্টার করতে পারি: df[df.dt_mvmt == '2016-03-31'] # some results here তবে এটি ব্যর্থ: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt != None].count() 0 …

6
শূন্য-ভরা প্যান্ডাস ডেটা ফ্রেম তৈরি করা হচ্ছে
প্রদত্ত আকারের শূন্য-ভরা প্যান্ডাস ডেটা ফ্রেম তৈরি করার সর্বোত্তম উপায় কী? আমি ব্যবহার করেছি: zero_data = np.zeros(shape=(len(data),len(feature_list))) d = pd.DataFrame(zero_data, columns=feature_list) এটা করতে একটি ভাল উপায় আছে কি?
105 python  pandas  dataframe 

3
কীভাবে একটি পান্ডাস ডেটা ফ্রেম থেকে মূল্য পেতে হয় এবং সূচি এবং অবজেক্টের ধরণ নয়
বলুন আমার কাছে নিম্নলিখিত ডেটা ফ্রেম রয়েছে চিঠি নম্বর ক ঘ খ 2 সি 3 ডি 4 যা নিম্নলিখিত কোডের মাধ্যমে প্রাপ্ত হতে পারে import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) এখন আমি কলাম লেটারগুলি থেকে মান সি পেতে …
104 python  pandas  dataframe 

1
পান্ডাস ডেটাফ্রেমের জন্য প্রথম কয়েকটি লাইন পড়ার উপায়
সময়ের আগে লাইনগুলির দৈর্ঘ্য না জেনে কোনও ফাইলের read_csvপ্রথম nলাইনগুলি পড়ার জন্য কি অভ্যন্তরীণ কোনও উপায় আছে ? আমার কাছে একটি বড় ফাইল রয়েছে যা পড়তে দীর্ঘ সময় লাগে এবং মাঝে মাঝে কেবলমাত্র তার প্রথম নমুনা পেতে 20 লাইন ব্যবহার করতে চান (এবং পুরো জিনিসটি লোড না করে এটির মাথা …
104 python  pandas  csv  dataframe 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.