প্রশ্ন ট্যাগ «dataframe»

একটি ডেটা ফ্রেম একটি সারণী তথ্য কাঠামো। সাধারণত, এটিতে ডেটা থাকে যেখানে সারিগুলি পর্যবেক্ষণ এবং কলামগুলি বিভিন্ন ধরণের ভেরিয়েবল হয়। যদিও "ডেটা ফ্রেম" বা "ডেটা ফ্রেম" এই ধারণার জন্য বেশ কয়েকটি ভাষায় (আর, অ্যাপাচি স্পার্ক, ডিডল, ম্যাপেল, পাইথনের পান্ডাস লাইব্রেরি এবং জুলিয়ার ডেটা ফ্রেম লাইব্রেরি) শব্দ ব্যবহৃত হয়েছে, "টেবিল" শব্দটি ব্যবহৃত হয় ম্যাটল্যাব এবং এসকিউএল।

20
ইনডেক্স ব্যবহার করে পান্ডাস ডেটা ফ্রেমে নির্দিষ্ট কক্ষের জন্য মান সেট করুন
আমি একটি পান্ডাস ডেটা ফ্রেম তৈরি করেছি df = DataFrame(index=['A','B','C'], columns=['x','y']) এবং এটি পেয়েছি XY একটি NaN NAN বি এন এন এন সি এনএন এনএএন তারপরে আমি নির্দিষ্ট কক্ষে মান নির্ধারণ করতে চাই, উদাহরণস্বরূপ সারি 'সি' এবং কলাম 'এক্স'। আমি এই জাতীয় ফলাফল পাওয়ার প্রত্যাশা করেছি: XY একটি NaN NAN …
476 python  pandas  dataframe 

10
পান্ডসে মানচিত্র, প্রয়োগচিত্র এবং প্রয়োগের পদ্ধতিগুলির মধ্যে পার্থক্য
আপনি কি আমাকে বলতে পারবেন কখন এই ভেক্টরাইজেশন পদ্ধতিগুলি মৌলিক উদাহরণ সহ ব্যবহার করবেন? আমি দেখতে পাচ্ছি যে mapএটি একটি Seriesপদ্ধতি যেখানে বাকী DataFrameঅংশগুলি। যদিও আমি সম্পর্কে applyএবং applymapপদ্ধতি সম্পর্কে বিভ্রান্ত হয়ে পড়েছিলাম । ডেটাফ্রেমে কোনও ফাংশন প্রয়োগের জন্য কেন আমাদের দুটি পদ্ধতি আছে? আবার, সাধারণ উদাহরণগুলি যা ব্যবহারের বর্ণনা …

15
পান্ডাস ডেটা ফ্রেমকে নুমপি অ্যারে রূপান্তর করুন
আমি কীভাবে একটি পান্ডাস ডেটা ফ্রেমকে নুমপি অ্যারে রূপান্তর করতে পারি তা জানতে আগ্রহী। dataframe: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] …

5
একটি খালি পান্ডস ডেটা ফ্রেম তৈরি করছেন, তারপরে এটি পূরণ করছেন?
আমি এখানে পান্ডাস ডেটা ফ্রেম ডক্স থেকে শুরু করছি: http://pandas.pydata.org/pandas-docs/stable/dsintro.html আমি টাইম সিরিজের ধরণের গণনাতে পুনরাবৃত্তভাবে মান ফ্রেম পূরণ করতে চাই। সুতরাং মূলত, আমি কলাম A, B এবং টাইমস্ট্যাম্প সারিগুলি, সমস্ত 0 বা সমস্ত NAN দিয়ে ডেটাফ্রেম শুরু করতে চাই। আমি তখন প্রাথমিক মানগুলি যুক্ত করব এবং বলব row[A][t] = …
460 python  dataframe  pandas 

24
পান্ডাস ডেটা ফ্রেমের একটি কলামে কীভাবে NaN মানগুলি গণনা করা যায়
আমার কাছে ডেটা রয়েছে, যার মধ্যে আমি সংখ্যাটি খুঁজতে চাই NaN, যাতে এটি যদি কিছু প্রান্তিকের চেয়ে কম হয় তবে আমি এই কলামগুলি বাদ দেব। আমি তাকিয়েছি, কিন্তু এর জন্য কোনও কার্যকারিতা খুঁজে পাইনি। আছে value_counts, তবে এটি আমার পক্ষে ধীর হবে, কারণ বেশিরভাগ মান পৃথক এবং আমি NaNকেবল গণনা …
459 python  pandas  dataframe 

12
আমি কীভাবে প্যান্ডাস ডেটাফ্রেমের কলামে সমস্ত NaN মানগুলি জিরোসের সাথে প্রতিস্থাপন করতে পারি
নীচের মত আমার একটি ডেটাফ্রেম আছে itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 11072 75 …
457 python  pandas  dataframe 

7
কীভাবে পান্ডাস ডেটাফ্রেমের সূচকে একটি কলামে রূপান্তর করা যায়?
এটি বরং সুস্পষ্ট বলে মনে হচ্ছে, তবে আমি কীভাবে ডেটা ফ্রেমের সূচকে একটি কলামে রূপান্তর করব তা অনুভব করতে পারি না? উদাহরণ স্বরূপ: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 প্রতি, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 …
454 python  pandas  dataframe 

11
একটি পান্ডাস ডেটা ফ্রেম থেকে আংশিক স্ট্রিং দ্বারা নির্বাচন করুন
আমার কাছে DataFrame4 টি কলাম রয়েছে যার 2 টিতে স্ট্রিংয়ের মান রয়েছে। আমি ভাবছিলাম যে কোনও নির্দিষ্ট কলামের সাথে আংশিক স্ট্রিং ম্যাচের ভিত্তিতে সারিগুলি নির্বাচন করার কোনও উপায় ছিল কিনা? অন্য কথায়, একটি ফাংশন বা ল্যাম্বদা ফাংশন যা এর মতো কিছু করে re.search(pattern, cell_in_question) একটি বুলিয়ান ফিরে। আমি সিনট্যাক্স সাথে …

7
পান্ডাস গ্রুপবাই ব্যবহার করে প্রতিটি গ্রুপের জন্য পরিসংখ্যান (যেমন গণনা, গড়, ইত্যাদি) পান?
আমার একটি ডেটা ফ্রেম রয়েছে dfএবং আমি এটি থেকে এটিতে বেশ কয়েকটি কলাম ব্যবহার করি groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() উপরের উপায়ে আমি প্রায় আমার প্রয়োজনীয় টেবিল (ডেটা ফ্রেম) পাই। যা অনুপস্থিত তা হ'ল একটি অতিরিক্ত কলাম যা প্রতিটি গ্রুপে সারি সংখ্যা রাখে। অন্য কথায়, আমি বলতে চাইছি তবে আমি জানতে চাই যে …


7
এসকিউএল এর মতো 'ইন' এবং 'ইন না' ব্যবহার করে পান্ডাস ডেটাফ্রেম কীভাবে ফিল্টার করবেন
আমি কীভাবে এসকিউএল INএবং এর সমতুল্য অর্জন করতে পারিNOT IN ? প্রয়োজনীয় মান সহ আমার একটি তালিকা আছে। দৃশ্যটি এখানে: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] আমার এটি করার বর্তমান পদ্ধতিটি নিম্নরূপ: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT …

17
পাইথনের সাথে পান্ডাসে সিএসভি ফাইল পড়ার সময় ইউনিকোড ডিকোডেরর ror
আমি এমন একটি প্রোগ্রাম চালাচ্ছি যা ৩০,০০০ অনুরূপ ফাইল প্রসেস করছে। তাদের মধ্যে এলোমেলো সংখ্যক এই ত্রুটিটি থামছে এবং উত্পাদন করছে ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File …

15
পান্ডাসে একাধিক সিএসভি ফাইল আমদানি করুন এবং একটি ডেটা ফ্রেমে সংযুক্ত করে
আমি একটি ডিরেক্টরি থেকে পান্ডায় কয়েকটি সিএসভি ফাইল পড়তে এবং সেগুলিকে একটি বড় ডেটা ফ্রেমে যুক্ত করতে চাই like যদিও আমি তা বের করতে সক্ষম হইনি। আমার এখন পর্যন্ত যা আছে তা এখানে: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + …

16
একটি ডেটা ফ্রেমের কলামের নাম পরিবর্তন করা
আমার কাছে "নিউপ্রাইস" নামে একটি ডেটা ফ্রেম রয়েছে (নীচে দেখুন) এবং আমি আর তে আমার প্রোগ্রামে কলামের নামগুলি পরিবর্তন করতে চাই। > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 আসলে এটিই করছি: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") আমি এটিকে একটি লুপে রাখিনি কারণ …
399 r  dataframe  rename 

6
পূর্ণসংখ্যা সূচক দ্বারা পান্ডাস সিরিজ / ডেটা ফ্রেমের একটি সারি নির্বাচন করা
আমি কেন আগ্রহী df[2]না কেন সমর্থিত নয়, যখন df.ix[2]এবং df[2:3]উভয়ই কাজ করে। In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 পাইথন ইনডেক্সিং কনভেনশনের সাথে সামঞ্জস্য df[2]রেখে একইভাবে কাজ করার আশা …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.