প্রশ্ন ট্যাগ «pandas»

পান্ডাস হ'ল ডেটা ম্যানিপুলেশন এবং বিশ্লেষণের জন্য পাইথন লাইব্রেরি, যেমন ডেটাফ্রেমস, বহু-মাত্রিক সময় সিরিজ এবং ক্রস-বিভাগীয় ডেটাসেটগুলি সাধারণত পরিসংখ্যান, পরীক্ষামূলক বিজ্ঞানের ফলাফল, একনোমেট্রিক্স বা ফিনান্সে পাওয়া যায়। পান্ডস পাইথনের অন্যতম প্রধান তথ্য বিজ্ঞান গ্রন্থাগার।

6
আমি কীভাবে একটি পান্ডস ডেটা ফ্রেমে 1/0 এ সত্য / মিথ্যা মানচিত্র করতে পারি?
আমার পাইথন পান্ডাস ডেটা ফ্রেমে একটি কলাম রয়েছে যার বুলেয়ান ট্রু / ভুয়া মান রয়েছে তবে আরও গণনার জন্য আমার 1/0 উপস্থাপনা দরকার। তাড়াতাড়ি করার জন্য কি কোনও দ্রুত পান্ডা / ছদ্মবেশী উপায় আছে?
133 python  numpy  pandas 

13
কিভাবে একটি গ্রুপবাই জিনিস মুদ্রণ
আমি পান্ডাদের সাথে গ্রুপিংয়ের ফলাফল মুদ্রণ করতে চাই। আমার একটি ডেটাফ্রেম রয়েছে: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 'এ' দ্বারা …
133 python  pandas 

20
পাইথনে আমি কীভাবে একটি গরম এনকোড করতে পারি?
আমার কাছে ৮০% শ্রেণিবদ্ধ ভেরিয়েবলগুলির সাথে একটি মেশিন লার্নিং শ্রেণিবদ্ধকরণ সমস্যা রয়েছে। শ্রেণিবিন্যাসের জন্য কিছু শ্রেণিবদ্ধ ব্যবহার করতে চাইলে আমি কি একটি গরম এনকোডিং ব্যবহার করব? আমি কী কোডটি এনকোডিং ছাড়াই কোনও শ্রেণিবদ্ধের কাছে পাস করতে পারি? বৈশিষ্ট্য নির্বাচনের জন্য আমি নিম্নলিখিতগুলি করার চেষ্টা করছি: আমি ট্রেনের ফাইলটি পড়েছি: num_rows_to_read …

5
পান্ডাস ডেটা ফ্রেম: শর্তের ভিত্তিতে একটি কলামে সমস্ত মান প্রতিস্থাপন করুন
আমার নীচের মতো একটি সাধারণ ডেটাফ্রেম রয়েছে: আমি 'প্রথম মরশুম' কলাম থেকে সমস্ত মান নির্বাচন করতে চাই এবং 1990 এর চেয়ে বেশি বয়সী 1 টি প্রতিস্থাপন করতে চাই example উদাহরণস্বরূপ, কেবল বাল্টিমোর রেভেনস ১৯৯ 1996 এর পরিবর্তে ১ দ্বারা স্থান পরিবর্তন করবেন (বাকী ডেটা অক্ষত রেখে)। আমি নিম্নলিখিত ব্যবহার করেছি: …
132 python  pandas  dataframe 

5
পান্ডায় ডেটা সাধারণকরণ
ধরুন আমার কাছে পান্ডসের ডেটা ফ্রেম রয়েছে df: আমি একটি ডেটা ফ্রেমের কলাম কমান্ড গণনা করতে চাই। এটা সহজ: df.apply(average) তারপরে কলাম অনুসারে পরিসীমা সর্বাধিক (করল) - মিনিট (কল)। এটি আবার সহজ: df.apply(max) - df.apply(min) এখন প্রতিটি উপাদানের জন্য আমি এর কলামটির গড় বিয়োগ করতে এবং তার কলামের ব্যাপ্তি দ্বারা …
131 python  pandas  numpy 

10
পান্ডারা ডেটাফ্রেমকে টিপলসের অ্যারে রূপান্তর করে
আমি পান্ডা ব্যবহার করে কিছু ডেটা ম্যানিপুলেটেড করেছি এবং এখন আমি একটি ব্যাচ সংরক্ষণ করে ডেটাবেসে ফিরে যেতে চাই। এটির জন্য আমাকে ডাটাফ্রেমের ডেটাফ্রেমের একটি "সারি" অনুসারে প্রতিটি টিপলকে টিপলসের একটি অ্যারে রূপান্তর করতে হবে। আমার ডেটাফ্রেমে এমন কিছু দেখাচ্ছে: In [182]: data_set Out[182]: index data_date data_1 data_2 0 14303 …
131 python  pandas 

3
পান্ডাসে সংখ্যার সবচেয়ে কার্যকরী উপায় কী?
আমার বলার সাথে একটি বড় (প্রায় 12 এম সারি) ডেটা ফ্রেম ডিএফ আছে: df.columns = ['word','documents','frequency'] সুতরাং নিম্নলিখিত সময় মতো ফ্যাশন চালিত: word_grouping = df[['word','frequency']].groupby('word') MaxFrequency_perWord = word_grouping[['frequency']].max().reset_index() MaxFrequency_perWord.columns = ['word','MaxFrequency'] তবে এটি চালাতে অপ্রত্যাশিত দীর্ঘ সময় নিচ্ছে: Occurrences_of_Words = word_grouping[['word']].count().reset_index() আমি এখানে কি ভুল করছি? একটি বৃহত ডেটাফ্রেমে উপস্থিতি …
131 python  pandas 

13
পান্ডাস ডেটাফ্রেমে কীভাবে সমস্ত কলামের নাম দেখানো যায়?
আমার কাছে একটি ডেটাফ্রেম রয়েছে যাতে কয়েকশ কলাম রয়েছে এবং আমার সমস্ত কলামের নাম দেখতে হবে to আমি কি করেছিলাম: In[37]: data_all2.columns আউটপুটটি হ'ল: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) কাটা তালিকার …
131 python  pandas  dataframe  show 

2
ভেরিয়েবল ডাটাফ্রেম কিনা তা পরীক্ষা করে দেখুন
আমার ফাংশনটি যখন ভেরিয়েবলের সাথে ডাকা হয় তখন আমি যাচাই করতে চাই যে ভ্যার্ডটি পান্ডাস ডেটাফ্রেম কিনা: def f(var): if var == pd.DataFrame(): print "do stuff" আমি অনুমান করি সমাধানটি বেশ সহজ হতে পারে তবে এটির সাথেও def f(var): if var.values != None: print "do stuff" আমি এটি প্রত্যাশার মতো …
130 python  pandas 

6
পাইথন পান্ডাসে কীভাবে একটি কলামের dtype চেক করবেন
সংখ্যার কলাম এবং স্ট্রিং কলামগুলি চিকিত্সা করতে আমার বিভিন্ন ফাংশন ব্যবহার করতে হবে। আমি এখন যা করছি তা সত্যিই বোবা: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:, (agg.dtypes!=np.float64)&(agg.dtypes!=np.int)]).columns) for y in allc: treat_str(agg[y]) এটি করার জন্য আরও কি মার্জিত উপায় আছে? যেমন for y in …
130 python  pandas 

9
একটি কলামে স্ট্রিংগুলি থেকে অযাচিত অংশগুলি সরান
আমি ডেটা ফ্রেম কলামের স্ট্রিংগুলি থেকে অযাচিত অংশগুলি অপসারণের কার্যকর উপায়টি খুঁজছি। ডেটা দেখে মনে হচ্ছে: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a আমার এই ডেটাগুলি ট্রিম করতে হবে: time result 1 09:00 52 2 10:00 62 3 11:00 44 …

8
আমি কীভাবে সাবপ্লট হিসাবে পৃথক পান্ডাস ডেটা ফ্রেম প্লট করতে পারি?
আমার কাছে কয়েকটি পান্ডাস ডেটা ফ্রেম একই মান স্কেল ভাগ করে নিচ্ছে তবে বিভিন্ন কলাম এবং সূচক রয়েছে। যখন অনুরোধ করা হয় df.plot(), তখন আমি পৃথক প্লটের চিত্র পাই। আমি সত্যিই যা চাই তা হ'ল তাদের সকলকে সাবপ্লোটের মতো একই প্লটটিতে রাখুন, তবে আমি দুর্ভাগ্যক্রমে কোনও সমাধান কীভাবে করতে এবং …

4
একসাথে পান্ডাস ডেটা ফ্রেমের একটি তালিকা তৈরি করুন
আমার কাছে পান্ডাস ডেটা ফ্রেমের একটি তালিকা রয়েছে যা আমি একটি পান্ডার ডেটাফ্রেমের সাথে সংযুক্ত করতে চাই। আমি পাইথন 2.7.10 এবং পান্ডাস 0.16.2 ব্যবহার করছি আমি এ থেকে ডেটাফ্রেমগুলির তালিকা তৈরি করেছি: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , …

7
সিএসভি পড়ার সময় পান্ডসে সূচক কলামটি সরিয়ে ফেলা হচ্ছে
আমার কাছে নিম্নলিখিত কোড রয়েছে যা একটি সিএসভি ফাইল আমদানি করে। এখানে 3 টি কলাম রয়েছে এবং আমি তাদের প্রথম দুটিটি ভেরিয়েবলগুলিতে সেট করতে চাই। আমি যখন দ্বিতীয় কলামটি পরিবর্তনশীল "দক্ষতা" তে সেট করি তখন সূচী কলামটিও ট্যাক করা হয়। আমি কীভাবে সূচক কলাম থেকে মুক্তি পেতে পারি? df = …
128 python  pandas 

5
পান্ডাস ডেটা ফ্রেমে হারিয়ে যাওয়া তারিখগুলি যুক্ত করুন
আমার ডেটাতে একটি নির্দিষ্ট তারিখে একাধিক ইভেন্ট বা কোনও তারিখে কোনও ইভেন্ট থাকতে পারে। আমি এই ইভেন্টগুলি গ্রহণ করি, তারিখ অনুসারে একটি গণনা পাই এবং সেগুলি প্লট করি। যাইহোক, আমি যখন তাদের পরিকল্পনা করি, আমার দুটি সিরিজ সবসময় মেলে না। idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() উপরের কোডে আইডিএক্স …
127 python  date  plot  pandas  dataframe 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.