প্রশ্ন ট্যাগ «dataframe»

একটি ডেটা ফ্রেম একটি সারণী তথ্য কাঠামো। সাধারণত, এটিতে ডেটা থাকে যেখানে সারিগুলি পর্যবেক্ষণ এবং কলামগুলি বিভিন্ন ধরণের ভেরিয়েবল হয়। যদিও "ডেটা ফ্রেম" বা "ডেটা ফ্রেম" এই ধারণার জন্য বেশ কয়েকটি ভাষায় (আর, অ্যাপাচি স্পার্ক, ডিডল, ম্যাপেল, পাইথনের পান্ডাস লাইব্রেরি এবং জুলিয়ার ডেটা ফ্রেম লাইব্রেরি) শব্দ ব্যবহৃত হয়েছে, "টেবিল" শব্দটি ব্যবহৃত হয় ম্যাটল্যাব এবং এসকিউএল।

6
পান্ডাস: আমি কীভাবে একাধিক সারিতে একটি কলামে পাঠ্যকে বিভক্ত করব?
আমি একটি বড় সিএসভি ফাইলের সাথে কাজ করছি এবং শেষ কলামের পরের পাঠ্যের একটি স্ট্রিং রয়েছে যা আমি একটি নির্দিষ্ট সীমানার দ্বারা বিভক্ত করতে চাই। আমি ভাবছিলাম পাণ্ডা বা পাইথন ব্যবহার করে এটি করার কোনও সহজ উপায় আছে কিনা? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 …
135 python  pandas  dataframe 

8
পান্ডস অনন্য মান একাধিক কলাম
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) 'কল 1' এবং 'কল 2' এর অনন্য মানগুলি ফিরিয়ে দেওয়ার সর্বোত্তম উপায় কী? কাঙ্ক্ষিত আউটপুট হয় 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

4
পাইথন পান্ডাস: সারি সারি একটি ডাটাফ্রেম সারি পূরণ করুন
কোনও pandas.DataFrameবস্তুর সাথে একটি সারি যুক্ত করার সহজ কাজটি সম্পাদন করা কঠিন বলে মনে হচ্ছে। এটি সম্পর্কিত 3 টি স্ট্যাকওভারফ্লো প্রশ্ন রয়েছে যার মধ্যে কোনও কার্যকরী উত্তর দেয় না। এখানে আমি যা করার চেষ্টা করছি। আমার একটি ডেটা ফ্রেম রয়েছে যার মধ্যে আমি ইতিমধ্যে আকারটি পাশাপাশি সারি এবং কলামগুলির নাম …
133 python  dataframe  row  pandas 

5
পান্ডাস ডেটা ফ্রেম: শর্তের ভিত্তিতে একটি কলামে সমস্ত মান প্রতিস্থাপন করুন
আমার নীচের মতো একটি সাধারণ ডেটাফ্রেম রয়েছে: আমি 'প্রথম মরশুম' কলাম থেকে সমস্ত মান নির্বাচন করতে চাই এবং 1990 এর চেয়ে বেশি বয়সী 1 টি প্রতিস্থাপন করতে চাই example উদাহরণস্বরূপ, কেবল বাল্টিমোর রেভেনস ১৯৯ 1996 এর পরিবর্তে ১ দ্বারা স্থান পরিবর্তন করবেন (বাকী ডেটা অক্ষত রেখে)। আমি নিম্নলিখিত ব্যবহার করেছি: …
132 python  pandas  dataframe 

13
পান্ডাস ডেটাফ্রেমে কীভাবে সমস্ত কলামের নাম দেখানো যায়?
আমার কাছে একটি ডেটাফ্রেম রয়েছে যাতে কয়েকশ কলাম রয়েছে এবং আমার সমস্ত কলামের নাম দেখতে হবে to আমি কি করেছিলাম: In[37]: data_all2.columns আউটপুটটি হ'ল: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) কাটা তালিকার …
131 python  pandas  dataframe  show 

2
একাধিক কলাম বরাদ্দ করুন: = ডেটা.ট্যাবল করে, দলবদ্ধভাবে
একাধিক কলাম ব্যবহার করে নিযুক্ত করার সর্বোত্তম উপায় কী data.table? উদাহরণ স্বরূপ: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) আমি এর মতো কিছু করতে চাই (অবশ্যই এই বাক্য গঠনটি ভুল): x[ , (col1, col2) := f(), by = "id"] এবং এটি প্রসারিত করার জন্য, আমার একটি ভেরিয়েবল …

8
এনএ এর নির্দিষ্ট কলামযুক্ত সারি ছাড়ুন
আমি NAএকটি ডেটা ফ্রেমে মানগুলি কীভাবে বাদ দিতে পারি তা জানতে চাই , তবে কেবলমাত্র কয়েকটি কলামে আমি আগ্রহী। উদাহরণ স্বরূপ, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) কিন্তু আমি শুধুমাত্র বর্জন করতে ডেটা যেখানে চান yহয় NA, অতএব ফলাফলের হওয়া উচিত …
129 r  dataframe  na 

9
একটি কলামে স্ট্রিংগুলি থেকে অযাচিত অংশগুলি সরান
আমি ডেটা ফ্রেম কলামের স্ট্রিংগুলি থেকে অযাচিত অংশগুলি অপসারণের কার্যকর উপায়টি খুঁজছি। ডেটা দেখে মনে হচ্ছে: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a আমার এই ডেটাগুলি ট্রিম করতে হবে: time result 1 09:00 52 2 10:00 62 3 11:00 44 …

5
আর - দুটি ডেটাফ্র্যাম কনটেনেট?
দুটি ডেটাফ্রেম দেওয়া হয়েছে aএবং b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570 1.7916780 4 -1.3645337 1.3642276 5 -0.4954542 -0.6660001 …

10
কীভাবে কোনও আর-তে কোনও ডাটা ফ্রেমে একটি সারি যুক্ত করতে পারে?
আর-তে, ডেটা ফ্রেমটি ইতিমধ্যে শুরু হয়ে গেলে আপনি কীভাবে একটি ডেটা ফ্রেমে একটি নতুন সারি যুক্ত করবেন? এখনও পর্যন্ত আমার কাছে এটি রয়েছে: df <- data.frame("hi", "bye") names(df) <- c("hello", "goodbye") #I am trying to add "hola" and "ciao" as a new row de <- data.frame("hola", "ciao") merge(df, de) # …
129 r  dataframe 

4
একসাথে পান্ডাস ডেটা ফ্রেমের একটি তালিকা তৈরি করুন
আমার কাছে পান্ডাস ডেটা ফ্রেমের একটি তালিকা রয়েছে যা আমি একটি পান্ডার ডেটাফ্রেমের সাথে সংযুক্ত করতে চাই। আমি পাইথন 2.7.10 এবং পান্ডাস 0.16.2 ব্যবহার করছি আমি এ থেকে ডেটাফ্রেমগুলির তালিকা তৈরি করেছি: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , …

5
ডেটাফ্রেমের বিভাজনকে কীভাবে সংজ্ঞায়িত করবেন?
আমি স্পার্ক 1.4.0 এ স্পার্ক এসকিউএল এবং ডেটাফ্রেম ব্যবহার শুরু করেছি। আমি স্কালায় ডেটাফ্রেমে একটি কাস্টম পার্টিশনারের সংজ্ঞা দিতে চাই, কিন্তু এটি কীভাবে করবেন তা দেখছি না। আমি যে ডেটা টেবিলের সাথে কাজ করছি তার একটিতে নিম্নলিখিত উদাহরণে সিলিমার অ্যাকাউন্টের মাধ্যমে লেনদেনের একটি তালিকা রয়েছে। Account Date Type Amount 1001 …

9
আমি কীভাবে একটি স্পার্ক ডেটাফ্রেমে (পাইএসপার্ক ব্যবহার করে) একটি নতুন কলাম যুক্ত করব?
আমার একটি স্পার্ক ডেটাফ্রেম রয়েছে (পাইস্পার্ক 1.5.1 ব্যবহার করে) এবং একটি নতুন কলাম যুক্ত করতে চাই। আমি কোনও সাফল্য ছাড়াই নিম্নলিখিতগুলি চেষ্টা করেছি: type(randomed_hours) # => list # Create in Python and transform to RDD new_col = pd.DataFrame(randomed_hours, columns=['new_col']) spark_new_col = sqlContext.createDataFrame(new_col) my_df_spark.withColumn("hours", spark_new_col["new_col"]) এটি ব্যবহার করে একটি ত্রুটিও পেয়েছে: …

5
পান্ডাস ডেটা ফ্রেমে হারিয়ে যাওয়া তারিখগুলি যুক্ত করুন
আমার ডেটাতে একটি নির্দিষ্ট তারিখে একাধিক ইভেন্ট বা কোনও তারিখে কোনও ইভেন্ট থাকতে পারে। আমি এই ইভেন্টগুলি গ্রহণ করি, তারিখ অনুসারে একটি গণনা পাই এবং সেগুলি প্লট করি। যাইহোক, আমি যখন তাদের পরিকল্পনা করি, আমার দুটি সিরিজ সবসময় মেলে না। idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() উপরের কোডে আইডিএক্স …
127 python  date  plot  pandas  dataframe 

6
কিভাবে একটি সংক্ষিপ্তভাবে একটি ডাটা ফ্রেম থেকে অনেক ভেরিয়েবল সহ একটি সূত্র লিখতে?
ধরুন আমার কাছে একটি প্রতিক্রিয়া ভেরিয়েবল এবং একটি ডেটা রয়েছে যা তিনটি কোভেরিয়েট রয়েছে (খেলনার উদাহরণ হিসাবে): y = c(1,4,6) d = data.frame(x1 = c(4,-1,3), x2 = c(3,9,8), x3 = c(4,-4,-2)) আমি ডেটাতে লিনিয়ার রিগ্রেশন ফিট করতে চাই: fit = lm(y ~ d$x1 + d$x2 + d$y2) সূত্রটি লেখার কি …
127 r  dataframe  glm  lm 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.