আমার কাছে এই জাতীয় ডেটাফ্রেম রয়েছে:
A B C
0 1 0.749065 This
1 2 0.301084 is
2 3 0.463468 a
3 4 0.643961 random
4 1 0.866521 string
5 2 0.120737 !
কল করা হচ্ছে
In [10]: print df.groupby("A")["B"].sum()
ফিরে আসবে
A
1 1.615586
2 0.421821
3 0.463468
4 0.643961
এখন আমি কলাম "সি" এর জন্য "একই" করতে চাই। যেহেতু সেই কলামটিতে স্ট্রিং রয়েছে, যোগফল () কাজ করে না (যদিও আপনি মনে করতে পারেন যে এটি স্ট্রিংগুলি একত্রিত করবে)। আমি যা দেখতে চাই তা হ'ল প্রতিটি গ্রুপের স্ট্রিংগুলির তালিকা বা সেট set
A
1 {This, string}
2 {is, !}
3 {a}
4 {random}
আমি এটি করার উপায়গুলি চেষ্টা করার চেষ্টা করছি।
সিরিজ.উনিক () ( http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html ) কাজ করে না, যদিও
df.groupby("A")["B"]
ইহা একটি
pandas.core.groupby.SeriesGroupBy object
সুতরাং আমি আশা করছিলাম যে কোনও সিরিজ পদ্ধতি কাজ করবে। কোন ধারনা?
apply
এবংlambda
এর অপসারণকে ভেক্টরাইজ করা হয়েছে। আমি এখানে এসে ভাবছি কেনpandas
আসলে সংক্ষেপ করে এবং স্ট্রিংয়ের সংমিশ্রণে কোনও ত্রুটি ফিরিয়ে দেয় না।