আমার কাছে এর মতো একটি পান্ডাস ডেটা ফ্রেম রয়েছে (এক্স 11): আসলে আমার কাছে ডেক্স 99 পর্যন্ত 99 কলাম রয়েছে
dx1 dx2 dx3 dx4
0 25041 40391 5856 0
1 25041 40391 25081 5856
2 25041 40391 42822 0
3 25061 40391 0 0
4 25041 40391 0 5856
5 40391 25002 5856 3569
আমি 25041,40391,5856 ইত্যাদির মতো সেল মানগুলির জন্য অতিরিক্ত কলাম (গুলি) তৈরি করতে চাই So আমি এই কোডটি ব্যবহার করছি এবং সারিগুলির সংখ্যা কম হলে এটি কাজ করে।
mat = X11.as_matrix(columns=None)
values, counts = np.unique(mat.astype(str), return_counts=True)
for x in values:
X11[x] = X11.isin([x]).any(1).astype(int)
আমি এর মতো ফলাফল পাচ্ছি:
dx1 dx2 dx3 dx4 0 25002 25041 25061 25081 3569 40391 42822 5856
25041 40391 5856 0 0 0 1 0 0 0 1 0 1
25041 40391 25081 5856 0 0 1 0 1 0 1 0 1
25041 40391 42822 0 0 0 1 0 0 0 1 1 0
25061 40391 0 0 0 0 0 1 0 0 1 0 0
25041 40391 0 5856 0 0 1 0 0 0 1 0 1
40391 25002 5856 3569 0 1 0 0 0 1 1 0 1
সারিগুলির সংখ্যা যখন হাজারে বা লক্ষ লক্ষ হয়, এটি স্থায়ী হয় এবং চিরতরে লাগে এবং আমি কোনও ফল পাচ্ছি না। দয়া করে দেখুন যে কক্ষের মানগুলি কলামে অনন্য নয়, পরিবর্তে বহু কলামগুলিতে পুনরাবৃত্তি করছে। প্রাক্তন হিসাবে, 40391 dx1 তে পাশাপাশি dx2 তে ঘটছে এবং তাই 0 এবং 5856 ইত্যাদির জন্যও? উপরে বর্ণিত যুক্তিটি কীভাবে উন্নত করা যায় সে সম্পর্কে কোন ধারণা?