এটি আরও ব্যাপকভাবে জানা উচিত যে পূর্ণসংখ্যা 0/1 এর জায়গায় স্ট্রিং অ্যালিয়াস 'সূচক' এবং 'কলাম' ব্যবহার করা যেতে পারে। উপনামগুলি আরও বেশি স্পষ্ট এবং গণনাগুলি কীভাবে ঘটে তা মনে রাখতে আমাকে সহায়তা করে। 'সূচক' এর জন্য অন্য একটি নাম 'সারি' ।
কখন axis='index'
ব্যবহৃত হয়, তারপরে গণনাগুলি কলামগুলিতে ঘটে যা বিভ্রান্তিকর। তবে, আমি এটির ফলস্বরূপ মনে রাখি যা অন্য সারির সমান আকার।
আমি কী সম্পর্কে বলছি তা দেখার জন্য স্ক্রিনে কিছু তথ্য আসুন:
df = pd.DataFrame(np.random.rand(10, 4), columns=list('abcd'))
a b c d
0 0.990730 0.567822 0.318174 0.122410
1 0.144962 0.718574 0.580569 0.582278
2 0.477151 0.907692 0.186276 0.342724
3 0.561043 0.122771 0.206819 0.904330
4 0.427413 0.186807 0.870504 0.878632
5 0.795392 0.658958 0.666026 0.262191
6 0.831404 0.011082 0.299811 0.906880
7 0.749729 0.564900 0.181627 0.211961
8 0.528308 0.394107 0.734904 0.961356
9 0.120508 0.656848 0.055749 0.290897
যখন আমরা সমস্ত কলামের গড় নিতে চাই, আমরা axis='index'
নিম্নলিখিতগুলি পেতে ব্যবহার করি :
df.mean(axis='index')
a 0.562664
b 0.478956
c 0.410046
d 0.546366
dtype: float64
একই ফলাফল অর্জন করা হবে:
df.mean()
df.mean(axis=0)
df.mean(axis='rows')
সারিগুলিতে বাম থেকে ডানদিকে কোনও ক্রিয়াকলাপ ব্যবহার করতে অক্ষ = 'কলাম' ব্যবহার করুন। আমি মনে করে এটি মনে করি যে আমার ডেটা ফ্রেমে একটি অতিরিক্ত কলাম যুক্ত হতে পারে:
df.mean(axis='columns')
0 0.499784
1 0.506596
2 0.478461
3 0.448741
4 0.590839
5 0.595642
6 0.512294
7 0.427054
8 0.654669
9 0.281000
dtype: float64
একই ফলাফল অর্জন করা হবে:
df.mean(axis=1)
অক্ষ = 0 / সূচক / সারি সহ একটি নতুন সারি যুক্ত করুন
ব্যাখ্যাটি সম্পূর্ণ করতে অতিরিক্ত সারি বা কলাম যুক্ত করতে এই ফলাফলগুলি ব্যবহার করুন। সুতরাং, যখনই অক্ষ = 0 / সূচক / সারি ব্যবহার করা হয়, এটি ডাটাফ্রেমের একটি নতুন সারি পাওয়ার মতো। আসুন একটি সারি যুক্ত করুন:
df.append(df.mean(axis='rows'), ignore_index=True)
a b c d
0 0.990730 0.567822 0.318174 0.122410
1 0.144962 0.718574 0.580569 0.582278
2 0.477151 0.907692 0.186276 0.342724
3 0.561043 0.122771 0.206819 0.904330
4 0.427413 0.186807 0.870504 0.878632
5 0.795392 0.658958 0.666026 0.262191
6 0.831404 0.011082 0.299811 0.906880
7 0.749729 0.564900 0.181627 0.211961
8 0.528308 0.394107 0.734904 0.961356
9 0.120508 0.656848 0.055749 0.290897
10 0.562664 0.478956 0.410046 0.546366
অক্ষ = 1 / কলাম সহ একটি নতুন কলাম যুক্ত করুন
একইভাবে, অক্ষ = 1 / কলাম যখন এটি এমন ডেটা তৈরি করে যা সহজেই তার নিজস্ব কলামে তৈরি করা যায়:
df.assign(e=df.mean(axis='columns'))
a b c d e
0 0.990730 0.567822 0.318174 0.122410 0.499784
1 0.144962 0.718574 0.580569 0.582278 0.506596
2 0.477151 0.907692 0.186276 0.342724 0.478461
3 0.561043 0.122771 0.206819 0.904330 0.448741
4 0.427413 0.186807 0.870504 0.878632 0.590839
5 0.795392 0.658958 0.666026 0.262191 0.595642
6 0.831404 0.011082 0.299811 0.906880 0.512294
7 0.749729 0.564900 0.181627 0.211961 0.427054
8 0.528308 0.394107 0.734904 0.961356 0.654669
9 0.120508 0.656848 0.055749 0.290897 0.281000
এটি প্রদর্শিত হয় যে আপনি নিম্নলিখিত ব্যক্তিগত ভেরিয়েবলগুলির সাথে সমস্ত উপাত্ত দেখতে পাচ্ছেন:
df._AXIS_ALIASES
{'rows': 0}
df._AXIS_NUMBERS
{'columns': 1, 'index': 0}
df._AXIS_NAMES
{0: 'index', 1: 'columns'}