পান্ডা ব্যবহার করে দুটি কলামের তুলনা করুন

Question 1

এটি একটি সূচনা পয়েন্ট হিসাবে ব্যবহার করে:

a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']]
df = pd.DataFrame(a, columns=['one', 'two', 'three'])

Out[8]: 
  one  two three
0   10  1.2   4.2
1   15  70   0.03
2    8   5     0

আমি ifপান্ডসের মধ্যে বিবৃতি জাতীয় কিছু ব্যবহার করতে চাই ।

if df['one'] >= df['two'] and df['one'] <= df['three']:
    df['que'] = df['one']

মূলত, প্রতিটি সারির মাধ্যমে পরীক্ষা করুন if স্টেটমেন্টের , নতুন কলাম তৈরি করুন।

দস্তাবেজগুলি ব্যবহার করতে বলেছে .allতবে এর কোনও উদাহরণ নেই ...

Question 2

আপনি এনপি.হোহার ব্যবহার করতে পারেন । যদি condকোনও বুলিয়ান অ্যারে হয় Aএবং Bযদি অ্যারে হয় তবে

C = np.where(cond, A, B)

সি Aযেখানে condসত্য, এবং Bকোথায় condমিথ্যা তার সমান হতে সংজ্ঞায়িত করে ।

import numpy as np
import pandas as pd

a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']]
df = pd.DataFrame(a, columns=['one', 'two', 'three'])

df['que'] = np.where((df['one'] >= df['two']) & (df['one'] <= df['three'])
                     , df['one'], np.nan)

উৎপাদনের

  one  two three  que
0  10  1.2   4.2   10
1  15   70  0.03  NaN
2   8    5     0  NaN

আপনার যদি একাধিক শর্ত থাকে তবে তার পরিবর্তে আপনি np.select ব্যবহার করতে পারেন । উদাহরণস্বরূপ, যদি আপনি চান df['que']সমান df['two']যখন df['one'] < df['two'], তারপর

conditions = [
    (df['one'] >= df['two']) & (df['one'] <= df['three']), 
    df['one'] < df['two']]

choices = [df['one'], df['two']]

df['que'] = np.select(conditions, choices, default=np.nan)

উৎপাদনের

  one  two three  que
0  10  1.2   4.2   10
1  15   70  0.03   70
2   8    5     0  NaN

যদি আমরা ধরে নিতে পারি যে df['one'] >= df['two']কখন df['one'] < df['two']মিথ্যা, তবে শর্ত এবং পছন্দগুলি সরল করা যেতে পারে

conditions = [
    df['one'] < df['two'],
    df['one'] <= df['three']]

choices = [df['two'], df['one']]

( এনএএন থাকলে df['one']বা ধরে নেওয়া অনুমানটি সত্য নাও হতে df['two']পারে))

মনে রাখবেন যে

a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']]
df = pd.DataFrame(a, columns=['one', 'two', 'three'])

স্ট্রিং মান সহ একটি ডেটা ফ্রেম সংজ্ঞায়িত করে। যেহেতু এগুলি সংখ্যাসূচক দেখাচ্ছে, আপনি সেই স্ট্রিংগুলিকে ফ্লোটে রূপান্তর করা থেকে ভাল:

df2 = df.astype(float)

স্ট্রিংগুলি চরিত্র অনুসারে চরিত্রের তুলনা করে, যদিও ফ্লোটগুলি সংখ্যার সাথে তুলনা করা হয়, এর ফলে ফলাফলগুলি পরিবর্তন হয়।

In [61]: '10' <= '4.2'
Out[61]: True

In [62]: 10 <= 4.2
Out[62]: False

Question 3

আপনি .equalsকলাম বা পুরো ডেটা ফ্রেমের জন্য ব্যবহার করতে পারেন ।

df['col1'].equals(df['col2'])

তারা সমান হলে, বিবৃতি ফিরে আসবে True, অন্যথায় False।

Question 4

আপনি প্রয়োগ () ব্যবহার করতে পারেন এবং এরকম কিছু করতে পারেন

df['que'] = df.apply(lambda x : x['one'] if x['one'] >= x['two'] and x['one'] <= x['three'] else "", axis=1)

অথবা আপনি যদি ল্যাম্বডা ব্যবহার না করা পছন্দ করেন

def que(x):
    if x['one'] >= x['two'] and x['one'] <= x['three']:
        return x['one']
    return ''
df['que'] = df.apply(que, axis=1)

Question 5

একটি উপায় হ'ল কলামটি সূচী করতে বুলিয়ান সিরিজ ব্যবহার করা df['one']। এটি আপনাকে একটি নতুন কলাম দেয় যেখানে Trueপ্রবেশগুলিতে একই সারির সমান মান df['one']এবং Falseমানগুলি থাকেNaN ।

বুলিয়ান সিরিজটি কেবলমাত্র আপনার ifবিবৃতি দিয়ে দেওয়া হয়েছে (যদিও এটির &পরিবর্তে এটি ব্যবহার করা প্রয়োজন and):

>>> df['que'] = df['one'][(df['one'] >= df['two']) & (df['one'] <= df['three'])]
>>> df
    one two three   que
0   10  1.2 4.2      10
1   15  70  0.03    NaN
2   8   5   0       NaN

আপনি যদি NaNমানগুলি অন্য মান দ্বারা প্রতিস্থাপন করতে চান তবে আপনি fillnaনতুন কলামে পদ্ধতিটি ব্যবহার করতে পারেন que। আমি 0এখানে খালি স্ট্রিংয়ের পরিবর্তে ব্যবহার করেছি :

>>> df['que'] = df['que'].fillna(0)
>>> df
    one two three   que
0   10  1.2   4.2    10
1   15   70  0.03     0
2    8    5     0     0

Question 6

প্রতিটি পৃথক শর্তকে প্রথম বন্ধনে আবদ্ধ করুন এবং তারপরে &শর্তগুলি একত্রিত করতে অপারেটরটি ব্যবহার করুন :

df.loc[(df['one'] >= df['two']) & (df['one'] <= df['three']), 'que'] = df['one']

~ম্যাচটি উল্টানোর জন্য আপনি কেবল ("না" অপারেটর) ব্যবহার করে অনাবিল সারিগুলি পূরণ করতে পারেন :

df.loc[~ ((df['one'] >= df['two']) & (df['one'] <= df['three'])), 'que'] = ''

আপনি ব্যবহার করতে হবে &এবং ~বদলে andএবং notকারণ &এবং ~অপারেটরদের কাজ উপাদান-বাই-উপাদান।

চূড়ান্ত ফলাফল:

df
Out[8]: 
  one  two three que
0  10  1.2   4.2  10
1  15   70  0.03    
2   8    5     0

Question 7

ব্যবহার করুন np.selectআপনি যদি একাধিক শর্ত একটি ভিন্ন কলামে dataframe এবং আউটপুট একটি নির্দিষ্ট পছন্দ থেকে চেক করা আছে

conditions=[(condition1),(condition2)]
choices=["choice1","chocie2"]

df["new column"]=np.select=(condtion,choice,default=)

দ্রষ্টব্য: শর্তাবলীর কোনও নয় এবং পছন্দগুলির সাথে কোনওটিই মিলবে না, দুটি ভিন্ন শর্তের জন্য যদি আপনার একই পছন্দ থাকে তবে পছন্দ মতো পাঠ্যের পুনরাবৃত্তি করুন

Question 8

আমি মনে করি ওপির অন্তর্নিহিতের নিকটতমতমটি যদি বিবৃতিটি হয় তবে একটি ইনলাইন:

df['que'] = (df['one'] if ((df['one'] >= df['two']) and (df['one'] <= df['three']))