গাছের মূলের পিতামাতা এবং তাদের সমস্ত শিশুদের সনাক্ত করা


11

আমার কাছে যেমন একটি পান্ডাস ডেটা ফ্রেম রয়েছে:

parent   child   parent_level   child_level
A        B       0              1
B        C       1              2
B        D       1              2
X        Y       0              2
X        D       0              2 
Y        Z       2              3

এটি এমন গাছটিকে উপস্থাপন করে যা দেখতে দেখতে লাগে

       A  X
      /  / \
     B  /   \
    /\ /     \
   C  D       Y
              |
              Z

আমি দেখতে এমন কিছু উত্পাদন করতে চাই যা দেখতে:

root    children
A       [B,C,D]
X       [D,Y,Z]

অথবা

root   child
A      B
A      C
A      D
X      D
X      Y
X      Z 

লুপিং ছাড়া এটি করার দ্রুততম কোনটি। আমার কাছে খুব বড় ডেটাফ্রেম আছে।

উত্তর:


10

আমি আপনি ব্যবহার সুপারিশ networkx , এই গ্রাফ সমস্যা। বিশেষত বংশধররা কাজ করে:

import networkx as nx
import pandas as pd

data = [['A', 'B', 0, 1],
        ['B', 'C', 1, 2],
        ['B', 'D', 1, 2],
        ['X', 'Y', 0, 2],
        ['X', 'D', 0, 2],
        ['Y', 'Z', 2, 3]]

df = pd.DataFrame(data=data, columns=['parent', 'child', 'parent_level', 'child_level'])

roots = df.parent[df.parent_level.eq(0)].unique()
dg = nx.from_pandas_edgelist(df, source='parent', target='child', create_using=nx.DiGraph)

result = pd.DataFrame(data=[[root, nx.descendants(dg, root)] for root in roots], columns=['root', 'children'])
print(result)

আউটপুট

  root   children
0    A  {D, B, C}
1    X  {Z, Y, D}

5

পুনরাবৃত্তি সহ

def find_root(tree, child):
    if child in tree:
        return {p for x in tree[child] for p in find_root(tree, x)}
    else:
        return {child}

tree = {}
for parent, child in zip(df.parent, df.child):
    tree.setdefault(child, set()).add(parent)

descendents = {}
for child in tree:
    for parent in find_root(tree, child):
        descendents.setdefault(parent, set()).add(child)

pd.DataFrame(descendents.items(), columns=['root', 'children'])

  root   children
0    A  {B, D, C}
1    X  {Z, D, Y}

আপনি বিকল্পভাবে সেট আপ করতে পারে find_root হিসাবে একটি জেনারেটর হিসাবে

def find_root(tree, child):
    if child in tree:
        for x in tree[child]:
            yield from find_root(tree, x)
    else:
        yield child

উপরন্তু, যদি আপনি পুনরাবৃত্তির গভীরতা সমস্যা এড়ানোর জন্য চান, আপনি ব্যবহার করতে পারেন "iterators এর স্ট্যাকের" প্যাটার্ন সংজ্ঞায়িত করতেfind_root

def find_root(tree, child):
    stack = [iter([child])]
    while stack:
        for node in stack[-1]:
            if node in tree:
                stack.append(iter(tree[node]))
            else:
                yield node
            break
        else:  # yes!  that is an `else` clause on a for loop
            stack.pop()
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.