আমি কীভাবে আমার পাঞ্জা সনাক্তকরণের উন্নতি করতে পারি?

198

প্রতিটি পাঞ্জার মধ্যে পায়ের আঙ্গুলগুলি সন্ধান করার বিষয়ে আমার আগের প্রশ্নের পরে , আমি কীভাবে এটি ধরে রাখব তা দেখতে অন্যান্য পরিমাপ লোড করা শুরু করি। দুর্ভাগ্যক্রমে, আমি দ্রুত পূর্বের একটি পদক্ষেপ নিয়ে একটি সমস্যায় পড়েছিলাম: পাঞ্জা সনাক্তকরণ।

আপনি দেখুন, আমার ধারণার প্রমাণটি মূলত সময়ের সাথে সাথে প্রতিটি সংবেদকের সর্বাধিক চাপ নিয়েছে এবং প্রতিটি সারিটির যোগফল সন্ধান করতে শুরু করবে, যতক্ষণ না এটি পাওয়া যায়! = 0.0 তারপরে এটি কলামগুলির জন্য একই কাজ করে এবং যত তাড়াতাড়ি এটি আবার শূন্যের সাথে আরও 2 টি সারি খুঁজে পায়। এটি কিছু সূচকে সর্বনিম্ন এবং সর্বাধিক সারি এবং কলাম মান সংরক্ষণ করে।

বিকল্প পাঠ

আপনি চিত্রটিতে দেখতে পাচ্ছেন, বেশিরভাগ ক্ষেত্রে এটি বেশ ভাল কাজ করে। যাইহোক, এই পদ্ধতির জন্য অনেকগুলি ডাউনসাইড রয়েছে (খুব আদিম হওয়া ব্যতীত):

মানুষের 'ফাঁকা পা' থাকতে পারে যার অর্থ পায়ের ছাপের মধ্যেই বেশ কয়েকটি খালি সারি রয়েছে। যেহেতু আমি আশঙ্কা করেছি যে এটি (বৃহত্তর) কুকুরের সাথেও ঘটতে পারে, তাই আমি পা কেটে ফেলার আগে কমপক্ষে 2 বা 3 টি খালি সারিটির জন্য অপেক্ষা করছিলাম।

এটি যদি আরও খালি সারিগুলিতে পৌঁছানোর আগেই অন্য পরিচিতিটি আলাদা কলামে তৈরি করে তবে এটি সমস্যা তৈরি করে। আমি অনুমান করি যে আমি কলামগুলি তুলনা করতে এবং দেখতে পাচ্ছি যে তারা কোনও নির্দিষ্ট মান অতিক্রম করেছে, সেগুলি অবশ্যই পৃথক পাঞ্জা হবে।
সমস্যাটি আরও খারাপ হয় যখন কুকুরটি খুব ছোট হয় বা উচ্চ গতিতে হাঁটতে থাকে। যা ঘটে তা হ'ল সামনের পাটির পায়ের আঙ্গুলগুলি এখনও যোগাযোগ করা হচ্ছে, অন্যদিকে পাঁজরের পায়ের আঙ্গুলগুলি সামনের পাটির মতো একই অঞ্চলে যোগাযোগ করা শুরু করে!

আমার সাধারণ স্ক্রিপ্টের সাহায্যে এটি এই দুটি বিভক্ত করতে সক্ষম হবে না, কারণ এটি নির্ধারণ করতে হবে যে সেই অঞ্চলের কোন ফ্রেমটি কোন পাটির সাথে সম্পর্কিত, যখন বর্তমানে আমাকে কেবল সমস্ত ফ্রেমের উপরে সর্বাধিক মানগুলিই দেখতে হবে।

এটি কোথায় ভুল হতে শুরু করে তার উদাহরণ:

বিকল্প পাঠ

সুতরাং এখন আমি পাঞ্জা সনাক্তকরণ এবং পৃথক করার আরও ভাল উপায়ের সন্ধান করছি (এর পরে আমি কোন পাটি এটি সিদ্ধান্ত নেওয়ার সমস্যাটি পেয়ে যাব!)।

হালনাগাদ:

জো-এর (দুর্দান্ত!) উত্তর কার্যকর করার জন্য আমি ঝুঁকির মধ্যে পড়েছি, তবে আমার ফাইলগুলি থেকে প্রকৃত পানির ডেটা বের করতে আমার অসুবিধা হচ্ছে।

বিকল্প পাঠ

সর্বাধিক চাপের চিত্রটিতে প্রয়োগ করা হলে (উপরের দেখুন) কোডেড_প্যাজগুলি আমাকে সমস্ত বিভিন্ন পাঞ্জা দেখায়। যাইহোক, সমাধান প্রতিটি ফ্রেমের উপরে যায় (ওভারল্যাপিং পাঞ্জা পৃথক করতে) এবং চারটি আয়তক্ষেত্রের বৈশিষ্ট্য নির্ধারণ করে যেমন স্থানাঙ্ক বা উচ্চতা / প্রস্থ।

এই বৈশিষ্ট্যগুলি কীভাবে নেওয়া যায় এবং এগুলি কিছু পরিবর্তনশীলে সঞ্চয় করা যায় যা আমি পরিমাপের ডেটাতে প্রয়োগ করতে পারি I যেহেতু প্রতিটি পাঞ্জার জন্য আমার জানা দরকার, এর অবস্থানের সময়টি কোন ফ্রেমের মধ্যে রয়েছে এবং এটি কোন পাটি (সামনের / পশ্চাত, বাম / ডান) হয় couple

সুতরাং আমি প্রতিটি পাটির জন্য এই মানগুলি বের করার জন্য কীভাবে আয়তক্ষেত্রের বৈশিষ্ট্যগুলি ব্যবহার করতে পারি?

আমার সার্বজনীন ড্রপবক্স ফোল্ডারে প্রশ্ন সেটআপে আমি যে পরিমাপ ব্যবহার করেছি তা রয়েছে ( উদাহরণ 1 , উদাহরণ 2 , উদাহরণ 3 )। আগ্রহী যে কারও জন্য আমি আপনাকে আপ টু ডেট রাখার জন্য একটি ব্লগও সেট আপ করেছি :-)

python image-processing

— আইভো ফ্লিপস
সূত্র

দেখে মনে হচ্ছে যে আপনি দরকারী তথ্য সীমাবদ্ধ করে এমন একটি সারি / কলাম অ্যালগরিদম থেকে সরে যেতে হবে।

— তমারা উইজসম্যান

কি দারুন! বিড়াল নিয়ন্ত্রণ সফ্টওয়্যার?

— alxx

এটি কুকুরের ডেটা আসলে @ এলএক্সএক্স ;-) তবে হ্যাঁ, এটি তাদের নির্ণয়ের জন্য ব্যবহৃত হবে!

— আইভো ফ্লিপস

কেন? (কোন বিষয় নয়, এটি না জেনে আরও মজাদার ...)

— বেন রেজেনস্প্যান

উত্তর:

358

আপনি শুধু (আধা) সংলগ্ন অঞ্চলে অনুপস্থিত থাকেন, তবে তার আগেই পাইথন মধ্যে একটি সহজ বাস্তবায়ন আছে: SciPy এর ndimage.morphology মডিউল। এটি মোটামুটি সাধারণ চিত্রের রূপচর্চা অপারেশন।

মূলত, আপনার 5 টি পদক্ষেপ রয়েছে:

def find_paws(data, smooth_radius=5, threshold=0.0001):
    data = sp.ndimage.uniform_filter(data, smooth_radius)
    thresh = data > threshold
    filled = sp.ndimage.morphology.binary_fill_holes(thresh)
    coded_paws, num_paws = sp.ndimage.label(filled)
    data_slices = sp.ndimage.find_objects(coded_paws)
    return object_slices

পাঞ্জাগুলির একটি অবিচ্ছিন্ন পদচিহ্ন রয়েছে তা নিশ্চিত করতে ইনপুট ডেটাটি কিছুটা ঝাপসা করুন। (কেবলমাত্র বৃহত্তর কার্নেলটি ব্যবহার করা আরও দক্ষ হবে ( structureবিভিন্ন scipy.ndimage.morphologyফাংশনে কোয়ার্গ ) তবে এটি কোনও কারণে সঠিকভাবে কাজ করছে না ...)
অ্যারেটি প্রসারিত করুন যাতে আপনার কাছে এমন জায়গাগুলির বুলিয়ান অ্যারে থাকে যেখানে চাপটি কিছু থ্রেশোল্ডের মান (যেমন thresh = data > value) এর উপরে থাকে have
কোনও অভ্যন্তরীণ গর্ত পূরণ করুন, যাতে আপনার ক্লিনার অঞ্চলগুলি থাকে ( filled = sp.ndimage.morphology.binary_fill_holes(thresh))
পৃথক সুসংগত অঞ্চলগুলি ( coded_paws, num_paws = sp.ndimage.label(filled)) সন্ধান করুন। এটি সংখ্যার সাথে কোড করা অঞ্চলগুলির সাথে একটি অ্যারের ফেরত দেয় (প্রতিটি অঞ্চলই অন্যত্রের সাথে শূন্য সহ এক অনন্য পূর্ণসংখ্যার (1 টি পাঞ্জার সংখ্যা পর্যন্ত 1) একটি সংমিশ্রিত অঞ্চল)।
সংক্ষিপ্ত অঞ্চলগুলি ব্যবহার করে বিচ্ছিন্ন করুন data_slices = sp.ndimage.find_objects(coded_paws)। এটি sliceঅবজেক্টের টিপলগুলির একটি তালিকা প্রদান করে, যাতে আপনি প্রতিটি পাটির জন্য ডেটার অঞ্চলটি পেতে পারেন [data[x] for x in data_slices]। পরিবর্তে, আমরা এই টুকরোগুলির উপর ভিত্তি করে একটি আয়তক্ষেত্র আঁকব, যা কিছুটা বেশি কাজ নেয়।

নীচের দুটি অ্যানিমেশন আপনার "ওভারল্যাপিং পাঞ্জা" এবং "গ্রুপযুক্ত পাঞ্জা" উদাহরণ ডেটা দেখায়। এই পদ্ধতিটি নিখুঁতভাবে কাজ করছে বলে মনে হচ্ছে। (এবং এটি যে কোনও মূল্যের জন্য, এটি আমার মেশিনে নীচের জিআইএফ চিত্রগুলির চেয়ে অনেক বেশি সুচারুভাবে চালিত হয়, তাই পাঞ্জা সনাক্তকরণের অ্যালগরিদম মোটামুটি দ্রুত ...)

ওভারল্যাপিং পাঞ্জা দলবদ্ধ পাঞ্জা

এখানে একটি সম্পূর্ণ উদাহরণ (এখন আরও বিস্তারিত ব্যাখ্যা সহ)। এর বেশিরভাগ অংশ হ'ল ইনপুটটি পড়া এবং একটি অ্যানিমেশন তৈরি করা। আসল পাজ সনাক্তকরণটি কোডের 5 টি লাইন।

import numpy as np
import scipy as sp
import scipy.ndimage

import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle

def animate(input_filename):
    """Detects paws and animates the position and raw data of each frame
    in the input file"""
    # With matplotlib, it's much, much faster to just update the properties
    # of a display object than it is to create a new one, so we'll just update
    # the data and position of the same objects throughout this animation...

    infile = paw_file(input_filename)

    # Since we're making an animation with matplotlib, we need 
    # ion() instead of show()...
    plt.ion()
    fig = plt.figure()
    ax = fig.add_subplot(111)
    fig.suptitle(input_filename)

    # Make an image based on the first frame that we'll update later
    # (The first frame is never actually displayed)
    im = ax.imshow(infile.next()[1])

    # Make 4 rectangles that we can later move to the position of each paw
    rects = [Rectangle((0,0), 1,1, fc='none', ec='red') for i in range(4)]
    [ax.add_patch(rect) for rect in rects]

    title = ax.set_title('Time 0.0 ms')

    # Process and display each frame
    for time, frame in infile:
        paw_slices = find_paws(frame)

        # Hide any rectangles that might be visible
        [rect.set_visible(False) for rect in rects]

        # Set the position and size of a rectangle for each paw and display it
        for slice, rect in zip(paw_slices, rects):
            dy, dx = slice
            rect.set_xy((dx.start, dy.start))
            rect.set_width(dx.stop - dx.start + 1)
            rect.set_height(dy.stop - dy.start + 1)
            rect.set_visible(True)

        # Update the image data and title of the plot
        title.set_text('Time %0.2f ms' % time)
        im.set_data(frame)
        im.set_clim([frame.min(), frame.max()])
        fig.canvas.draw()

def find_paws(data, smooth_radius=5, threshold=0.0001):
    """Detects and isolates contiguous regions in the input array"""
    # Blur the input data a bit so the paws have a continous footprint 
    data = sp.ndimage.uniform_filter(data, smooth_radius)
    # Threshold the blurred data (this needs to be a bit > 0 due to the blur)
    thresh = data > threshold
    # Fill any interior holes in the paws to get cleaner regions...
    filled = sp.ndimage.morphology.binary_fill_holes(thresh)
    # Label each contiguous paw
    coded_paws, num_paws = sp.ndimage.label(filled)
    # Isolate the extent of each paw
    data_slices = sp.ndimage.find_objects(coded_paws)
    return data_slices

def paw_file(filename):
    """Returns a iterator that yields the time and data in each frame
    The infile is an ascii file of timesteps formatted similar to this:

    Frame 0 (0.00 ms)
    0.0 0.0 0.0
    0.0 0.0 0.0

    Frame 1 (0.53 ms)
    0.0 0.0 0.0
    0.0 0.0 0.0
    ...
    """
    with open(filename) as infile:
        while True:
            try:
                time, data = read_frame(infile)
                yield time, data
            except StopIteration:
                break

def read_frame(infile):
    """Reads a frame from the infile."""
    frame_header = infile.next().strip().split()
    time = float(frame_header[-2][1:])
    data = []
    while True:
        line = infile.next().strip().split()
        if line == []:
            break
        data.append(line)
    return time, np.array(data, dtype=np.float)

if __name__ == '__main__':
    animate('Overlapping paws.bin')
    animate('Grouped up paws.bin')
    animate('Normal measurement.bin')

আপডেট: কোন পাটি কোন সময়ে সেন্সরের সাথে যোগাযোগ করে তা সনাক্তকরণ হিসাবে, সহজ সমাধানটি হ'ল একই বিশ্লেষণ করা, তবে একই সাথে সমস্ত ডেটা ব্যবহার করা। (অর্থাত্ পৃথক সময় ফ্রেমের পরিবর্তে ইনপুটটি একটি 3 ডি অ্যারে স্ট্যাক করুন, এবং এটির সাথে কাজ করুন Sci) কারণ সায়পাইয়ের এনডিমেজ ফাংশনগুলি এন-ডাইমেনশনাল অ্যারেগুলির সাথে কাজ করা বোঝায়, আমাদের মূল পা-সন্ধানের ফাংশনটি পরিবর্তন করতে হবে না মোটেই

# This uses functions (and imports) in the previous code example!!
def paw_regions(infile):
    # Read in and stack all data together into a 3D array
    data, time = [], []
    for t, frame in paw_file(infile):
        time.append(t)
        data.append(frame)
    data = np.dstack(data)
    time = np.asarray(time)

    # Find and label the paw impacts
    data_slices, coded_paws = find_paws(data, smooth_radius=4)

    # Sort by time of initial paw impact... This way we can determine which
    # paws are which relative to the first paw with a simple modulo 4.
    # (Assuming a 4-legged dog, where all 4 paws contacted the sensor)
    data_slices.sort(key=lambda dat_slice: dat_slice[2].start)

    # Plot up a simple analysis
    fig = plt.figure()
    ax1 = fig.add_subplot(2,1,1)
    annotate_paw_prints(time, data, data_slices, ax=ax1)
    ax2 = fig.add_subplot(2,1,2)
    plot_paw_impacts(time, data_slices, ax=ax2)
    fig.suptitle(infile)

def plot_paw_impacts(time, data_slices, ax=None):
    if ax is None:
        ax = plt.gca()

    # Group impacts by paw...
    for i, dat_slice in enumerate(data_slices):
        dx, dy, dt = dat_slice
        paw = i%4 + 1
        # Draw a bar over the time interval where each paw is in contact
        ax.barh(bottom=paw, width=time[dt].ptp(), height=0.2, 
                left=time[dt].min(), align='center', color='red')
    ax.set_yticks(range(1, 5))
    ax.set_yticklabels(['Paw 1', 'Paw 2', 'Paw 3', 'Paw 4'])
    ax.set_xlabel('Time (ms) Since Beginning of Experiment')
    ax.yaxis.grid(True)
    ax.set_title('Periods of Paw Contact')

def annotate_paw_prints(time, data, data_slices, ax=None):
    if ax is None:
        ax = plt.gca()

    # Display all paw impacts (sum over time)
    ax.imshow(data.sum(axis=2).T)

    # Annotate each impact with which paw it is
    # (Relative to the first paw to hit the sensor)
    x, y = [], []
    for i, region in enumerate(data_slices):
        dx, dy, dz = region
        # Get x,y center of slice...
        x0 = 0.5 * (dx.start + dx.stop)
        y0 = 0.5 * (dy.start + dy.stop)
        x.append(x0); y.append(y0)

        # Annotate the paw impacts         
        ax.annotate('Paw %i' % (i%4 +1), (x0, y0),  
            color='red', ha='center', va='bottom')

    # Plot line connecting paw impacts
    ax.plot(x,y, '-wo')
    ax.axis('image')
    ax.set_title('Order of Steps')

বিকল্প পাঠ

— জো কিংটন
সূত্র

আপনার উত্তরটি কতটা দুর্দান্ত তা আমি ব্যাখ্যাও করতে শুরু করতে পারি না!

— আইভো ফ্লিপস

@ আইভো: হ্যাঁ, আমি জোকে আরও কিছুটা উপভোগ করতে পারব :) তবে আমার কি নতুন প্রশ্ন শুরু করা উচিত, বা সম্ভবত জো, যদি আপনি এখানে উত্তর দেন তবে? stackoverflow.com/questions/2546780/...

— unutbu

আমি আসলে .png এর বাইরে ফেলেছি এবং একটি করেছি convert *.png output.gif। আমি অবশ্যই ইমেজম্যাগিকের আগে আমার মেশিনটি তার হাঁটুর কাছে নিয়ে এসেছি, যদিও এই উদাহরণটির জন্য এটি দুর্দান্ত কাজ করেছে। অতীতে, আমি এই স্ক্রিপ্টটি ব্যবহার করেছি: স্বতন্ত্র ফ্রেমগুলি সংরক্ষণ না করে পাইথন থেকে সরাসরি একটি অ্যানিমেটেড জিআইএফ লিখতে svn.effbot.python-hosting.com/pil/Scriptts/gifmaker.py । আশা করি এইটি কাজ করবে! @Unutbu উল্লিখিত প্রশ্নে আমি একটি উদাহরণ পোস্ট করব।

— জো কিংটন

তথ্যের জন্য ধন্যবাদ, জো আমার সমস্যা অংশ ব্যবহার করতে অবহেলা করা হয়েছিল bbox_inches='tight'মধ্যে plt.savefig, অন্যান্য ছিল অস্থিরতা :)

— unutbu

পবিত্র গাভী, আমি শুধু বলার আছে ঘেউ কিভাবে মহান এই উত্তর এ।

— andersoj

আমি চিত্র সনাক্তকরণে কোনও বিশেষজ্ঞ নই, এবং আমি পাইথনকে জানি না, তবে আমি এটিকে ঘৃণ্য দেব ...

পৃথক পাঞ্জা সনাক্ত করার জন্য, আপনাকে প্রথমে কিছুটা ছোট প্রান্তিকের চেয়ে বেশি চাপযুক্ত সমস্ত কিছু নির্বাচন করা উচিত, কোনও চাপের খুব কাছেই নয়। এর উপরে থাকা প্রতিটি পিক্সেল / পয়েন্টকে "চিহ্নিত" করা উচিত। তারপরে, সমস্ত "চিহ্নিত" পিক্সেল সংলগ্ন প্রতিটি পিক্সেল চিহ্নিত হয়ে যায় এবং এই প্রক্রিয়াটি কয়েকবার পুনরাবৃত্তি হয়। সম্পূর্ণরূপে সংযুক্ত ম্যাসগুলি গঠিত হবে, সুতরাং আপনার স্বতন্ত্র বস্তু রয়েছে। তারপরে, প্রতিটি "অবজেক্ট" এর সর্বনিম্ন এবং সর্বাধিক এক্স এবং ওয়াইয়ের মান থাকে, তাই চারপাশে বাউন্ডিং বাক্সগুলি খুব সুন্দরভাবে প্যাক করা যায়।

সুডোকোড:

(MARK) ALL PIXELS ABOVE (0.5)

(MARK) ALL PIXELS (ADJACENT) TO (MARK) PIXELS

REPEAT (STEP 2) (5) TIMES

SEPARATE EACH TOTALLY CONNECTED MASS INTO A SINGLE OBJECT

MARK THE EDGES OF EACH OBJECT, AND CUT APART TO FORM SLICES.

এটি সম্পর্কে এটি করা উচিত।

— TaslemGuy
সূত্র

বিঃদ্রঃ: আমি বলি পিক্সেল, তবে এটি পিক্সেলগুলির গড় ব্যবহার করে অঞ্চলগুলি হতে পারে। অপ্টিমাইজেশন অন্য সমস্যা ...

প্রতিটি পিক্সেলের জন্য আপনার কোনও ক্রিয়াকলাপ (সময়ের সাথে চাপ) বিশ্লেষণ করতে হবে এবং ফাংশনটি কোথায় ফিরে আসে তা নির্ধারণ করতে হবে (যখন এটি পরিবর্তন করে> এক্সটি অন্য দিকে এটি ত্রুটিগুলির মোকাবিলার পালা হিসাবে বিবেচিত হয়)।

কী ফ্রেমে এটি ঘুরছে তা আপনি যদি জানেন তবে চাপটি সবচেয়ে শক্ত যেখানে ফ্রেমটি আপনি জানেন এবং দুটি পাঞ্জার মধ্যে এটি সর্বনিম্ন শক্ত কোথায় তা আপনি জানতে পারবেন। তত্ত্ব অনুসারে, আপনি তখন দুটি ফ্রেমগুলি জানতে পারবেন যেখানে পাঞ্জাগুলি সবচেয়ে বেশি চাপ দিয়েছিল এবং সেই অন্তরগুলির গড় গণনা করতে পারে।

যার পরে আমি সিদ্ধান্ত নেওয়ার সমস্যাটি নিয়ে যাবো এটি কোন পাটি!

এটি পূর্বের মতো একই ভ্রমণ, যখন প্রতিটি পাঞ্জা সর্বাধিক চাপ প্রয়োগ করে তখন আপনাকে সিদ্ধান্ত নিতে সহায়তা করে helps

— তমারা উইজসম্যান
সূত্র