এই বিশেষ শিফট / স্কেল অদম্য টেম্পলেট মিলের জন্য কোন চিত্র-প্রক্রিয়াকরণ কৌশলগুলি আদর্শ?


17

আমি এখানে মূলত যে সমস্যাটি নিয়ে আলোচনা করেছি তা বিকশিত হয়েছে এবং আমি আরও কিছুটা নিয়ে অধ্যয়ন করার সাথে সাথে আরও নতুন তথ্য অর্জন করার কারণে এটি আরও সহজ হয়ে উঠতে পারে।

নীচের লাইন, আমি কম্পিউটার-দৃষ্টি / চিত্র-প্রক্রিয়াকরণ কৌশল ব্যবহার করে এখানে প্রদর্শিত এই প্যাটার্নটি সনাক্ত করতে সক্ষম হতে চাই। আপনি দেখতে পাচ্ছেন, আদর্শ প্যাটার্নটি চারটি 'পিংস' নিয়ে গঠিত। বস্তু-স্বীকৃতি হওয়া উচিত:

  • শিফট ইনভেয়ারেন্ট
    • অনুভূমিকভাবে, চিত্রটি চক্রীয় হবে। (যেমন, ডানদিকে ধাক্কা দেওয়া, বাম দিকে আসে এবং বিপরীতভাবে)।
    • (ভাগ্যক্রমে) উল্লম্বভাবে, এটি চক্রীয় নয়। (যেমন, উপরের বা নীচের দিকে ঠেলাও এবং এটি বন্ধ হয়ে যাবে)।
  • স্কেল ইনভায়রান্ট (পিংসগুলি আপনি দেখতে যেমন 'বেধে পরিবর্তিত হতে পারে can)

আমি এটি সম্পর্কে অবিরত যেতে পারতাম তবে আমি যা বোঝাতে চাইছি তাতে চিত্রগুলি সংযুক্ত করেছি, দয়া করে নীচে দেখুন:

এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন

অবশ্যই, তারা পৃথক 'স্কেল' এও থাকতে পারে, যেমনটি এই পরিবার থেকে দেখা যায়:

এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন

এবং অবশেষে, আমি আসলে কী পেতে পারি তার কিছু 'বাস্তবসম্মত' পরিস্থিতি এখানে রয়েছে, যেখানে গোলমাল হবে, নীচের দিকে যাওয়ার সময় সারিগুলি 'বিবর্ণ' হতে পারে এবং অবশ্যই চিত্রটিতে প্রচুর জালিয়াতি রেখা, শিল্পকলা থাকবে ইত্যাদি

এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন

এবং অবশ্যই, গ্র্যান্ড ফিনাল হিসাবে, এই 'চরম' দৃশ্যের স্বতন্ত্র সম্ভাবনা রয়েছে:

এখানে চিত্র বর্ণনা লিখুন

তাই আবারও, আমি আমার প্যাটার্নটির ঘটনাকে সবচেয়ে ভালভাবে সনাক্ত করতে এখানে কম্পিউটার-মেশিন-দৃষ্টি প্রযুক্তিগুলি কীভাবে ব্যবহার করতে হবে সে সম্পর্কে কিছু গাইডেন্স চাইতে চাই , যেখানে আপনি দেখতে পাচ্ছেন এমন পরিবর্তন এবং স্কেল অবিস্মরণীয় হওয়া দরকার, এবং বাস্তবসম্মত পরিস্থিতিগুলির জন্য সুনির্দিষ্ট ফলাফল পেতে সক্ষমও হন। (সুসংবাদটি হ'ল আমার কাছে এটি ঘোরানোর মতো দরকার) inv কেবলমাত্র আমি যে ধারণাটি নিয়ে আসতে পেরেছি তা হ'ল 2-ডি পারস্পরিক সম্পর্ক।

আমার যুক্ত করা উচিত, বাস্তবে আমার কাছে রঙিন চিত্র নেই - আমি কেবল একটি সংখ্যার মার্কিক্স পাব, তাই আমি মনে করি আমরা 'গ্রেস্কেল' সম্পর্কে কথা বলছি।

আগাম ধন্যবাদ!

পিএস এর মূল্যের জন্য আমি সম্ভবত ওপেন সি ভি ব্যবহার করব will

সম্পাদনা # 1:

মন্তব্যের উপর ভিত্তি করে, আপনি এখানে অনুরোধ করা বিশদ যুক্ত করেছি:

ডেটা সংজ্ঞায়িত বৈশিষ্ট্যগুলির জন্য, আমরা নিম্নলিখিতটি ধরে নিতে পারি:

  • প্রতিটি পিংয়ের অনুভূমিক দৈর্ঘ্য পৃথক হতে পারে তবে আমি এর উপরের এবং নীচের সীমাটি জানি। হ্যাঁ এই সীমার মধ্যে যে কোনও কিছুর জন্য, বাইরের কোনও কিছুর জন্য নেই। (উদাহরণস্বরূপ, আমি জানি যে পিংসের দৈর্ঘ্য 1 থেকে 3 সেকেন্ডের মধ্যে যে কোনও জায়গায় হতে পারে)।

  • সমস্ত পিংকে হ্যাঁর জন্য 'দৃশ্যমান' হওয়া দরকার, তবে শেষ সারিটি অনুপস্থিত থাকতে পারে এবং এখনও 'হ্যাঁ' বলতে চান। অন্যথায় না।

  • প্রতিটি পিংয়ের উল্লম্ব দৈর্ঘ্য, ('পুরুত্ব') আলাদা হতে পারে তবে আবার উপরের এবং নিম্ন সীমাটিও জানেন। (আপনি সেই চিত্রগুলিতে যা দেখেন তার সমান)। হ্যাঁ যে সীমা মধ্যে কিছু জন্য। বাইরের কোনও কিছুর জন্য নেই।

  • প্রতিটি পিংয়ের মধ্যে উচ্চতা সর্বদা হ্যাঁ হ্যাঁ। যদি তারা না হয়, তবে না। (উদাহরণস্বরূপ, আপনি দেখতে পাচ্ছেন যে সমস্ত পিংস একে অপরের সাথে তুলনামূলকভাবে একই উচ্চতার, উল্লম্ব অক্ষে 110 ডলার)। সুতরাং 110 +/- 5 হ্যাঁ হ্যাঁ, অন্য কিছু হ'ল না।

আমি মনে করি এটি সম্পর্কে তেমন ধারণা রয়েছে - তবে আমি আর কী যুক্ত করতে পারি তা আমাকে জানান ... (এছাড়াও, এখানে দেখানো সমস্ত কিছুই হ্যাঁ, বিটিডব্লিউ হিসাবে নিবন্ধিত হওয়া উচিত)।


আপনি যখন বলছেন মানে কি detect this pattern shown here? আপনি কি কেবল লাল / হলুদ রেখাটি বিচ্ছিন্ন করতে আগ্রহী বা আপনি আসলে এমন অভিব্যক্তি চান যা এই জাতীয় লাইনের মধ্যে সম্পর্ককে গণনা করে? কেবলমাত্র লাইনগুলি সন্ধানের জন্য কেবল কিছু প্রান্তিককরণ বা বিভাজন প্রয়োজন require তুমি আসলে কি চাও?
দিপান মেহতা

@ দিপনমহেতা বিভ্রান্তির জন্য দুঃখিত। আমি যা করতে চাই তা হ'ল: প্রথমে রঙগুলিতে মনোযোগ দিন না, (এটি কেবল তাদের পরিকল্পনা করা হয়েছিল), আমার কাছে যা থাকবে তা কেবল সংখ্যার একটি ম্যাট্রিক্স, তাই গ্রেস্কেল। দ্বিতীয় জিনিস, যেহেতু কোনও রঙ নেই, আমি কেবলমাত্র সেই 'প্যাটার্ন' সম্পর্কে যত্ন নিয়েছি যেখানে আপনি পুনরাবৃত্তি দেখতে পাচ্ছেন এমন 4 টি পিংসের সাথে আপনি সেখানে দেখছেন। সুতরাং ডিটেক্টর সেই চিত্রের টেম্পলেটটির রূপগুলি উপরের চিত্রগুলিতে দেখায় এবং "হ্যাঁ, এই প্যাটার্নটি বিদ্যমান" বলবে। বিভ্রান্তির জন্য দুঃখিত, আমি যদি অন্য কিছু পরিষ্কার করতে পারি তবে আমাকে জানান। ধন্যবাদ!
স্পেসি

ঠিক আছে, সুতরাং যদি আমি সঠিকভাবে বুঝতে পারি তবে উপরের প্রথম লাইনটি দেওয়া আছে, আপনি খুঁজে বের করতে চান যে ভারসাম্যটিও একই জায়গায় রয়েছে কিনা। যদি তা হয় তবে আপনি সিদ্ধান্তে পৌঁছবেন যে প্যাটার্নটি বিদ্যমান! রাইট?
দিপান মেহতা

@ দিপনমহেতা হ্যাঁ মূলত, উপরে দেখানো প্যাটার্নটি উপস্থিত রয়েছে কিনা তা সনাক্ত করতে সক্ষম হোন, স্কেল ইনভেরিয়েন্স মোকাবেলা করার জন্য যথেষ্ট শক্তিশালী এবং শিফট ইনভারিয়েেন্স মোকাবেলা করার জন্য যথেষ্ট শক্তিশালী। যে জানার জন্য? ধন্যবাদ,
স্পেসি

1
আমি যা পাচ্ছি তা হ'ল আপনি যে প্রকৃত সিস্টেমে কাজ করছেন তার উত্স ডেটাতে অ্যাক্সেস রয়েছে কিনা। যদি আপনি এটি করেন, তবে এমন আরও ভাল পদ্ধতির হতে পারে যা আপনার মধ্যম স্পেকট্রামগ্রাম ফর্ম্যাটটির পরিবর্তে মূল ডেটাতে সরাসরি কাজ করে যা আপনি শূন্য করেছেন।
জেসন আর

উত্তর:


6

বিস্তৃতভাবে বলতে গেলে এই সমস্যাটি সমাধান করার জন্য দুটি প্রাথমিক পন্থা রয়েছে:

ক। টেমপ্লেট মিল বা
খ। একটি প্যারামিটারাইজড মডেলের সাথে মিলছে।

ব্যক্তিগতভাবে, মডেলের সরলতা দেওয়া, আমি এই সমস্যার জন্য দ্বিতীয় পদ্ধতির পছন্দ করব।

পদক্ষেপ 1: পিং ব্লবগুলি সনাক্ত করুন

প্রথম পদক্ষেপ হিসাবে, "বাক্সগুলি" এক্সট্রাক্ট করুন - মূলত হলুদ / নীল স্কোয়ার। এখানে একটি সহজ পদ্ধতিটি কেবলমাত্র ইমেজের প্রান্তিককরণ হতে পারে। ব্যাকগ্রাউন্ডে খুব বেশি ভিন্নতা আছে বলে মনে হয় না যা গোলমাল বাড়ায় এটি পিংসের সাথে বেশ মিল রয়েছে। সুতরাং, প্রান্তিকতা পুরো চিত্র জুড়ে বিশ্বব্যাপী হতে পারে - এবং আমি মনে করি আপনি চিত্রের জুড়ে কাজ করবে এমন একটি শালীন প্রান্তিকা পেতে সক্ষম হবেন। প্রান্তিকর দিকটি অবশ্যই স্মার্ট হওয়া উচিত যাতে আপনি ওসুর পদ্ধতির মতো কিছু ব্যবহার করতে পারেন। দেখুন এই এবং এই আরও রেফারেন্সের জন্য।

ব্লকের উন্নতি

পিউং ফোরগ্রাউন্ডের অনুরূপ দেখতে জাঁকজমকপূর্ণ পয়েন্টগুলি মুছতে আপনি করতে পারেন এমন একটি ভাল জিনিস যেখানে পিংসের অভ্যন্তরে কিছু পিক্সেলও নীল। আপনার এখানে "উদ্বোধন" নামক একটি রূপচর্চা অপারেশন প্রয়োজন। এইচআইপিআর- এর একটি উল্লেখ দেখুন । এই ধরণের অপারেশনের জন্য স্মার্ট শেপ প্রয়োজন যা অনুরূপ আকারগুলি সংরক্ষণ এবং অন্যকে অপসারণে সহায়তা করে। আপনার ক্ষেত্রে আপনি অনুভূমিক রেখা বেছে নিতে পারেন। এর শেষে, আপনার পটভূমি এবং সম্মুখভাগের পিক্সেলগুলি সুন্দরভাবে একে অপরকে স্পর্শ না করে পিংগুলি পৃথক করে।

পদক্ষেপ 2: চিহ্নিত / ব্লক নিবন্ধগুলি

এখন যেহেতু আপনি পরিষ্কারতম ব্লব পেয়েছেন , তাদের 1,2,3,4 বা এ, বি, সি, ডি ইত্যাদি হিসাবে চিহ্নিত করার সময় পেয়েছেন এটি সাধারণত কিছু সাধারণ অ্যালগরিদম বলে যা সম্পাদিত হয়। প্রতিটি পিক্সেল দিয়ে চালান এবং যদি এটি কোনও চিহ্নিত অঞ্চলের সাথে স্পর্শ করে এবং যদি পূর্বভূমি হয় তবে সেটিকে সেগমেন্টে বরাদ্দ করুন অন্যথায় একটি নতুন তৈরি করুন। আপনি যদি 4 টিরও বেশি গুরুত্বপূর্ণ বিভাগ খুঁজে পান তবে আপনাকে সবচেয়ে প্রাসঙ্গিক চয়ন করতে হবে। কোনও তাত্ত্বিক অ্যালগরিদমের চেয়ে এখানে কিছু হিউরিস্টিক প্রয়োগ করুন।

পদক্ষেপ 3: পরামিতিগুলির মডেলিং

এখন, একবার আমরা সম্ভবত 4 টি সম্পর্কিত পিংসের শীর্ষ 4 প্রার্থী পেয়েছি, আপনি আবদ্ধ বাক্সগুলি সনাক্ত করতে পারেন - মূলত উপরের বাম এবং নীচের ডান কোণগুলি (বা বাম এবং ডান সর্বাধিক পিক্সেল, পাশাপাশি ব্লবের শীর্ষ এবং নীচে সারি) । সীমাবদ্ধ বাক্সটি সন্ধান করুন, আপনি প্রতিটি পিং বাক্সের সেন্ট্রয়েডকে জরিমানা করতে পারেন।

সিআমি কোথায় আমি{1,2,3,4}সি1সি1

তাই আন্তঃ সেন্ট্রয়েড দূরত্বগুলি এখন গণনা করা যায়:

সি1আমি[এক্স,Y]={সি1[এক্স]-সিআমি[এক্স],সি1[Y]-সিআমি[Y]}

এলআমি কোথায় আমি{1,2,3,4}

মূলত আপনার কাছে 8 টি প্যারামিটার ভ্যাকোটার রয়েছে:

1।{সি1[এক্স],সি1[Y]}2..4সি1আমি[এক্স,Y]5..8এলআমি

চতুর্থ পদক্ষেপ: শ্রেণিবিন্যাস
শেষ ধাপে, এখন পিং-প্যাটার্ন হ্যাঁ বা না আছে আমাদের শ্রেণিবদ্ধকরণ করা দরকার।

এই জাতীয় কিছু জন্য, আপনি একটি সুন্দর বায়েশিয়ান শ্রেণিবদ্ধ কাঠামো থাকতে পারে।

আপনার কাছে দুটি হাইপোথিসিস রয়েছে

এইচ 0: পিং প্যাটার্নটি বিদ্যমান।
এইচ 1: পিং প্যাটার্নটির অস্তিত্ব নেই

সি1,আমি[এক্স]

প্রথমে আপনি প্রচুর চিত্র অধ্যয়ন করেন যেখানে আপনি জানেন যে সেগুলি চিত্রের সাথে সম্পর্কিত। এখন, আপনি বিভিন্ন হিস্টোগ্রাম প্লট করতে পারেন বা ঘনত্ব নির্ধারণ পদ্ধতিতে কিছু পদ্ধতি প্রয়োগ করতে পারেন। দুদা হার্ট দ্বারা প্যাটার্ন শ্রেণিবিন্যাস পড়ুন।

সি1,আমি[এক্স]μ=20,σ=.1

সি1,আমিএইচ0পি[সি1,আমি[এক্স]|এইচ0]

এখন, পরীক্ষার তথ্য থেকে

পি[এইচ0|সি1,আমি[এক্স]=এক্স1]সি1[এক্স]এক্স1এইচ0

সুতরাং, আপনি গণনা করতে পারেন

পি[এইচ0 |সি1,আমি[এক্স]]=পি[সি1,আমি[এক্স]|এইচ0]*পি[এইচ0]পি[সি1,আমি[এক্স]]

ভেক্টর এক্সপ্রেশনটির জন্য আপনাকে এই প্রকাশটি একত্রিত করতে হবে এবং প্যারামিটারের অনুমানটি ঠিকঠাক করার জন্য অনেক প্রচেষ্টা পূরণ করতে হবে। তবে আমি আপনাকে এখানে বেসিক পদ্ধতির সাথে রেখে চলেছি।

দয়া করে আপনার নিজের গণিত করুন, এটি দীর্ঘ হবে, তবে এখনও বেশ স্বজ্ঞাত হওয়া উচিত।

পি[এইচ0|সমস্ত পরামিতি]>1/2

সম্পাদনা
আপনি যেহেতু 110 +/- 5 পিক্সেলের নির্দিষ্ট মানদণ্ডটি ইতিমধ্যে সংজ্ঞায়িত করছেন তাই শেষ ধাপটি সহজ হতে পারে। আপনার শ্রেণিবিন্যাসের মানদণ্ডটি স্থির হয়ে থাকলে সম্ভবত এই সমস্ত সম্ভাবনাগুলি গণনা করার দরকার নেই।


আপনাকে অনেক ধন্যবাদ! আমাকে এটি হজম করতে হবে এবং আপনার কাছে ফিরে যেতে হবে।
স্পেসি

3

এই সমস্যাটি আমার কাছে মনে হচ্ছে নাড়ি পুনরাবৃত্তি বিরতি সনাক্তকরণ + অনুমানের সমস্যার মতো। আমি সময়ের সাথে এই উত্তর বিকাশ হবে তবে আলগোরিদিম সাজানোর যে ভাল ভাবে কাজ করে যে সমস্যা হয় একটি জাফরি উপর সর্বাধিক সম্ভাবনা


আপনাকে ধন্যবাদ, হ্যাঁ আমি এই সম্পর্কে আপনার চিন্তা শুনে খুশি হব। এর মধ্যে আমি আপনার লিঙ্কটি সন্ধান করব।
স্পেসি

পিটার, আপনি যেমন বলেছিলেন সেভাবে কি এই নিয়ে ভাবার কিছু সময় আছে? আমি এই বিষয়ে আপনার চিন্তা শুনতে আগ্রহী হবে।
স্পেসি

সবেমাত্র টিঙ্কারিং শুরু হয়েছিল (এপ্রিলটি একটি রচনা বন্ধ ছিল)। আমার ভুল হতে পারে: ক্লার্কসনের কাগজ যেভাবে সমস্যার সূত্র তৈরি করেছে তা অন্যরকম ... আমাকে আরও কিছুটা খুঁড়তে দিন।
পিটার কে।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.