মিড শিফ্ট ব্যবহার করে চিত্র বিভাগের ব্যাখ্যা করা হয়েছে


107

কেউ কী দয়া করে আমাকে শিফট বিভাজন আসলে কীভাবে কাজ করে তা বুঝতে সহায়তা করতে পারে?

এখানে আমি তৈরি করেছি এমন একটি 8x8 ম্যাট্রিক্স up

  103  103  103  103  103  103  106  104   
  103  147  147  153  147  156  153  104   
  107  153  153  153  153  153  153  107   
  103  153  147  96   98   153  153  104   
  107  156  153  97   96   147  153  107   
  103  153  153  147  156  153  153  101   
  103  156  153  147  147  153  153  104   
  103  103  107  104  103  106  103  107

উপরের ম্যাট্রিক্স ব্যবহার করে কী বোঝানো সম্ভব যে কীভাবে শিফট বিভাজনটি 3 টি বিভিন্ন স্তরের সংখ্যাকে আলাদা করবে?


তিনটি স্তর? আমি প্রায় 100 এবং 150 এর কাছাকাছি নম্বর দেখতে পাই
জন

2
পাশাপাশি এটি একটি বিভাজন হিসাবে আমি ভেবেছিলাম মাঝখানে সংখ্যাগুলি সীমানার ওই অংশে অন্তর্ভুক্ত করার জন্য প্রান্ত সংখ্যাগুলি থেকে অনেক দূরে থাকবে। এই কারণেই আমি বললাম I. আমি ভুল হতে পারি কারণ আমি বুঝতে পারি না যে এই ধরনের বিভাজন কীভাবে কাজ করে।
শার্পি

ওহ ... সম্ভবত আমরা বিভিন্ন জিনিস বোঝার জন্য স্তর নিচ্ছি সব ভালো. :)
জন

1
আমি গৃহীত উত্তরটি পছন্দ করি তবে আমার মনে হয় না এটি পুরো চিত্রটি প্রদর্শন করেছে। আইএমও এই পিডিএফটি বোঝায় শিফট বিভাজনটি আরও ভাল (উদাহরণস্বরূপ একটি উচ্চ মাত্রার স্থান ব্যবহার করা আমার কাছে 2d এর চেয়ে ভাল)। eecs.umich.edu/vision/teaching/EECS442_2012/lectures/…
হেলিন ওয়াং

উত্তর:


204

প্রথমটি বুনিয়াদি:

মিন শিফট বিভাগটি স্থানীয় একজাতকরণ প্রযুক্তি যা স্থানীয়করণযোগ্য বস্তুগুলিতে শেডিং বা টোনালিটির পার্থক্যের স্যাঁতসেঁতে জন্য খুব কার্যকর। একটি উদাহরণ অনেক শব্দের চেয়ে ভাল:

এখানে চিত্র বর্ণনা লিখুন

ক্রিয়া: প্রতিটি পিক্সেলকে ব্যাপ্তি-আর পার্শ্ববর্তী অঞ্চলে পিক্সেলগুলির মধ্য দিয়ে প্রতিস্থাপন করে এবং যার মান একটি d এর মধ্যে d

গড় শিফটে সাধারণত 3 ইনপুট লাগে:

  1. পিক্সেলের মধ্যে দূরত্ব পরিমাপের জন্য একটি দূরত্ব ফাংশন। সাধারণত ইউক্যালিডিয়ান দূরত্ব, তবে অন্য কোনও সংজ্ঞায়িত দূরত্বের ফাংশন ব্যবহার করা যেতে পারে। ম্যানহাটন দূরত্ব কখনো কখনো অন্য দরকারী পছন্দ।
  2. একটি ব্যাসার্ধ। এই ব্যাসার্ধের সমস্ত পিক্সেল (উপরের দূরত্ব অনুসারে পরিমাপ করা হয়েছে) গণনার জন্য গণ্য হবে।
  3. একটি মান পার্থক্য। ব্যাসার্ধের ভিতরে থাকা সমস্ত পিক্সেল থেকে, আমরা কেবলমাত্র তাদের গণনা করব যার মূল্যগুলি এই পার্থক্যের মধ্যে রয়েছে calc

দয়া করে নোট করুন যে অ্যালগোরিদম সীমান্তে ভালভাবে সংজ্ঞায়িত করা হয়নি, তাই বিভিন্ন বাস্তবায়ন আপনাকে সেখানে আলাদা ফলাফল দেয়।

আমি এখানে গা mathe় গাণিতিক বিবরণ নিয়ে আলোচনা করব না, কারণ সঠিক গাণিতিক স্বরলিপি ব্যতীত এটি প্রদর্শন করা অসম্ভব, স্ট্যাকওভারফ্লোতে পাওয়া যায় না এবং এ কারণেই এগুলি অন্য কোথাও ভাল উত্স থেকে পাওয়া যায়

আসুন আপনার ম্যাট্রিক্সের কেন্দ্রটি দেখুন:

153  153  153  153 
147  96   98   153 
153  97   96   147   
153  153  147  156  

ব্যাসার্ধ এবং দূরত্বের জন্য যুক্তিসঙ্গত পছন্দগুলি সহ, চারটি কেন্দ্রের পিক্সেলগুলি 97 (তাদের গড়) এর মান পাবে এবং সংলগ্ন পিক্সেলের বিভিন্ন রূপ হবে।

আসুন গণিত করা যাক । প্রকৃত সংখ্যাগুলি দেখানোর পরিবর্তে আমরা একটি রঙিন কোডিং প্রদর্শন করব, তাই কী হচ্ছে তা বোঝা সহজ easier

আপনার ম্যাট্রিক্সের জন্য রঙিন কোডিংটি হ'ল:

এখানে চিত্র বর্ণনা লিখুন

তারপরে আমরা একটি যুক্তিসঙ্গত গড় শিফট নিই:

MeanShiftFilter[a, 3, 3]

এবং আমরা পেতে:

এখানে চিত্র বর্ণনা লিখুন

যেখানে সমস্ত কেন্দ্রের উপাদান সমান (97, বিটিডাব্লু)।

আরও একজাতীয় রঙিন করার চেষ্টা করে আপনি মিন শিফট দিয়ে কয়েকবার পুনরাবৃত্তি করতে পারেন। কয়েকটি পুনরাবৃত্তির পরে, আপনি একটি স্থিতিশীল অ-আইসোট্রপিক কনফিগারেশন এ পৌঁছে যান:

এখানে চিত্র বর্ণনা লিখুন

এই মুহুর্তে, এটি পরিষ্কার হওয়া উচিত যে আপনি মিনি শিফট প্রয়োগের পরে আপনি কত "রঙ" পাবেন তা নির্বাচন করতে পারবেন না। সুতরাং, আসুন কীভাবে এটি করা যায় তা দেখান কারণ এটি আপনার প্রশ্নের দ্বিতীয় অংশ।

আগাম আউটপুট ক্লাস্টারের সংখ্যা নির্ধারণ করতে আপনার যা দরকার তা হ'ল কুমিয়ান ক্লাস্টারিংয়ের মতো ।

এটি আপনার ম্যাট্রিক্সের জন্য এইভাবে চলে:

b = ClusteringComponents[a, 3]

{{1, 1, 1, 1, 1, 1, 1, 1}, 
 {1, 2, 2, 3, 2, 3, 3, 1}, 
 {1, 3, 3, 3, 3, 3, 3, 1}, 
 {1, 3, 2, 1, 1, 3, 3, 1}, 
 {1, 3, 3, 1, 1, 2, 3, 1}, 
 {1, 3, 3, 2, 3, 3, 3, 1}, 
 {1, 3, 3, 2, 2, 3, 3, 1}, 
 {1, 1, 1, 1, 1, 1, 1, 1}}  

বা:

এখানে চিত্র বর্ণনা লিখুন

যা আমাদের আগের ফলাফলের সাথে খুব মিল, তবে আপনি দেখতে পাচ্ছেন, এখন আমাদের কেবলমাত্র তিনটি আউটপুট স্তর রয়েছে।

আছে HTH!


চিত্রের জন্য মিড শিফটের কোনও মতলব বাস্তবায়ন আছে?
কৌশিক আচার্য

2
@ কৌশিকআচার্য শওনলঙ্কটন
.com/2007/

164

একটি গড়-শিফ্ট বিভাজন এরকম কিছু কাজ করে:

চিত্রের ডেটা বৈশিষ্ট্যের জায়গায় রূপান্তরিত হয় বৈশিষ্ট্য স্থান

আপনার ক্ষেত্রে, আপনার সমস্ত তাত্পর্য মান, সুতরাং বৈশিষ্ট্য স্থানটি কেবলমাত্র এক-মাত্রিক হবে। (উদাহরণস্বরূপ, আপনি কিছু টেক্সচার বৈশিষ্ট্যগুলি গণনা করতে পারেন, এবং তারপরে আপনার বৈশিষ্ট্যটির স্থানটি দ্বিমাত্রিক হবে - এবং আপনি তীব্রতা এবং জমিনের ভিত্তিতে বিভক্ত হয়ে যাবেন )

অনুসন্ধান উইন্ডোগুলি বৈশিষ্ট্যের জায়গার উপরে বিতরণ করা হয়েছে এখানে চিত্র বর্ণনা লিখুন

উইন্ডোর সংখ্যা, উইন্ডোর আকার এবং প্রাথমিক অবস্থানগুলি এই উদাহরণের জন্য স্বেচ্ছাসেবী - নির্দিষ্ট অ্যাপ্লিকেশনগুলির উপর নির্ভর করে এমন কিছু যা সূক্ষ্মভাবে সুরক্ষিত হতে পারে

গড়-শিফ্ট পুনরাবৃত্তি:

1.) প্রতিটি উইন্ডোর মধ্যে ডেটা নমুনার MEANs গণনা করা হয় এখানে চিত্র বর্ণনা লিখুন

২) উইন্ডোগুলি পূর্ববর্তী গণিত পদ্ধতির সমান অবস্থানগুলিতে SHIFTed হয় এখানে চিত্র বর্ণনা লিখুন

পদক্ষেপ ১।) এবং ২) একীভূত হওয়া পর্যন্ত পুনরাবৃত্তি হয়, অর্থাৎ সমস্ত উইন্ডো চূড়ান্ত স্থানে স্থির হয়ে গেছে এখানে চিত্র বর্ণনা লিখুন

একই অবস্থানগুলিতে শেষ হওয়া উইন্ডোজগুলি মার্জ করা হয়েছে এখানে চিত্র বর্ণনা লিখুন

উইন্ডো ট্রভার্সাল অনুসারে ডেটা ক্লাস্টার করা হয় এখানে চিত্র বর্ণনা লিখুন

... উদাহরণস্বরূপ, সমস্ত অবস্থান যা উইন্ডো দ্বারা ট্র্যাভার করা হয়েছিল যা "2" অবস্থানে এসে শেষ হয়েছিল, সেই অবস্থানের সাথে সম্পর্কিত একটি ক্লাস্টার তৈরি করবে।

সুতরাং, এই বিভাগটি (কাকতালীয়ভাবে) তিনটি গ্রুপ তৈরি করবে produce মূল ইমেজ ফর্ম্যাটে এই গোষ্ঠীগুলি দেখতে বেলিসরিয়াসের উত্তরের শেষ চিত্রের মতো কিছু হতে পারে । বিভিন্ন উইন্ডো আকার এবং প্রাথমিক অবস্থান নির্বাচন করা বিভিন্ন ফলাফল তৈরি করতে পারে।


স্থানটি ত্রিমাত্রিক হতে পারে না, প্রতিটি পিক্সেলের অবস্থান হিসাব করে?
হেলিন ওয়াং

@ হেলিনওয়াং হ্যাঁ, এটি পারে।
mlai

আমি বুঝতে পারি যে উইন্ডোটি কীভাবে 1 ডি বৈশিষ্ট্য স্থানে অবস্থান করছে, তবে আমি দেখতে পাচ্ছি না যে কীভাবে আপনার ব্যাখ্যাটি স্থানিক অনুসন্ধানের দূরত্ব (যেমন পিক্সেলগুলিতে) এবং বর্ণালী দূরত্ব (মান পার্থক্য) অন্তর্ভুক্ত শিফট অ্যালগরিদম বোঝাতে প্রয়োগ করা যেতে পারে, উদাহরণস্বরূপ ডঃ বেলিসারিয়াসের উত্তর হিসাবে। আপনি এই পরিষ্কার করতে পারেন?
লেনার্ট

@ লেনার্ট যদি আমি আপনার প্রশ্নটি সঠিকভাবে বুঝতে পারি, তবে মূলত আপনি যা করবেন তা হ'ল পিক্সেল অবস্থানগুলি (x, y) বৈশিষ্ট্য হিসাবে যুক্ত করা, বা অন্যান্য অবস্থান-ভিত্তিক বৈশিষ্ট্যগুলি ক্লাস্টারিং স্পেসে যুক্ত করা। দেখে মনে হচ্ছে বেলিসারিয়াসের উত্তর ম্যাথামেটিকায় একটি নির্দিষ্ট প্রয়োগের উল্লেখ করেছে যা কিছুটা পরিশীলিত কাজ করতে পারে। এটা কি সাহায্য করে?
mlai

1
@ লেনার্ট হ্যাঁ, আমি মনে করি আপনি এটি পেয়েছেন। আপনি আমার উত্তর কেন বিভ্রান্তিকর পেয়েছেন তা আমি বুঝতে পারি। আমি আমার 'উইন্ডোজ' কে দ্বি-মাত্রিক হিসাবে আঁকলাম তবে সত্যই আমি কেবলমাত্র এক মাত্রিক বর্ণালী মানগুলিতে ক্লাস্টারিং চিত্রিত করার চেষ্টা করছিলাম। অঙ্কন বা অ্যানিমেশন সহ ত্রি-মাত্রিক বৈশিষ্ট্যযুক্ত স্থানে শিফ্ট ক্লাস্টারটি ভিজ্যুয়ালাইজ করা খুব সুন্দর হবে (আমি সময় পেলে এই দিনগুলির মধ্যে একটি হতে পারে)
মাইলাই
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.