অভিযোজিত থ্রেশহোল্ডিংয়ের জন্য সর্বাধিক সাধারণ অ্যালগরিদমগুলি কী কী?


38

অভিযোজিত প্রান্তিকতা আগে কয়েকটি প্রশ্নে আলোচনা করা হয়েছে:

মতলব ব্যবহার করে লিভার বিভাজনের জন্য অভিযোজিত প্রান্তিককরণ

এই উদাহরণে ডকুমেন্ট ইমেজ থ্রোহোল্ডিংয়ের জন্য সেরা অ্যালগরিদমগুলি কী কী?

অবশ্যই, অ্যাডাপটিভ থ্রোসোল্ডিংয়ের জন্য অনেক অ্যালগরিদম রয়েছে। আপনি কোনটি সবচেয়ে কার্যকর এবং দরকারী বলে খুঁজে পেয়েছেন তা জানতে চাই।

আপনি কোন অভিযোজিত আলগোরিদিমগুলি সর্বাধিক এবং কোন অ্যাপ্লিকেশনটির জন্য ব্যবহার করেছেন; আপনি কীভাবে এই অ্যালগরিদম চয়ন করতে এসেছেন?

উত্তর:


24

আমার কোনও সম্পূর্ণ উত্তর হবে বলে আমি মনে করি না, তবে আমি যা জানি তা উপস্থাপন করব এবং যেহেতু এটি একটি সম্প্রদায় সম্পাদিত সাইট, তাই আমি আশা করি যে কেউ শীঘ্রই একটি প্রশংসামূলক উত্তর দেবেন :)

অভিযোজিত প্রান্তিককরণ পদ্ধতিগুলি হ'ল পুরো চিত্র জুড়ে একই থ্রোসোল্ড ব্যবহার করে না

তবে, কিছু সহজ ব্যবহারের জন্য, কখনও কখনও সর্বাধিক সাধারণ পুনরাবৃত্ত পদ্ধতির চেয়ে স্মার্ট পদ্ধতিযুক্ত একটি চৌম্বক বাছাই করা যথেষ্ট । ওতসুর পদ্ধতিটি একটি জনপ্রিয় থ্রোসোল্ডিং পদ্ধতি যা ধরে নিয়েছে যে চিত্রটিতে পিক্সেলগুলির দুটি শ্রেণি রয়েছে - অগ্রভূমি এবং ব্যাকগ্রাউন্ড এবং এতে দ্বি-মডেল হিস্টোগ্রাম রয়েছে । এরপরে এটি তাদের সম্মিলিত ছড়িয়ে পড়া (অন্তর্-শ্রেণীর বৈকল্পিক) হ্রাস করার চেষ্টা করে।

সবচেয়ে সহজ অ্যালগরিদম যা সত্যই অভিযোজিত প্রান্তিক পদ্ধতি হিসাবে বিবেচনা করা যেতে পারে সেগুলি হ'ল যা চিত্রকে কোষের গ্রিডে বিভক্ত করে এবং তারপরে পৃথক চিত্র হিসাবে বিবেচিত প্রতিটি কোষে একটি সাধারণ থ্রোসোল্ডিং পদ্ধতি (উদাহরণস্বরূপ পুনরাবৃত্তি বা ওৎসুর পদ্ধতি) প্রয়োগ করে (এবং ধারণা করা হয়) একটি দ্বি-মডেল হিস্টোগ্রাম)। যদি কোনও সাব-ইমেজটি থ্রোসোল্ড করা যায় না তবে পার্শ্ববর্তী কোষগুলির একটি থেকে থ্রোসোল্ড ব্যবহার করা যেতে পারে।

স্থানীয় প্রান্তিকের সন্ধানের বিকল্প পদ্ধতি হ'ল প্রতিটি পিক্সেলের স্থানীয় পাড়ার তীব্রতার মানগুলি পরিসংখ্যানিকভাবে পরীক্ষা করা । প্রতিটি পিক্সেলের জন্য প্রান্তিকতা পৃথক এবং এর স্থানীয় পাড়া থেকে গণনা করা হয় (একটি মধ্যম, গড় এবং অন্যান্য পছন্দগুলি সম্ভব)। সেখানে অন্তর্ভুক্ত পদ্ধতি এই ধরনের একটি বাস্তবায়ন OpenCV গ্রন্থাগার মধ্যে cv::adaptiveThresholdingফাংশন।

ব্র্যাডলি লোকাল থ্রোসোল্ডিং নামে একটি অনুরূপ পদ্ধতি পেয়েছি । এটি পিক্সেলের উজ্জ্বলতা পার্শ্ববর্তী পিক্সেলের গড় উজ্জ্বলতার তুলনায় টি শতাংশ কম হলে, প্রতিটি পিক্সেলের আশেপাশের এলাকাও পরীক্ষা করে black সম্পর্কিত কাগজ এখানে পাওয়া যাবে

এই Stackoverflow উত্তর mentiones একটি স্থানীয় (অভিযোজিত) থ্রেশহোল্ডিং পদ্ধতি নামক Niblack কিন্তু আমি আগে শোনা হয়নি।

সবশেষে, আমার আগের ছোট ছোট প্রকল্পগুলির মধ্যে একটি পদ্ধতি আমি ব্যবহার করেছি, যা ভেরিয়েশনাল মিনিম্যাক্স অপটিমাইজেশন দ্বারা চিত্র থ্রোসোল্ডিং বলে । এটি একটি পুনরুক্তি পদ্ধতি, একটি শক্তির ক্রিয়াকে অনুকূলকরণের উপর ভিত্তি করে যা দুটি উপাদানগুলির একটি ননরেখা সমন্বয়। একটি উপাদান ইমেজের শক্তিশালী তীব্রতা পরিবর্তনের অবস্থানের ভিত্তিতে প্রান্তিকের গণনা করা। অন্যান্য উপাদানটির লক্ষ্য (বস্তু) সীমান্ত অঞ্চলে প্রান্তিকতা মসৃণ করা। এটি অ্যানালগ যন্ত্রগুলির চিত্রগুলিতে (বেশিরভাগ ছায়া এবং কাঁচ / প্লাস্টিকের উপস্থিত থেকে প্রতিবিম্ব) বেশ ভাল প্রমাণিত হয়েছে, তবে পুনরাবৃত্তির সংখ্যার একটি সাবধানে পছন্দ প্রয়োজন।

দেরিতে সম্পাদনা : এই উত্তরের মন্তব্যে অনুপ্রাণিত । অসম আলোক শর্তের আশেপাশে কাজ করার আরও একটি উপায় আমি জানি। আমি এখানে একটি অন্ধকার পটভূমিতে উজ্জ্বল বস্তু সম্পর্কে লিখব, তবে পরিস্থিতি বিপরীত হলে একই যুক্তি প্রয়োগ করা যেতে পারে। মূল চিত্রের পরিবর্তে ধ্রুব প্রান্তের সাহায্যে চিত্রের সাদা শীর্ষ-টুপি রূপান্তরটি প্রসারিত করুন । একটি চিত্রের একটি সাদা শীর্ষ টুপি চিত্র মধ্যে পার্থক্য ছাড়া আর কিছুই নয় it's । আরও ব্যাখ্যা হিসাবে আমাকে পি। এর একটি উদ্ধৃতি অফার করুন সোয়েল: রূপক চিত্র বিশ্লেষণ :fγ(f)

একটি বৃহত স্কোয়ার এসই সহ মূল চিত্রটি খোলার সাথে সাথে সমস্ত প্রাসঙ্গিক চিত্রের কাঠামো সরিয়ে ফেলা হয় তবে আলোকসজ্জা ফাংশন সংরক্ষণ করা হয়। মূল চিত্রের সাদা শীর্ষ টুপি বা মূল চিত্র থেকে আলোকসজ্জা ফাংশনের বিয়োগটি একটি ইমেজকে একজাত আলোকসজ্জার সাথে বহন করে।


14

আপনি এখানে অনেকগুলি থ্রোহোল্ডিং পদ্ধতির তুলনা সম্বলিত একটি কাগজ পেতে পারেন:

  • এম সেজগিন, বি। শঙ্কুর - চিত্রের প্রান্তিককরণের কৌশল এবং পরিমাণগত পারফরম্যান্স মূল্যায়ন, বৈদ্যুতিন ইমেজিং জার্নাল, 2004 - পিডিএফ

দ্বির্মীকরণ পদ্ধতিগুলির মূল্যায়ন করার জন্য এখানে আরও একটি কাগজ রয়েছে:

  • পি। স্ট্যাথিস, ই। কাভালিয়েরাতো এবং এন পাপামারোকস - বাইনারিয়েশন অ্যালগরিদমসের জন্য একটি মূল্যায়ন প্রযুক্তি, ইউনিভার্সাল কম্পিউটার সায়েন্সের জার্নাল, ২০০৮ - পিডিএফ

আমি আমার শেষ প্রজেক্টে অভিযোজিত বাইনারিাইজেশন পদ্ধতিটি ব্যবহার করেছি সউভোলা পদ্ধতি দ্বারা ব্যবহৃত থ্রেশহোল্ড ফাংশনটির দ্রুত গণনার জন্য অবিচ্ছেদ্য চিত্রগুলি। সৌভোলার পদ্ধতিটি এতে বর্ণিত হয়েছে:

  • জে সৌভোলা এবং এম। পাইটিকাইনেন, অভিযোজিত নথি চিত্রের বাইনারিাইজেশন, প্যাটার্ন রিকগনিশন 33, 2000. - পিডিএফ

এই 20 টি ভাগে গতিবেগ (কাগজ অনুযায়ী) সরবরাহ করে এমন অবিচ্ছেদ্য চিত্র ব্যবহার করে এমন পরিবর্তনটি এই কাগজে বর্ণিত হয়েছে:

  • এফ। শাফাইট, ডি কিজারস এবং টিএম ব্রুয়েল, অবিচ্ছেদ্য চিত্রগুলি ব্যবহার করে স্থানীয় অভিযোজিত থ্রোসোল্ডিং কৌশলগুলির কার্যকর প্রয়োগ, ডকুমেন্ট রিকগনিশন এবং পুনরুদ্ধার এক্সভি, ২০০৮ - পিডিএফ

আমার প্রকল্পের (চিত্রগুলিতে পাঠ্য সন্ধানের জন্য) বাইনারিকরণ পদ্ধতিটি বেছে নেওয়ার সময় আমি কেবল এই কাগজপত্রগুলি ব্যবহার করেছি। আমি কোনও বিশেষজ্ঞ নই তাই কোন অ্যাপ্লিকেশনটির জন্য কোন পদ্ধতিটি সেরা তা আমি বলতে পারি না।


6

এই প্রশ্নের বিভিন্ন দৃষ্টিকোণ থেকে খুব ভাল উত্তর দেওয়া হয়েছে, এবং আমি শুধু আমার অভিজ্ঞতা সংক্ষিপ্ত করতে এবং অভিযোজিত বাইনারিকরণ সম্পর্কিত কিছু সমস্যার উপর জোর দিতে চাই।

অভিযোজিত বাইনারিকরণকে তিনটি বিভাগে ভাগ করা যায়:

1) গ্লোবাল পদ্ধতি: এই পদ্ধতির সাহায্যে চিত্রের পটভূমির প্রথমটি অনুমান করা হয়; এর পরে ব্যাকগ্রাউন্ডের তথ্যের সাহায্যে একটি স্বাভাবিক চিত্র তৈরি করা হয়। তারপরে গ্লোবাল বাইনারিাইজেশন পদ্ধতিটি নিযুক্ত করা হয়।

2) প্যাচ-ভিত্তিক পদ্ধতি: নামটি ইঙ্গিত হিসাবে, প্যাচ ভিত্তিক পদ্ধতি প্যাচ দ্বারা বাইনারিাইজেশন প্যাচ সঞ্চালন করবে। প্রতিটি প্যাচে, একটি বাইনারিাইজেশন বিশ্বব্যাপী বাইনারিাইজেশন পদ্ধতি দিয়ে অনুমান করা হয়। এরপরে, প্রতিবেশী প্যাচগুলিতে বাইনারিয়েশন থ্রেশহোল্ডটি মসৃণ রূপান্তর রয়েছে বলে মামলা করতে কিছু পোস্ট-প্রসেসিং করা হয়।

3) মুভিং-উইন্ডো পদ্ধতি: এই পদ্ধতির সাহায্যে পিন্সেল দ্বারা বাইনারিকরণ পিক্সেল করা হয়। উইন্ডোর মধ্যে পিক্সেল পরিসংখ্যান গণনা করার জন্য একটি চলন্ত উইন্ডো সেট আপ করা হয়েছে, এবং পরিসংখ্যানের উপর ভিত্তি করে উইন্ডোর মধ্যে কেন্দ্রীয় পিক্সেলের জন্য প্রান্তিক গণনা করা হয়।

প্রয়োগের উপর নির্ভর করে কোন পদ্ধতিটি সেরা তা বলা খুব শক্ত। যখন আপনি একটি অভিযোজিত দ্বারীকরণের কথা ভাবেন, নীচের প্রশ্নগুলি বিবেচনা করতে ভুলবেন না:

1) প্যারামিটার সেটিং: পদ্ধতিটির কোনও স্বয়ংক্রিয় প্যারামিটার সেটিং পদ্ধতি নেই? প্যারামিটারগুলি কীভাবে খুব ভাল সেট করা যায় যাতে এটি বেশিরভাগ ক্ষেত্রে কাজ করতে পারে?

2) একটি ভাল অভিযোজিত দ্বারীকরণকে ন্যায়সঙ্গত করার মানদণ্ড কী? অনেক ক্ষেত্রে, বিভিন্ন বাইনারিাইজেশন পদ্ধতির মধ্যে পার্থক্যটি খুব কম। যাইহোক, ছোট পার্থক্য শেষ পর্যন্ত বড় পার্থক্য হতে পারে।

3) কিছু বিশেষ পরিস্থিতিতে বাইনারিকরণ কাজ করতে পারে? উদাহরণস্বরূপ, ধরা যাক অভিযোজিত দ্বারীকরণের লক্ষ্যটি কালো পটভূমির বস্তুগুলি নিষ্কাশন করা যখন বাইনারিাইজেশন স্বয়ংক্রিয়ভাবে এই পরিস্থিতির সাথে মানিয়ে নিতে পারে? বা ভাইস ভিসা।

4) অভিযোজিত পদ্ধতিতে কেবল স্থানীয় কনফিগারেশনের উপর দৃষ্টি নিবদ্ধ করার প্রবণতা থাকে, সুতরাং বাইনারি ফলাফলটি অনুকূলিত হয় না। উদাহরণস্বরূপ, বিখ্যাত স্যাভোলা পদ্ধতিটি যদি ফাঁকা বস্তু উত্পন্ন করে তবে অনুকূলিত করার জন্য বস্তুটি চলমান উইন্ডোর চেয়ে বেশি বড় হবে। আপনার অভিযোজিত পদ্ধতি কি এই সীমাবদ্ধতা জয় করতে পারে?

5) প্রাকপ্রসেসিং। একটি ভাল বাইনারিকরণের সাথে ইমেজ প্রসেসিং অন্তর্নিহিত অন্তর্ভুক্ত হওয়া উচিত। চিত্রটি খুব ঝাপসা হয়ে থাকলে, এটি স্বয়ংক্রিয়ভাবে অ্যালগরিদমের প্যারামিটারগুলি সামঞ্জস্য করতে পারে বা খারাপ বাইনারিাইজেশন এড়ানোর জন্য কিছু প্রাক-প্রসেসিংয়ের আবেদন করতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.