বন চিত্রগুলিতে ট্রেল সনাক্ত করা হচ্ছে


30

বনের দৃশ্যের চিত্রায়িতভাবে (ট্রেইলের পাশে কোথাও দাঁড়িয়ে ক্যামেরার দৃষ্টিকোণ থেকে) কোনও ট্রেইল (লাইন বা পয়েন্ট-টু-পয়েন্ট কার্ভ হিসাবে) সনাক্ত করার জন্য কোনও গবেষণা / কাগজপত্র / সফ্টওয়্যার সম্পর্কে কি সচেতন?

আমি এমন একটি অ্যালগরিদম সন্ধান করার চেষ্টা করছি যা এর মতো একটি চিত্র নিতে পারে:

বিকল্প পাঠ

এবং একটি মুখোশ তৈরি করুন, সম্ভাব্য "ট্রেইল" সনাক্ত করে যেমন:

বিকল্প পাঠ

আপনি দেখতে পাচ্ছেন যে, আসল চিত্রটি কিছুটা ঝাপসা, যা উদ্দেশ্যমূলক। চিত্রের উত্স নিখুঁত ফোকাসের গ্যারান্টি দিতে পারে না, তাই আমার কাছে যুক্তিসঙ্গত পরিমাণে গোলমাল এবং অস্পষ্টতা পরিচালনা করতে সক্ষম হওয়া দরকার।

আমার প্রথম চিন্তাটি ছিল গাউসিয়ান অস্পষ্টতা প্রয়োগ করা এবং চিত্রটিকে ব্লকগুলিতে বিভক্ত করা, তীক্ষ্ণ বর্ণের পার্থক্যের সন্ধানকারী সংলগ্ন ব্লকের সাথে তুলনা (একটি ট্রেইল "প্রান্ত" নির্দেশ করে)। তবে, আমি দ্রুত বুঝতে পেরেছিলাম যে আলোছায়া এবং আলোর অন্যান্য পরিবর্তনগুলি সহজেই তা বন্ধ করে দেয়।

আমি এসআরএফ বৈশিষ্ট্যগুলি বের করার বিষয়ে ভাবছিলাম, তবে চিত্রটি যখন পুরোপুরি পরিষ্কার হয় এবং ধারাবাহিক আলো সহ আমি তখনই কেবল এসআরএফ / সিফ্টের সাথে সাফল্য পাই।

আমি চিত্রগুলি এবং মুখোশগুলি অনেক ছোট আকারে (উদাহরণস্বরূপ 100x75) স্কেল করার চেষ্টা করেছি, এগুলিকে 1xN ভেক্টরে রূপান্তর করেছি এবং এফএনএএন- ভিত্তিক নিউরাল নেটওয়ার্ককে প্রশিক্ষণের জন্য ব্যবহার করেছি (যেখানে চিত্রটি ইনপুট এবং মাস্কটি পছন্দসই আউটপুট)। এমনকি এত ছোট আকারে, 1% লুকানো স্তর সহ ইনপুট ভেক্টরের আকারের সাথে ট্রেনিং করতে 6 ঘন্টা সময় লেগেছে, এবং এখনও পরীক্ষার সেটে কোনও মুখোশের পূর্বাভাস দিতে পারেনি।

কেউ কি এই বিষয়ে অন্য কোন পদ্ধতি বা কাগজপত্রের পরামর্শ দিতে পারবেন?


1
আপনি এ সম্পর্কে কিছু উল্লেখ করেননি, তবে আপনি কি ক্যামেরা / চিত্র অধিগ্রহণকে নিয়ন্ত্রণ করেন? লোকেরা অনুরূপ পরিস্থিতিতে নিকৃষ্ট ইনফ্রারেড চিত্র ব্যবহার করে উদ্ভিদ সূচক ব্যবহার করে (উপগ্রহ থেকে বন কভারেজের গণনা বিবেচনা করুন)। আপনার যদি ইনফ্রারেড কাছাকাছি থাকে, সমস্যাটি সমাধানের জন্য সরাসরি এগিয়ে।
carlosdc

আমি কিছুটা করি। আমি একটি সস্তা মনোকুলার ক্যামেরা (ওয়েবক্যাম / সেলফোন ক্যামেরা) দিয়ে ছবিগুলি নিচ্ছি, তবে আমি মনে করি না যে তারা ইনফ্রারেড সঞ্চয় করে।
সেরিন

একাধিক রঙ ফিল্টারগুলি গাছপালা এবং ময়লা Spectra মধ্যে পার্থক্য করতে ব্যবহার সম্ভবত সহায়ক হবে
endolith

আপনি যদি প্রশিক্ষণ এবং সনাক্ত করার জন্য কোনও বায়সিয়ান পদ্ধতির চেষ্টা করে থাকেন তবে আমি আগ্রহী। আমার একটি উত্তর ছিল যা আমি কয়েক দিন আগে লিখেছিলাম, কিন্তু তারপর এটি মুছে ফেললাম কারণ আমি ভেবেছিলাম আপনি চেষ্টা করার পরে এটি খারিজ করে দিয়েছেন। আপনি যদি এখনও সেই বিকল্পটি বিবেচনা না করে থাকেন তবে আমি এটিকে মুছে ফেলতে পেরে খুশি হব।
Lorem Ipsum

@ ইয়োদা, বায়েশিয়ান পদ্ধতির অর্থ কী? বিচ্ছিন্ন শ্রেণিবিন্যাস এবং লজিকাল নেটওয়ার্কগুলিতে প্রয়োগ হওয়ার সাথে সাথে আমি কেবল বায়েশিয়ান সম্পর্কেই পরিচিত। এটি সিভিতে প্রয়োগ হওয়ার সাথে আমি পরিচিত নই। আপনার কোনও পোস্ট দেখে মনে নেই।
সেরিন

উত্তর:


13

এটি নিজে থেকে যথেষ্ট নাও হতে পারে তবে যেহেতু সমস্যাগুলির মধ্যে একটির আলোক প্রকরণের সাথে সম্পর্কিত, তাই একটি ছায়া অপসারণ প্রাক প্রসেসিং পদক্ষেপে সহায়তা করতে পারে। আমি যে কৌশলটির কথা ভাবছি তা নীচের কাগজে বর্ণিত হয়েছে:

"ইমেজগুলি থেকে ছায়া অপসারণের বিষয়ে", জিডি ফিনলেসন, এসডি হর্ডলি, সি ল, এবং এমএস ড্রু, আইইইই প্যাটার্ন অ্যানালাইসিস অ্যান্ড মেশিন ইন্টেলিজেন্স (পামি), খণ্ড .২৮, নং .১, জানুয়ারী, ২০০,, পৃষ্ঠা .5৯- 68। http://www.cs.sfu.ca/~mark/ftp/Pami06/pami06.pdf

প্রক্রিয়াটির প্রথম অংশটি একটি আলোকসজ্জা আগমনকারী গ্রেস্কেল চিত্র তৈরি করে, যা সম্ভবত আপনি এই ক্ষেত্রে চান। তারা কাগজে যে উদাহরণ দেয় তার একটি শট এখানে দেওয়া হয়েছে:

ছায়া অপসারণ
(সূত্র: ডাটাজেস্ট.কম )

প্রকৃতপক্ষে, "ক্রোমাটিসিটি" চিত্র তৈরি করতে প্রক্রিয়াটিকে আরও একধাপ এগিয়ে নিয়ে যাওয়া আপনার জীবন্ত এবং মৃত পাতার মধ্যে পরিষ্কারভাবে আলাদা করার প্রয়োজন হতে পারে। আবার, কাগজ থেকে একটি উদাহরণ:

Chromaticity
(সূত্র: ডাটাজেস্ট.কম )

ধরা পড়ল তবে ক্যামেরাটি প্রথমে ক্যালিব্রেট করা দরকার। এটি সম্ভব বলে ধরে নিলে, তারা বর্ণিত উপস্থাপনাগুলির কিছু সংমিশ্রণ সম্ভবত অন্যান্য পদ্ধতিগুলি আপনি আরও কার্যকরভাবে ব্যবহার করবেন।


12

আমি বিশ্বাস করি না যে আপনার কাছে মুখোশ চিত্র তৈরির জন্য উত্স চিত্রটিতে পর্যাপ্ত তথ্য রয়েছে । আপনি রঙের উপর ভাগ করে শুরু করতে পারেন, যেমন সবুজ ট্রেইল নয়, ধূসর / বাদামী। তবে, "ট্রেইল বর্ডার" এ ধূসর / বাদামী অঞ্চল রয়েছে যা আপনার মুখোশগুলিতে প্রতিনিধিত্ব করে না। (আপনার উত্স চিত্রের নীচের বাম কোয়াড্রেন্ট দেখুন))

আপনি যে মুখোশটি সরবরাহ করেছেন তা সূচিত ইমেজগুলিতে স্ট্রাকচারাল বাধাগুলি প্রকট নয়: উদাহরণস্বরূপ, সম্ভবত আপনার ট্রেইলগুলি নির্দিষ্ট প্রস্থের - তবে আপনি সেই তথ্যটি আপনার প্যাটার্ন সনাক্তকারী দ্বারা ফিরে আসা প্রাথমিক মাস্কটিকে সীমাবদ্ধ করতে ব্যবহার করতে পারেন।

কাঠামোর বিষয় অব্যাহত রেখে: পথশালা কি অন্যদের সাথে মিশে যায়? ট্রেইলগুলি নির্দিষ্ট মাটি / নুড়ি বৈশিষ্ট্যযুক্ত? একজন মানুষ হিসাবে (এটি প্যাটার্ন স্বীকৃতিতে যুক্তিসঙ্গতভাবে ভাল!), আমি নীচের বাম চতুর্ভুজগুলিতে প্রদর্শিত বৈশিষ্ট্যগুলির দ্বারা চ্যালেঞ্জ করছি: আমি ধূসর / বাদামী অঞ্চলগুলি দেখতে পাচ্ছি যা "ট্রেইল" হিসাবে ছাড় দিতে পারি না। আমার আরও তথ্য থাকলে সম্ভবত আমি সিদ্ধান্তে এটি করতে পারতাম: একটি মানচিত্র এবং একটি মোটামুটিভাবে পরিচিত অবস্থান, এই ট্রেইলে ব্যক্তিগত অভিজ্ঞতা, বা সম্ভবত এই বিন্দুটির দিকে নিয়ে যাওয়া চিত্রগুলির একটি অনুক্রম - সম্ভবত এই দৃষ্টিভঙ্গি এতটা অস্পষ্ট নয় যদি সনাক্তকারী "জানেন "কি এই দৃশ্যের দিকে নিয়ে যায়।

চিত্রের সংগ্রহ আমার মতে সবচেয়ে আকর্ষণীয় পদ্ধতির। সেই ভাবনার ধারা অব্যাহত রাখুন: একটি চিত্র হয়তো যথেষ্ট পরিমাণে ডেটা সরবরাহ করতে পারে না, তবে একটি প্যানোরামিক ভিউ দৃশ্যটি বিশৃঙ্খল করতে পারে।


হ্যাঁ, লেজগুলি অন্যের সাথে মিশে যায়। এবং হ্যাঁ, ট্রেইলগুলি মাটি / নুড়িযুক্ত বৈশিষ্ট্য দ্বারা বর্ণিত হয়েছে যাতে সেই বৈশিষ্ট্যগুলি অ-ট্রেইল অঞ্চল থেকে পৃথক হওয়া উচিত। আমি সম্মত হই, যে চিত্রটি কিছু বিভাগে চ্যালেঞ্জ হতে পারে, তবে আমি এখনও মনে করি যে ট্রেইলটি কোথায় তা সম্পর্কে মোটামুটি ভাল অনুমান করার জন্য পর্যাপ্ত তথ্য রয়েছে। আপনি এই ট্রেলটির সাথে অপরিচিত হলেও, মনে হচ্ছে এটিতে আপনার কোনও সমস্যা হয়নি (নীচের বাম দিকের অঞ্চলটি যা বোধগম্য।

সত্যই আমি লেজের সীমানা হিসাবে খুব ভাল অনুমান করতে পারি। তবে, আমি আশঙ্কা করছি যে উত্স চিত্রটিতে উপস্থাপন করা হয়েছে তার চেয়ে বেশি তথ্যের উপর নির্ভর করছি। একটি ট্রেইল কী তা আমি "জানি" - সম্ভবতঃ কারণ আমি একটি ট্রেইলের সমন্বিত মূল বৈশিষ্ট্যগুলির একটি মডেল বা টেমপ্লেট তৈরি করেছি: প্রত্যক্ষ অভিজ্ঞতার মাধ্যমে, বা ছবিগুলিতে ভাল-সংজ্ঞায়িত ট্রেলগুলি দেখা ইত্যাদি sum সংক্ষিপ্তসার হিসাবে: ট্রেলটি স্বীকৃতি দেওয়ার জন্য উত্স চিত্র, আমি উত্স চিত্রটিতে যা লক্ষ্য করি তার থেকে অনেক বেশি আঁকছি।

ট্রেইলের কিছু বৈশিষ্ট্য রয়েছে যা একটি দৃষ্টিভঙ্গি সিস্টেমটি ব্যবহার করতে পারে: সম্ভবত আমরা ধরে নিতে পারি যে ট্রেইলটি মুক্ত, নাব্য স্থানের প্রতিনিধিত্ব করে। সুতরাং, গাছ, গুল্ম এবং শিলা বৈশিষ্ট্যগুলিকে "ট্রেল নয়" হিসাবে শ্রেণিবদ্ধ করা যেতে পারে। সম্ভবত কোনও টেক্সচার বিশ্লেষণ এগুলি বুঝতে সহায়তা করতে পারে? যদিও আমি নিশ্চিত নই: গাছের নীচে জমি (মাঝ থেকে ওপরে বাম) ট্রেলের সাথে বেশ মিল দেখাচ্ছে।

আমার প্রথম ধারণাটি হ'ল এলইউ বা ইইগেন রূপান্তরগুলি উল্লেখ করা উচিত যা টেক্সচারটি যখন খুব রুক্ষ হয় তখন একটি উচ্চ প্রতিক্রিয়া দেয়। তবে, এখানে ট্রেইল / নন-ট্রেইলের মধ্যে প্রধান স্বতন্ত্র বৈশিষ্ট্যটি রঙিন বলে মনে হচ্ছে। সুতরাং সম্ভবত এটিকে এইচএসভি রঙের জায়গাতে রূপান্তর করা এবং পিক্সেলগুলি থেকে একটি মুখোশ তৈরি করা যা 'আর্থি' হিউ - বাদামী বা ocher - একটি মোটামুটি অনুমান দেয়।
অরুনিআরসি

12

কোনও একক অ্যালগরিদম নেই যা যাদুতে এলোমেলো ছবিতে ট্রেইল সনাক্ত করবে। ট্রেল সনাক্ত করতে আপনাকে একটি মেশিন লার্নিং ভিত্তিক রুটিন প্রয়োগ করতে হবে এবং এটি "প্রশিক্ষণ" দিতে হবে। খুব বেশি বিশদে না গিয়ে, তত্ত্বাবধানে শেখার পদ্ধতিতে আপনি কী করবেন তার একটি মোটামুটি রূপরেখা এখানে।

  1. আপনার জন্য "প্রশিক্ষণের উদাহরণগুলির" একটি সেট প্রয়োজন হবে যার দ্বারা আমি বিভিন্ন পরিবেশে ট্রেলার কয়েকটি চিত্র বোঝাতে চাইছি, যার মধ্যে আপনি (তত্ত্বাবধায়ক) "ট্রেইল" হিসাবে কী গণনা করেছেন এবং পটভূমি "বন" কী হিসাবে চিহ্নিত করেছেন। আপনি চিত্রগুলি ছোট ছোট বিভাগে বিভক্ত করেছেন (সাধারণত 8x8) এবং এটি ব্লকের ডিসিটি (পৃথক কোসাইন ট্রান্সফর্ম) নিয়ে একটি "বৈশিষ্ট্য স্পেস" এ রূপান্তর করেন। এই ক্ষেত্রে প্রতিটি ব্লকের ডিসিটি আপনাকে একটি 64 পয়েন্ট "বৈশিষ্ট্য ভেক্টর" দেয়।
  2. একটি বৈশিষ্ট্য স্থান ডিফাইনিং , বৈশিষ্ট্য সেট (আপনার 64 বিন্দু বৈশিষ্ট্য ভেক্টর একটি উপসেট), এবং একটি বর্গ স্থান সঙ্গে ক্লাস এবং , আপনি নিরূপণ আপনার প্রশিক্ষণ সেট থেকে:XY y 1 = t r a i lxYy1=traily2=forest

    • ক্লাস শর্তসাপেক্ষ বিতরণ
      • PX|Y(x|trail) , ক্লাসটি যখন হয় তখন বৈশিষ্ট্যগুলির জন্য শর্তসাপেক্ষ ঘনত্ব । trail
      • PX|Y(x|forest) , শ্রেণি যখন বৈশিষ্ট্যগুলির জন্য শর্তাধীন ঘনত্ব । forest
    • বর্গ সম্ভাব্যতা বা পূর্ববর্তী
      • PY(trail) , একটি ব্লকে একটি সন্ধানের সম্ভাবনাtrail
      • PY(forest) , একটি ব্লকে সন্ধানের সম্ভাবনাforest
  3. এটির সাহায্যে আপনি নিজের চিত্রটি পরীক্ষা করুন (আবার এটি ছোট ছোট টুকরো টুকরো টুকরো টুকরো করে) এবং উত্তরোত্তর সম্ভাবনা গণনা করুন। বেয়েসের সিদ্ধান্ত তত্ত্ব ব্যবহার করে আপনি আপনার বাইনারি সংজ্ঞায়িত করবেন (এই ক্ষেত্রে) নির্বাচনের মানদণ্ডের মতো কিছু

    y~i(x)=argmaxyiPX|Y(x|yi) PY(yi)
    যেখানে আপনি প্রতিটি ব্লক সেই শ্রেণীর জন্য নির্ধারণ করেন যেখানে সর্বাধিক উত্তরীয় সম্ভাবনা রয়েছে। এটি আপনার বাইনারি মাস্কের ফলাফল করবে।

দ্রষ্টব্য যে এটি পদ্ধতির একটি খুব সরল ওভারভিউ। কিছু বিষয় বিবেচনায় রাখতে হবে এবং সেগুলির মধ্যে সবচেয়ে গুরুত্বপূর্ণ হল আপনার সমস্যার জন্য বৈশিষ্ট্যগুলির সঠিক সেটটি বেছে নেওয়া choosing আপনি আরও জটিল জিনিসগুলি ব্যবহার করতে পারেন যেমন ব্যবহারের মিশ্রণ মডেল এবং কার্নেল ভিত্তিক ঘনত্বের অনুমান, তবে সেগুলি খুব উত্তম এবং একটি উত্তরে লেখার জন্য সময় সাপেক্ষ।

একটি অনুপ্রেরণা এবং নিশ্চিতকরণের জন্য যে এই পদ্ধতির চেষ্টা করা মূল্যবান, এখানে একটি কোর্স হোমওয়ার্ক হিসাবে অনেক দিন আগে আমি এমন কিছু কাজ করেছিলাম যা থেকে আপনি অর্জন করার চেষ্টা করছেন তার সাথে খুব মিল। উদ্দেশ্যটি ছিল পটভূমি গাছপালা (বাম চিত্র) থেকে প্রাণীটি সনাক্ত করা। ডান দিকের চিত্রটি অগ্রভাগ এবং পটভূমির মধ্যে পার্থক্য করতে "শেখার" পরে প্রাপ্ত বাইনারি মাস্ক দেখায়।

এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন

মেশিন লার্নিং সম্পর্কে আরও জানতে, আপনি কয়েকটি পাঠ্য বইয়ের দিকে নজর দিতে পারেন। ক্ষেত্রের একটি সুপরিচিত এবং প্রায়শই প্রস্তাবিত পাঠ্যপুস্তকগুলির মধ্যে একটি:

টি হাসি, আর তিবশিরানী এবং জে ফ্রেডম্যান, স্ট্যাটাসটিকাল লার্নিংয়ের উপাদানসমূহ: ডেটা মাইনিং, ইনফারেন্সেশন এবং প্রেডিকশন। ২ য় এডি।, স্প্রঞ্জার-ভার্লাগ (২০০৮)

যা সরবরাহিত লিঙ্কটিতে এখন ফ্রি পিডিএফ হিসাবে উপলব্ধ। আর একটি শালীন বই হ'ল:

আর ডুদা, পিই হার্ট এবং ডিজি স্টর্ক, প্যাটার্ন শ্রেণিবিন্যাস , ২ য় সংস্করণ, জন উইলে অ্যান্ড সন্স (২০০১)


1
এই নোটটিতে , আমি ml-class.org চিহ্নিত করতে চাই যা মেশিন লার্নিংয়ের একটি দুর্দান্ত ভূমিকা।
বজর্ঞ্জ

আকর্ষণীয় পদ্ধতি। তবে, যখন আপনি বলছেন পাই (ট্রেইল) এবং পাই (বন) হ'ল "পুরো ছবিতে কোনও ট্রেইলের সন্ধানের সম্ভাবনা", আপনি কি 8x8 ব্লকে বা সম্পূর্ণ চিত্রটিতে এটির সন্ধানের সম্ভাবনা বলতে চান? পুরো চিত্রটি হলে, আমি উভয়ই 100% ভাবতে পারি, যেহেতু সমস্ত প্রশিক্ষণ চিত্রের কোথাও কোথাও এই উভয়টিই থাকবে।
সেরিন

@ ক্যারিন: দুঃখিত, পাই (ট্রেইল) দ্বারা, আমি এটি একটি ব্লকে এটির সম্ভাব্যতা বলতে চাইছি। সুতরাং সেই সমস্ত ব্লকের মোট চিত্র হবে যা পুরো ছবিতে মোট ব্লকের সংখ্যা অনুসারে অনুসরণ করেছে। আমি এটি সংশোধন করতে সম্পাদনা করেছি
Lorem Ipsum

আপনি এক্স স্পেস বৈশিষ্ট্যটি কীভাবে সংজ্ঞায়িত করবেন? আপনি কি 64-পয়েন্ট বৈশিষ্ট্যযুক্ত ভেক্টরগুলির মাত্রা 10 বৈশিষ্ট্যের মতো করে কমাতে কে-মিনস ক্লাস্টারিংয়ের মতো কিছু ব্যবহার করবেন?
সেরিন 21

@ কেরিন হ্যাঁ, মাত্রিকতা হ্রাস করার জন্য সাধারণ উপায়গুলির মধ্যে কে-মানে অন্যতম।
Lorem Ipsum

9

হ্যাঁ, এটি আমার ডোমেনের সাথে খুব মিল বলে মনে হচ্ছে। ধন্যবাদ।

5

এটি টেক্সচার সেগমেন্টেশনের জন্য সমস্যার মতো দেখায় (কোনও রঙ বিভাজন নয়) প্রচুর পদ্ধতি রয়েছে,

তারা প্রায়ই নেই Gábor অবস্থার সৃষ্ট ব্যবহার করে, ভালো http://note.sonots.com/SciSoftware/GaborTextureSegmentation.html

সুপারপিক্সেল ভিত্তিক বিভাজন http://ttic.uchicago.edu/~xren/research/superpixel/

এবং অনুরূপ গ্রাফ কাট বিভাজন http://en.wikedia.org/wiki/Graph_cuts_in_ কম্পিউটার কম্পিউটার_ভিশন

এখানে উইকি ওভারভিউ http://en.wikedia.org/wiki/Segmentation_(image_processing)


গাবর জমিনের অংশগুলি সুন্দর বলে মনে হচ্ছে!
nkint
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.