স্লাইসিং এবং বইয়ের শিরোনাম এবং বুক শেলফ চিত্র থেকে লেখকের স্বীকৃতি


13

আমি চেষ্টা করছি, নিজের শিক্ষার উদ্দেশ্যে, একটি অ্যালগরিদমের একটি বাস্তবায়ন বিকাশের জন্য যা নীচের মতো বইয়ের শেলফের চিত্র দিয়ে বইগুলি তালিকাভুক্ত করবে:

এখানে চিত্র বর্ণনা লিখুন

প্রথম পদক্ষেপটি হ'ল পৃথক বইগুলিতে চিত্রটি টুকরো টুকরো করা।

ম্যাথমেটিকায় আমার অ্যালগরিদম হ'ল:

    img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"]
  • একটি প্রাথমিক প্রান্ত সনাক্তকরণ করুন &
  • পাঠ্য অপসারণ এবং দীর্ঘ লাইন রাখার চেষ্টা করুন

    edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5]
    
  • তারপরে অযাচিত অনুভূমিক লাইনগুলি সরান

    lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]]
    Show[img, Graphics[{Thick, Orange, Line /@ lines}]]
    

ফলাফলগুলি যদিও দুর্দান্ত থেকে কম:

এখানে চিত্র বর্ণনা লিখুন

আমার প্রশ্নগুলি হ'ল:

  1. আরও ভাল ফলাফল পেতে আমি কীভাবে এটি উন্নতি করতে পারি?
  2. এটি করার জন্য আরও দুর্দান্ত উপায় আছে?
  3. (পরে) ওসিআর পর্যায়ে যথাযথতা বাড়াতে আমি আরও কীভাবে চিত্রগুলি প্রসেস করব?
  4. বিভাগগুলি উন্নত করতে কীভাবে রঙের তথ্য ব্যবহার করবেন?

1
@ ওরেপিনস্কি আমি বিভাজনটি নিয়ে সমস্যাটি দেখতে পাচ্ছি না: "ভুয়া বইয়ের অঞ্চলগুলি" সংখ্যা বেশি নয় (আপনি যে নমুনা সরবরাহ করেছেন তাতে কেবল একটিই দেখতে পাচ্ছি), এবং যদি আপনি কোনও ধরণের পাঠ্য স্বীকৃতি দেওয়ার পরিকল্পনা করেন তবে পরবর্তী পদক্ষেপ, এটি বই (ক্ষেত্রের পাঠ্য আছে) এবং না-বইয়ের (কোনও পাঠ্য নেই) মধ্যে পার্থক্য করার পক্ষে যথেষ্ট হবে
পেনেলোপ

3
@ ওরেপিনস্কি, আমি বলব আপনার ফলাফলগুলি দুর্দান্ত। :)
Dima

উত্তর:


7

এখানে একটি গবেষণাপত্রের লিঙ্কটি যা আপনার ইচ্ছা মতো একই কাজ করার চেষ্টা করে। এটি আপনাকে সাহায্য করতে পারে। ইমেজ বৈশিষ্ট্য ব্যবহার করে ইউটিউবে একটি দুর্দান্ত ভিডিও


দুর্ভাগ্যক্রমে, প্রথম লিঙ্কটি নষ্ট হয়ে গেছে।
ইয়ংজায়ে

4

লাইনগুলি সনাক্ত করতে আপনি কোন পদ্ধতিটি ব্যবহার করছেন? আপনি কি এলএসডি নিয়ে পরীক্ষা করার চেষ্টা করেছেন ?

আমি এলএসডি ব্যবহার করে যে দ্রুত পরীক্ষার ফলাফল দিয়েছি তা এখানে:

0.1heightpic1

দ্বিতীয় চিত্রটি একই কোণ সীমাবদ্ধতার সাথে ফলাফলগুলি রয়েছে তবে বিভাগগুলির দৈর্ঘ্যকে উপেক্ষা করে: pic2

আপনি এটির সাথে কিছুটা খেলতে চেষ্টা করতে পারেন, সেরা লাইন বিভাগগুলি কীভাবে চয়ন করবেন তা নির্ধারণ করুন, সেগুলি লাইনগুলিতে প্রসারিত করুন এবং আপনি যে পোস্ট করেছেন তার চেয়ে কিছুটা ভাল ফলাফল পেতে পারেন।


6
"আপনি কি এলএসডি নিয়ে পরীক্ষা করার চেষ্টা করেছেন?" চমৎকার চেষ্টা করুন, এফবিআই;)
ইপসাম

ম্যাথামেটিকার ইমেজলাইন হফ ট্রান্সফর্মের উপর ভিত্তি করে তৈরি হয়েছে এবং আমি এখন নিশ্চিত হয়েছি (বেশিরভাগ প্রতিক্রিয়া থেকে, বেশিরভাগ) যে এটি বেশ ভালভাবে কাজ করে। যদিও এটি আমাকে বিরক্ত করে যে আমি গ্রেস্কেল রূপান্তরিত করার সময় প্রাসঙ্গিক ডেটাগুলি হারাচ্ছি এবং এই অ্যাপ্লিকেশনটিতে রঙের ডেটা (স্বজ্ঞাগতভাবে) একটি শক্তিশালী প্রান্ত সনাক্তকারীকে সহায়তা করতে পারে Lআর এলএসডি চেষ্টা করবে এবং দেখুন এটি কীভাবে চলে! (এটি স্টিভ জবসের পক্ষে আশ্চর্যজনকভাবে ভাল কাজ করেছে! ;-)
ওরেেন পিনস্কি

আমি কোনও বন্ধুকে দরজা সনাক্তকরণের জন্য এলএসডি ব্যবহার করতে দেখেছি, আমি মনে করি শেষ পর্যন্ত ফলাফল নিয়ে তিনি সন্তুষ্ট ছিলেন। আমি বলব এটির শটটি মূল্যবান: ডি
পেনেলোপ

1

প্রান্ত সনাক্তকরণের জন্য আপনার পছন্দ পদ্ধতিটি ব্যবহার করে আপনি পৃথক রঙের ডোমেনগুলিতে প্রান্ত সনাক্তকরণ চেষ্টা করতে পারেন এবং তারপরে সেগুলিকে মার্জ করতে পারেন।

সরাসরি রঙের চিত্রটিতে প্রান্ত সনাক্তকরণের তুলনায় এটি আরও ভাল ফলাফল করতে পারে।


0

আইরিশ সরবরাহিত ভাঙা লিঙ্কের কাগজটি চিত্র এবং পাঠ্য বৈশিষ্ট্যগুলির সংমিশ্রণে পাওয়া যেতে পারে : মোবাইল বইয়ের মেরুদণ্ডের স্বীকৃতিতে একটি হাইব্রিড পদ্ধতি , প্রোক। মাল্টিমিডিয়া, ২০১১-এর 19 তম এসিএম আন্তর্জাতিক সম্মেলন David ডেভিড চেন এট আল-এর অন্য কাগজপত্রও পরীক্ষা করা যায় উদাহরণস্বরূপ, অবস্থান-সচেতন ক্যামেরা ফোন ব্যবহার করে স্বল্প মূল্যের সম্পদ ট্র্যাকিং , প্রোক। এসপিআইই 2010।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.