দ্রুত আনুমানিক অপটিক্যাল প্রবাহ / চিত্র স্থানান্তর


9

অপারেটরকে গতি কমিয়ে দেওয়ার জন্য একটি সতর্কতা দিতে কোনও ক্যামেরা কত দ্রুত প্যান করছে (তা অনুভূমিক / উল্লম্ব) to

পুরো চিত্রটি একটি ব্লক হিসাবে চলমান, আমার কোনও সত্যিকার দিকনির্দেশের প্রয়োজন নেই (যদিও এইচ বা ভি বোনাস হবে) এবং আমার কেবলমাত্র আনুমানিক পরিমাণের প্রয়োজন - যেমন। ট্রিগার যদি ফ্রেমের মধ্যে 'এন' পিক্সেলের বেশি স্থানান্তরিত হয়।

চিত্রগুলি বড় এবং সাধারণত অভিন্ন নিম্ন বিপরীতে দৃশ্যগুলি হয়, আমার ট্র্যাক করার জন্য কোনও স্পষ্ট হাইলাইট নেই। আমার এটি রিয়েলটাইম (60fps) এবং সিপিইউ ব্যবহার না করেই করা দরকার।

নিয়াভ সলিউশনটি কেন্দ্রে একটি রোয়াই বাছাই করা হয়, প্রান্তগুলি সন্ধান করতে হবে, জোড়া ফ্রেমের জোড়ার মধ্যে মিল খুঁজে বের করতে হবে, ফ্রেমগুলির মধ্যে একটি বাম / ডান / উপরে / নীচে একটি পিক্সেল দিয়ে শিফট করুন, পুনরাবৃত্তি করুন - মিনিমা খুঁজে পাবেন।

আমি ভাবলাম কোন চতুর সমাধান আছে কিনা?

উত্তর:


3

সম্ভবত আপনি যদি একটি সাধারণ পদ্ধতি সন্ধান করছেন তবে এটি স্ট্যান্ডার্ড মোশন এস্টিমেশন অ্যালগরিদমগুলি প্রয়োগ করা হবে যা এমপিইজি ক্লাসে সংক্ষিপ্তকরণের কোডে খুব বেশি পরিপক্ক। এগুলি বোঝা সহজ এবং আমার ধারণা আপনি কোড ব্যবহারের জন্য প্রচুর প্রস্তুত পাবেন। এই অ্যালগরিদম ব্লক ভিত্তিতে ব্লকে মোশন ভেক্টর উত্পাদন করে - এবং তারপরে আপনি সর্বাধিক বিশিষ্ট গোষ্ঠীটি খুঁজে পেতে পারেন এবং গড় গতি ভেক্টরের দিক এবং মাত্রা নিতে পারেন।

এমপিইজি 4 - এর আরও একটি মূল ধারণা রয়েছে " গ্লোবাল মোশন ক্ষতিপূরণ ", একটি কৌশল যা ক্যামেরা গতি এবং প্যানিংয়ের প্রথম অনুমান এবং ক্ষতিপূরণ দেওয়ার চেষ্টা করে। সৌন্দর্য হ'ল জটিলতার উপর নির্ভর করে এই জাতীয় পদ্ধতিগুলি সহজ বা পরিসীমা হতে পারে। এখানে একটি উদাহরণ কাগজ এবং একই জন্য অন্য কাগজ

সাধারণভাবে, ক্যামেরা প্যানিং এবং গতি অনুমান করা বেশ প্রতিষ্ঠিত গবেষণা ডোমেন। এখানে একটি উল্লেখ: কাগজ এবং অন্য কাগজ

এই বিষয়ের উপর. আপনি কঠোরতা এবং নির্ভুল অ্যালগরিদম পাশাপাশি সহজ এবং দ্রুত উভয়ই পাবেন।


যদি আমি সুবিধাজনকভাবে কোনও এমপিইজি লাইবটিতে প্রবেশ করতে পারি তবে তা ভাল হবে, আমি মনে করি এমপিগের জিএমসির সমালোচনা ছিল। আমি ভেবেছিলাম ক্যামেরা স্থিতিশীলতার অ্যালগরিদমের কারণে এটি একটি সাধারণ অঞ্চল হবে
মার্টিন বেকেট

আপনি অবশ্যই এমপিইজি অ্যালগরিদমগুলি হুক (বা বরং এক্সট্র্যাক্ট) করতে পারেন। আপনি গ্রন্থাগার হিসাবে এফএফএমপিইগ ব্যবহার করতে পারেন এবং এটি নিষ্কাশন করতে পারেন - তবে এটি সম্ভবত জটিল। বিকল্পভাবে, আপনি নিষ্কাশন করতে MSSG এর ঝরঝরে কোড পড়তে পারেন ।
দিপান মেহতা

জিএমসির উপর সমালোচনা সম্পর্কে - এটি বিট রেট নাটকীয়ভাবে হ্রাস এবং অবজেক্ট ভিত্তিক এনকোডিং তৈরি করার প্রতিশ্রুতির চেয়ে বেশি । যাইহোক, ক্যামেরা গতির প্যারামিটারগুলি অনুমান করা সত্যিই এত কঠিন নয়।
দিপান মেহতা

ধন্যবাদ, আমি এমএসএসজি একবার দেখে নেব আমি ffmpeg ব্যবহার করি তবে জিনিসগুলি এড়িয়ে যাওয়ার পক্ষে এটি সহজ লাইব্রেরি নয়!
মার্টিন বেকেট

3

এটি একটি ধীর ভয়ানক সমাধান হতে পারে তবে আপনি পরবর্তী ফ্রেমের একটি এফএফটি-ভিত্তিক ক্রস-পারস্পরিক সম্পর্ক করতে পারেন এবং তারপরে ফ্রেমের মধ্যে অফসেট সনাক্ত করার জন্য শিখরটি খুঁজে পেতে পারেন। প্রসেসরের চক্র সংরক্ষণ করতে হতে পারে কেবল এটি চিত্রের একটি ছোট উপসেটে।

এটি একটি ফ্রেম থেকে অন্য ফ্রেমে ঘোরানো বা কঠোর দৃশ্যের পরিবর্তনের সাথে কাজ করবে না এবং সম্ভবত আরও ভাল পদ্ধতি রয়েছে। এটি একটি "আমার হাতুড়ি আছে তাই সবকিছুই পেরেকের মতো দেখাচ্ছে" সমাধান। আমার ধারণা এটি ঠিক আপনার নিষ্পাপ সমাধানের মতো, প্রান্ত সনাক্তকরণের প্রয়োজন নেই এবং এফএফটি এটি একবারে একটি পিক্সেল স্পষ্টভাবে স্থানান্তরিত করার চেয়ে অনেক দ্রুত করে তোলে।

এই প্রশ্নটি একই রকম, এবং ক্রস-পারস্পরিক সম্পর্ক ছাড়া অন্য কারও পক্ষে পরামর্শ নেই, সুতরাং এটি এতটা খারাপ নয়: ধারাবাহিক চিত্রগুলির মধ্যে অফসেট গণনা করার জন্য ম্যাটল্যাব ব্যবহার করা হচ্ছে


ধন্যবাদ, এফএফটি ধীর গতিতে অনুমান করা সহজ তবে আমি একটি ছোট 2 window n উইন্ডোও করতে পারি। পুনশ্চ. সন্ধানের জন্য কেবল স্ট্যাকওভারফ্লো.com
মার্টিন বেকেট

3

আপনি বেগ এবং গতি অনুমান করার একটি উপায় চিত্রের কেন্দ্রে উদাহরণস্বরূপ চারটি উইন্ডোর একটি "স্থানীয়" প্রবাহের অনুমান করা। লুকাস – কানাদে ডিফারেনশিয়াল পদ্ধতিটি অনুমান করে যে স্থানচ্যুতি প্রায় ধ্রুবক এবং সুতরাং সমীকরণ হিসাবে এটি সমাধান করা সম্ভব।

সুতরাং আমার ধাপে ধাপে গাইডটি হ'ল:

  1. চিত্রের কেন্দ্রে পিক্সেলগুলির একটি উইন্ডো পান, যেমন 20x20
  2. Ix এবং Iy গ্রেডিয়েন্ট গণনা করুন।
  3. গ্রেডিয়েন্ট উইন্ডোটিকে চারটি টুকরোতে বিভক্ত করুন, যেমন 4x10x10।
  4. পরবর্তী ফ্রেমের সাহায্যে চারটি লিনিয়ার সর্বনিম্ন বর্গাকার সমীকরণগুলি সমাধান করুন।
  5. চারটি বেগের ভেক্টরকে গড়ে গড়ে তোলা।

এটি দিক এবং গতিবেগ নির্ধারণ করে, তবে আপনি এটি আরও শক্তিশালী করতে একটি ভারী উইন্ডো ব্যবহার করতে পারেন। এ লুকাস-Kanade পদ্ধতি তার এক্সটেনশন জন্য।


0

আমি মনে করি অফসেটটি সন্ধানের জন্য ক্রস-পারস্পরিক সম্পর্ক একটি ভাল পদ্ধতি, তবে আপনি যদি এটি সত্যিকারের দ্রুত করতে চান তবে আপনি এটিকে কেবল একটি একক উল্লম্ব এবং একক অনুভূমিক স্ক্যানলাইনে সীমাবদ্ধ করার চেষ্টা করতে পারেন (উদাহরণস্বরূপ চিত্রের কেন্দ্র দিয়ে) উভয় ফ্রেমে স্ক্যানলাইনগুলির মধ্যে ক্রস-পারস্পরিক সম্পর্ককে গণনা করা আপনাকে অনুভূমিক এবং উল্লম্ব অফসেটের একটি আনুমানিক পরিমাণ দেয়।


এটি কাজ করতে পারে, তবে এটি ত্রিভুজভাবে প্যানিং করা থাকলে, এটি ভালভাবে কাজ করবে না, এমনকি পাশের রাস্তা প্যান করার সময় এটি কেবল সামান্য কিছুটা ঘেউ ঘেউ থাকলেও। আমি মনে করি চিত্রটির কেন্দ্রস্থলে একটি আয়তক্ষেত্রাকার সাবগ্রিগেশন আরও ভাল হবে।
এন্ডোলিথ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.