একই রেজোলিউশন এবং ফ্রেমরেটের জন্য বিটরেট কীভাবে আলাদা হয়?

ভিডিওর গুণমান সম্পর্কে পড়াতে আমি আবিষ্কার করেছি যে এটি রেজোলিউশনের উপর নির্ভর করে, প্রতি সেকেন্ডে ফ্রেম এবং বিট্রেট যা ভিডিওর আকার নির্ধারণ করে।

আমার প্রশ্নটি কীভাবে বিটরেট গণনা করা হয় এবং কীভাবে এটি পৃথক হতে পারে।

ধরা যাক একটি ভিডিওর একটি 360x240 রেজোলিউশন রয়েছে। এটি প্রতি ফ্রেমে 86400 পিক্সেল লাগে। ফ্রেমের হার 30 হার্জেড। সুতরাং ভিডিওটি প্রতি সেকেন্ডে 86400 × 30 = 2592000 পিক্সেল নেয়।

সুতরাং ধরা যাক 1 পিক্সেলটি 3 বাইট (24 বিট) ডেটা: আমাদের 2592000 × 24 বিট প্রতি সেকেন্ডে ভিডিও (62208000 বিট), এটি 62208 কেবিটস (এটি সঠিক শোনাচ্ছে না, সম্ভবত আমার গণনায় কিছু সমস্যা)।

তবে এটি কীভাবে আলাদা হতে পারে এবং কীভাবে এটি মানের মধ্যে পার্থক্য তৈরি করে?

video codec video-conversion

— ভিনসেন্ট ম্যাথেজ
সূত্র

ভিডিওটি যদি বিটম্যাপ চিত্রের ক্রম ছিল। আপনার গণিত ইতিমধ্যে png / jpg চিত্র ফাইলের জন্য বন্ধ রয়েছে।

— ড্যানিয়েল অঙ্গুলিনির্দেশ

দুটি বিদ্যমান উত্তর ভিডিও সংক্ষেপণ সম্পর্কে প্রধান বৈশিষ্ট্যটির উপরে জোর দেয় না: সর্বাধিক (সমস্ত না থাকলে) সমস্ত ভিডিও কোডেক ক্ষয়ক্ষতির সংকোচনে নিযুক্ত করে। অর্থাত, কাঁচা ভিডিও সংকুচিত এবং এনকোড করা হলে কিছু চিত্রের তথ্য বাতিল করা হয়। ফেলে দেওয়া এবং হারিয়ে যাওয়া চিত্রের তথ্য / বিশদের পরিমাণ বা ডিগ্রি একটি গুণগত গুণক দ্বারা নির্ধারিত হয় । অডিও সংকোচন হিসাবে, উভয় ক্ষতিকারক এবং ক্ষতিহীন সংকোচনের কৌশল রয়েছে।

— d

@ সাউডস্ট: তারা না? আমি ভেবেছিলাম আমার তৃতীয় অনুচ্ছেদটি এটি মোটামুটি পরিষ্কার করেছে। যাইহোক, অতিরিক্ত তথ্য দেওয়া কখনও কখনও এতটা ভাল হয় না; আমি যদি ইচ্ছুক হয় তবে প্রশ্নকারীকে আরও শিখতে দেওয়ার জন্য পর্যাপ্ত পরিমাণে দেওয়ার বিষয়ে বিশ্বাস করি। অন্যথায়, আমি বলতে পারি যে আপনার পোস্টটিতে কেন কেউ অন্যের চেয়ে কমপ্রেসার বেছে নেবে, বা কেন এতগুলি বিভিন্ন পদ্ধতি ইত্যাদি রয়েছে তার উপর জোর দেওয়া হয়নি

— মার্টি ফ্রাইড

@ সাউডস্ট আপনি সঠিক, এটি কিছুটা জেপিজি অংশে সমাধিস্থ করা হয়েছিল। আমি আরও কিছু বিশদ যুক্ত।

— slhck

উত্তর:

আপনি যা গণনা করেছেন তা হ'ল কাঁচা, সঙ্কোচিত ভিডিওর জন্য বিট্রেট। আপনি সাধারণত গবেষণা বা অন্যান্য বিশেষায়িত অ্যাপ্লিকেশন বাদে এগুলি পাবেন না। এমনকি ব্রডকাস্টারগুলি আপনার সাধারণ ইউটিউব ভিডিওর চেয়ে অনেক বেশি বিটরেটে হলেও সংক্ষেপিত ভিডিও ব্যবহার করে।

সুতরাং, ভিডিওটি কীভাবে সংকুচিত করা হয়েছিল তার সাথে ভিডিও মানের অনেক কিছুই আছে। আপনি এটি যত বেশি সংকুচিত করেন, তত ফ্রেম প্রতি কম বিট লাগে। এছাড়াও, আপনি যত বেশি সংকুচিত হন, গুণমানটি তত খারাপ। এখন, কিছু ভিডিও অন্যদের তুলনায় সংক্ষিপ্ত করা আরও সহজ - সংক্ষেপে, এ কারণেই তাদের রেজোলিউশন এবং ফ্রেমরেট সত্ত্বেও তাদের কম বিটরেট রয়েছে।

এটি কেন, তা বোঝার জন্য আপনাকে ভিডিও সংক্ষেপণের দুটি মূল নীতি সম্পর্কে সচেতন হওয়া দরকার। এগুলিকে "স্থানিক" এবং "অস্থায়ী রিডানডেন্সি" বলা হয়।

স্থানিক অপ্রয়োজনীয়

প্রাকৃতিক সামগ্রী দেখায় এমন চিত্রগুলিতে স্থানিক অপ্রয়োজনীয়তা বিদ্যমান। এই কারণেই জেপিইজি এত ভাল কাজ করে - এটি চিত্রের ডেটা সংকুচিত করে কারণ পিক্সেলগুলির ব্লকগুলি একসাথে কোড করা যেতে পারে। এগুলি উদাহরণস্বরূপ 8 × 8 পিক্সেল। এগুলিকে "ম্যাক্রোব্লকস" বলা হয়।

আধুনিক ভিডিও কোডেকগুলি একই কাজ করে: তারা ফ্রেমকে সংকুচিত করতে, ব্লক করে ব্লক করে মূলত জেপিজিতে অনুরূপ অ্যালগরিদম ব্যবহার করে। সুতরাং আপনি আর পিক্সেল প্রতি বিট সংরক্ষণ করবেন না, কিন্তু ম্যাক্রোব্লক প্রতি বিট, কারণ আপনি পিক্সেল বৃহত্তর গ্রুপে "সংক্ষিপ্ত" করেন। তাদের সংক্ষিপ্তসার দ্বারা, অ্যালগরিদম এমন তথ্যও ফেলে দেবে যা মানুষের চোখের কাছে দৃশ্যমান নয় - এটিই আপনি বেশিরভাগ বিটরেট হ্রাস করতে পারবেন। এটি ডেটা পরিমাণের মাধ্যমে কাজ করে । এটি আরও অনুধাবনযোগ্য ফ্রিকোয়েন্সি ধরে রাখবে এবং আমরা দেখতে পাচ্ছি না এমনগুলি "দূরে ফেলে"। বেশিরভাগ কোডেকগুলিতে কোয়ান্টাইজিং ফ্যাক্টরকে "কিউপি" হিসাবে প্রকাশ করা হয়, এবং এটি মানের জন্য প্রধান নিয়ন্ত্রণ নকব।

আপনি এখন আরও এগিয়ে যেতে পারেন এবং একই চিত্রটিতে আগে এনকোড করা ম্যাক্রোব্লকগুলি থেকে ম্যাক্রোব্লকগুলির পূর্বাভাস দিতে পারেন। এটিকে ইনট্রা প্রেডিকশন বলা হয় । উদাহরণস্বরূপ, ধূসর প্রাচীরের একটি অংশ ইতিমধ্যে ফ্রেমের উপরের বাম কোণে এনকোড করা ছিল, তাই আমরা সেই একই ম্যাক্রোব্ল্যাকটি আবার একই ফ্রেমে ব্যবহার করতে পারি, উদাহরণস্বরূপ, এর ঠিক পাশের ম্যাক্রোব্লোকের জন্য। আমরা পূর্বেরটির পার্থক্যটি কেবল সংরক্ষণ করব এবং ডেটা সংরক্ষণ করব। এইভাবে, আমাদের দুটি ম্যাক্রোব্লকগুলি একে অপরের সাথে সাদৃশ্যপূর্ণভাবে এনকোড করতে হবে না।

একই চিত্রের আকারের জন্য বিটরেট কেন পরিবর্তন হয়? ঠিক আছে, কিছু চিত্র অন্যদের চেয়ে এনকোড করা সহজ। স্থানিক ক্রিয়াকলাপ যত বেশি হবে, ততই আপনাকে প্রকৃতপক্ষে এনকোড করতে হবে। মসৃণ জমিন বিশদগুলির চেয়ে কম বিট নেয়। একইভাবে ইন্টারটা পূর্বাভাসের ক্ষেত্রেও দেখা যায়: ধূসর প্রাচীরের ফ্রেম আপনাকে অন্য সকলকে পূর্বাভাস দেওয়ার জন্য একটি ম্যাক্রোব্লক ব্যবহার করার অনুমতি দেবে, অন্যদিকে প্রবাহিত জলের একটি ফ্রেম এটি ভালভাবে কাজ করতে পারে না।

অস্থায়ী অপ্রয়োজনীয়

এটি বিদ্যমান কারণ অন্য ফ্রেমের অনুসরণকারী কোনও ফ্রেম সম্ভবত তার পূর্বসূরীর সাথে খুব মিল। বেশিরভাগ ক্ষেত্রে, কেবলমাত্র একটি সামান্য বিট পরিবর্তন হয় এবং এটি সম্পূর্ণরূপে এনকোড করার কোনও মানে হয় না। ভিডিও এনকোডাররা যা করে তা কেবল দুটি পরবর্তী ফ্রেমের মধ্যে পার্থক্যকে এনকোড করা হয় , যেমন তারা ম্যাক্রব্লকগুলি করতে পারে।

গতি ক্ষতিপূরণ সম্পর্কিত উইকিপিডিয়ায় নিবন্ধ থেকে একটি উদাহরণ গ্রহণ করা যাক, এটি বলি এটি আপনার মূল ফ্রেম:

তারপরে পরবর্তী ফ্রেমের পার্থক্য কেবল এটি:

এনকোডার এখন কেবল প্রকৃত পার্থক্যগুলি সঞ্চয় করে , পিক্সেল বাই পিক্সেল মানগুলি না। এজন্য প্রতিটি ফ্রেমের জন্য ব্যবহৃত বিট প্রতিবার একই হয় না। এই "পার্থক্য" ফ্রেমগুলি সম্পূর্ণ এনকোডযুক্ত ফ্রেমের উপর নির্ভর করে এবং এ কারণেই আধুনিক কোডেকগুলির জন্য কমপক্ষে দুটি ধরণের ফ্রেম রয়েছে:

আই-ফ্রেম (ওরফে কীফ্রেম) - এগুলি সম্পূর্ণরূপে এনকোডযুক্ত
পি-ফ্রেম - এগুলি কেবলমাত্র পার্থক্য সংরক্ষণ করে

আপনার মাঝে মাঝে ভিডিওতে আই-ফ্রেম sertোকানো প্রয়োজন। আসল বিটরেট ব্যবহৃত আই-ফ্রেমের সংখ্যার উপরও নির্ভর করে। তদ্ব্যতীত, দুটি পরবর্তী ফ্রেমের মধ্যে গতির যত বেশি পার্থক্য রয়েছে, তত বেশি এনকোডারকে সংরক্ষণ করতে হবে। "কিছুই না" সরানোর একটি ভিডিও স্পোর্টস ভিডিওর চেয়ে এনকোড করা সহজ হবে এবং প্রতি ফ্রেমে কম বিট ব্যবহার করবে।

— slhck
সূত্র

+1 - এটাই আমি বোঝাতে চেয়েছি, তবে আমার সংক্ষেপণ অ্যালগরিদমটি কিছুটা বাদ গেল। :)

— মার্টি ফ্রাইড

+1 এটি আমার যা প্রয়োজন তা হ'ল। বিশেষত গতির ক্ষতিপূরণ। ধন্যবাদ

— ভিনসেন্ট ম্যাথেজ

আমি বিশ্বাস করি আপনার গণিতটি আসলেই সঠিক, তবে এর থেকে আরও কিছুটা আছে; সংক্ষিপ্ততা এখানে মিসিং লিঙ্ক।

আপনি সঙ্কোচিত বিট রেট গণনা করেছেন এবং সংক্ষেপণ বিদ্যমান থাকার কারণ নিয়ে এসেছিলেন। বিট রেটগুলি অসম্পূর্ণ ভিডিও সহ অসম্ভব বড় হয়ে যায়। সুতরাং, তারা উত্সটিতে ভিডিওটি সংকোচিত করে এবং এটি রিসিভারে সঙ্কুচিত করে এবং তারপরে বিট রেট পরিচালনাযোগ্য হয়। আপনার কেবলমাত্র একটি পর্যাপ্ত পর্যাপ্ত ডিকম্প্রেসারের প্রয়োজন, যা হার্ডওয়্যার বা সফ্টওয়্যার হতে পারে।

সুতরাং, সমস্যাটি কতটা সংকোচন সহ্য করা যায় তা হয়ে যায় - এটি নিরহঙ্কার নয়, সাধারণত, সুতরাং আপনি তথ্য হারাচ্ছেন, তবে তারা এটিকে কম বুদ্ধিমান করার জন্য কম গুরুত্বপূর্ণ ডেটা হারাতে যথেষ্ট বুদ্ধিমান করার চেষ্টা করেছেন যা এতটা লক্ষণীয় হবে না। প্রচুর গতি না হওয়া পর্যন্ত এটি সাধারণত মোটামুটি সহজ, তারপরে এটি আরও জটিল হয়ে ওঠে।

সম্পাদনা করুন: যুক্ত করতে ভুলে গেছেন, তবে সংক্ষেপণের পদ্ধতি প্রয়োগকারী অংশগুলি হ'ল কোডেক; আমি লক্ষ্য করেছি যে আপনি এটি আপনার পোস্টে ট্যাগ হিসাবে ব্যবহার করেছেন।

— মার্টি ফ্রাইড
সূত্র

এছাড়াও ভিডিও সংক্ষেপণ সাধারণত পিক্সেল-ভিত্তিক নয়, তবে পিক্সেলগুলির ব্লকগুলিতে কাজ করে, তথাকথিত ম্যাক্রোব্লকস ।

— 6h12