Ffmpeg ব্যবহার করে স্টিরিওতে যথাযথভাবে ডাউনমিক্স 5.1


27

আমার কাছে এমন একটি ফিল্মের একটি 5.1 অডিও ট্র্যাক রয়েছে যেখানে সামনে বাম এবং সামনের ডানে সঙ্গীত থাকে এবং কেন্দ্রে সংলাপ থাকে contains ভিএলসিতে 5.1 ট্র্যাকটি খেলে সমস্ত কিছু সুন্দরভাবে মিশ্রিত হয়।

আমি 5.1 ট্র্যাকটি স্টেরিও ব্যবহার করে রূপান্তর করার চেষ্টা করছি ffmpeg -ac 2, তবে ফলস্বরূপ স্টেরিও মিশ্রণটি স্থানীয়ভাবে 5.1 ট্র্যাক খেলার চেয়ে অনেক দুর্বল ভলিউম রয়েছে।

যোগ করা -af "pan=stereo|c0=FL|c1=FR"সঠিক ভলিউম দেয়, কিন্তু তারপরে কোনও সংলাপ হয় না কেননা কেন্দ্রের চ্যানেলটি অন্তর্ভুক্ত নয়।

সুতরাং সমাধানটি সম্ভবত বাম / কেন্দ্র / ডানটিকে স্টেরিওতে মিশ্রিত করা এবং পিছনের প্রান্তের সাবউফার চ্যানেলগুলি ফেলে দেওয়া উচিত? (আমি এখানে অনুমান করছি ...)

সুতরাং প্রশ্নটি হল: শেষ ফলাফলের একই শক্তিশালী ভলিউম সহ, আমি কীভাবে ভিএলসি এটির স্টিরিও করতে ffmpeg ডাউনমিক্স 5.1 করব?


আপনি কি নিশ্চিত যে ভিএলসি আসলে অতিরিক্ত চ্যানেলগুলি খেলছে? ডাউনমিক্সিংয়ের ফলে স্বাভাবিককরণ হতে পারে যাতে প্রতি আউটপুট চ্যানেল প্রতি ইনপুটটির যোগফল ওভারলোডের ফলে না ঘটে তাই ক্লিপিং প্রতিরোধ করা হয়। এটি শব্দকে আরও শান্ত করে তুলতে পারে।
লগন

মূল কথাগুলি: আমার ফাইলটি 5.1 is আমার স্পিকাররা স্টেরিও। আমি জানি না ভিএলসি কী করে, তবে এটি আমার স্টেরিও স্পিকারগুলিকে 5.1 উত্স ডেটা (শক্তিশালী ভলিউম, উভয় সংগীত এবং কথোপকথন অন্তর্ভুক্ত) থেকে দুর্দান্ত পরিণতি তৈরি করে। অন্যদিকে, ffmpeg ব্যবহারের সময় "লো ভলিউম" ফলাফল তৈরি করে -ac 2। সুতরাং আমি জিজ্ঞাসা করছি কীভাবে এফএফপিজেগ তৈরি করতে হবে একইভাবে ভাল ফলাফল যেমন ভিএলসি তৈরি করে।
এপ্রিলের পরে

উত্তর:


29

শ্যান অন্যান্য চ্যানেলগুলির খুব কম এবং কেন্দ্রের খুব বেশি সরবরাহ করার জন্য উত্তরটি পেয়েছিল। সমস্ত কথোপকথন এবং পর্যাপ্ত ব্যাকগ্রাউন্ড সঙ্গীত / প্রভাবগুলির সাথে হেডফোনগুলি সহ সিনেমাগুলি ভারসাম্য বন্ধ করে দেয়।

মতে ATSC মান (অধ্যায় 7.8, পৃষ্ঠা 91), নিম্নলিখিত সূত্র প্রচলিত স্টেরিও (যেমন ম্যাট্রিক্স উল্টোদিকে) এর 5.1 downmix করতে ব্যবহৃত হয়:

Lo = 1.0 * L + clev * C + slev * Ls ;
Ro = 1.0 * R + clev * C + slev * Rs ;

উপরের বর্ণিত নথিতে সারণি 5.9 এবং 5.10 অনুসারে ক্লিভ এবং স্লেভ হওয়া উচিত .707 হওয়া উচিত, একটি কেন্দ্র / আশেপাশে 0 এর মিশ্রণ স্তরকে ধরে রেখে অন্য মানগুলি সেই সারণীতে প্রদান করা হয় যা কেন্দ্রের মিশ্রণের পরিমাণ হ্রাস করে, যা আমি পাই না দরকারী।

এটি মাথায় রেখে, নিম্নলিখিত ffmpeg বিকল্পটি শ্রাব্য সংলাপের সাথে একটি ভাল সুষম শব্দ তৈরি করে। নোট করুন যে অডিও চ্যানেলগুলি নির্দিষ্ট করার প্রয়োজন নেই।

-af "pan=stereo|FL < 1.0*FL + 0.707*FC + 0.707*BL|FR < 1.0*FR + 0.707*FC + 0.707*BR"

প্যান ফিল্টার ডকুমেন্টেশন থেকে কম-প্রতীক ব্যবহারের জন্য একটি নোট :

যদি কোনও চ্যানেলের স্পেসিফিকেশনের '=' স্থানটি '<' দ্বারা প্রতিস্থাপন করা হয়, তবে সেই স্পেসিফিকেশনের জন্য লাভগুলি পুনর্নবীকরণ করা হবে যাতে মোট 1 হয়, সুতরাং ক্লিপিং শব্দের এড়ান।


5
আপনি এখানে যে এটিএসসি মানক সংযুক্ত করেছেন সেগুলি বিষয়টির সাথে এফএফম্পেগ উইকির সাথে সংযুক্ত ছিল , সুতরাং এটি আশ্চর্যের বিষয় নয় যে এখানে ব্যবহৃত সূত্রটি এফএফপিপেইগের সাথে তার ac -2স্যুইচ দ্বারা প্রয়োগ করা একইরকম । অন্য কথায়, এই ফিল্টারটি ব্যবহার এবং করার মধ্যে একমাত্র পার্থক্য ac -2হ'ল আরও অনেক বেশি টাইপ করা।
হাশিম

@ হাশিম শুধু টাইপিং নয় "এটি পেতে এটি টাইপ করুন" এর চেয়ে আন্ডারপাইনগুলির পুরো ব্যাখ্যা সহ একটি উত্তর উদ্দেশ্যমূলকভাবে ভাল।
সেবাদাস্তন সাবন্যুক

18

এই প্রশ্নের উত্তরগুলি তখন থেকেই কিছুটা গণ্ডগোলের আকার ধারণ করেছে, যার মধ্যে অনেকগুলি অতিরিক্ত তথ্য রয়েছে এবং অন্যেরা সম্পূর্ণ ভুল করে। এই উত্তরগুলির মধ্যে সমস্যাগুলি দূর করার সময় এই উত্তরগুলির তথ্যগুলি প্রবাহিত করার একটি প্রচেষ্টা।

সবচেয়ে গুরুত্বপূর্ণ, এটি মনে রাখা উচিত যে গ্রেগরির উত্তর, বর্তমানে এই প্রশ্নের শীর্ষে ভোট দেওয়া উত্তর, -ac 2সুইচটি ব্যবহার করার চেয়ে আলাদা নয় - আরও নীচের দিকে এটি।

স্টিরিওতে 5.1 চ্যানেলের অডিও স্ট্রিম ডাউনমিক্সিং -ac 2

স্টেরিওতে 5.1 ট্র্যাক ডাউনমিক্সিংয়ের জন্য এফএফএমপিগ অন্তর্নির্মিত ক্ষমতা সহ আসে এবং এফএফএমপিগের নিজস্ব ডকুমেন্টেশনগুলির দ্বারা প্রস্তাবিত এটিও সমাধান :

দ্রষ্টব্য: ffmpeg একটি ডিফল্ট ডাউন-মিক্স (এবং আপ-মিক্স) সিস্টেমকে সংহত -acকরে যা আপনার খুব নির্দিষ্ট প্রয়োজন না থাকলে প্যান ফিল্টারের উপর পছন্দ ( বিকল্প) পছন্দ করা উচিত ।

-ac 2পিছনে বাম, পিছনে ঠিক, সামনে বাম, ফ্রন্ট রাইট এবং ফ্রন্ট কেন্দ্র - - সুইচ উৎস এর 6 চ্যানেল স্ট্রীম থেকে প্রথম 5 চ্যানেলের অনুপাত মিশ করে কাজ করে আউটপুট স্টেরিও স্ট্রীমের সামনে বাম এবং ফ্রন্ট রাইট চ্যানেল:

এখানে চিত্র বর্ণনা লিখুন

এটি করার সময়, এলএফই চ্যানেল থেকে অডিও ( 5.1 সালে .1 , সাবউফারটির জন্য সংরক্ষিত এবং গভীর, কম-ফ্রিকোয়েন্সি প্রভাবের জন্য ব্যবহৃত) এই বিকল্পটি ব্যবহার করার সময় সম্পূর্ণভাবে বাতিল করা হবে

দুর্ভাগ্যক্রমে, আমার পরীক্ষাগুলির -ac 2ফলে সংগীত এবং কথোপকথনের উভয়ের সামগ্রিক স্তরের ফলাফল হয়েছিল যা উত্সের চেয়ে সবচেয়ে আলাদা ছিল, এটি ডাউনমিক্স সূত্র তৈরি করে যা আমার পরীক্ষিত সমস্ত সূত্রগুলির মধ্যে সবচেয়ে খারাপ আউটপুট দেয়, যদিও আপনি এটি পরীক্ষা করে দেখতে পারেন যে এটি আপনার প্রয়োজনের জন্য আপনাকে একটি যথাযথ পর্যাপ্ত ডাউনমিক্স দেয়, সেক্ষেত্রে অন্য যে কোনও সূত্র ব্যবহার করা আপনার পক্ষে ওভারকিল হতে পারে।


কোনও ডিটিএস ট্র্যাকটিকে ট্রান্সকোড -ac 2 ছাড়াই ডাউনমিক্স করার জন্য (যেমন এর কোডেক এবং প্রসারকে একই রাখার জন্য):

ffmpeg -i "sourcetrack.dts" -c:a dca -ac 2 "stereotrack.dts"

মফিস্টোর তার উত্তরে যেমন উল্লেখ করা হয়েছে, যদি সংলাপ এবং সংগীত যদি একে অপরের মধ্যে সুষম সুরক্ষিত মনে হয় তবে কেবলমাত্র ভলিউমের অভাব হয় তবে আপনি স্ট্রিমটির পরিমাণ আরও বাড়িয়ে তুলতে পারেন:

ffmpeg -i "sourcetrack.dts" -c:a dca -ac 2 -vol 425 "stereotrack.dts"

জন্য -volসুইচ, উৎস মধ্যে 100% ভলিউম পূর্ণসংখ্যা মান 256 এবং একটি বৃহত্তর মান ব্যবহার ছাড়া এই অডিও স্ট্রীম সামগ্রিক আয়তন বৃদ্ধি হবে দেওয়ার সমতুল্য। তবে নোট করুন যে খুব বেশি করে কাজ করার ফলে বিশেষত এর জোরে বিভাগগুলির সময় বিকৃতি বা শিল্পকর্মের কারণ হতে পারে।

স্টিরিওতে কোনও অডিও স্ট্রিম ডাউনমিক্স করতে এবং এটি AC3 কোডেকে ট্রান্সকোড করতে উদাহরণস্বরূপ:

ffmpeg -i "sourcetrack.dts" -c:a ac3 -ac 2 "stereotrack.ac3"

কাস্টম মিক্স অ্যালগরিদমের সাথে স্টেরিওতে 5.1 চ্যানেলের অডিও স্ট্রিম ডাউনমিক্সিং

আপনি যদি আরও উচ্চমানের ডাউনমিক্স চান বা আপনার আউটপুটে অবশ্যই এলএফই স্ট্রিমটি অবশ্যই অন্তর্ভুক্ত করতে পারেন, আপনি -afকাস্টম মিক্স সূত্রটি ব্যবহার করে অডিও ডাউনমিক্স করতে FFmpeg এর অডিও ফিল্টার সুইচ ( ) ব্যবহার করতে পারেন ।

এটিএসসি সূত্রের সাথে ডাউনমিক্সিং (গ্রেগরির উত্তর)

এই উত্তরটি পোস্ট করার সময় পর্যন্ত, এই প্রশ্নের শীর্ষ-ভোট দেওয়া উত্তরটি গ্রেগরির ছিল , যা এটিএসসি স্পেসিফিকেশন থেকে সূত্রটি (বিভাগে 7.8.2 দেখুন, দুটি চ্যানেলে ডাউনমিক্সিং দেখুন ) একটি এফএফপিপে অডিও ফিল্টারটিতে রেখেছেন । এই স্পেসিফিকেশন নিজেই সরাসরি লিঙ্ক করা বিষয়ে FFmpeg ডকুমেন্টেশন দ্বারা , যা নির্দেশ এটা অত্যন্ত সম্ভবত একই সূত্র হতে যে FFmpeg ইতিমধ্যে তার জন্য কার্যকরী -ac 2সুইচ। যদি এটি সত্য হয়, তবে গ্রেগরির উত্তরে পুরো সূত্রটি টাইপ করা -ac 2স্যুইচটি ব্যবহার করার চেয়ে আলাদা নয় , এবং তাই সময় নষ্ট।

গ্রেগরির উত্তর থেকে ফিল্টার -ac 2এবং উভয়ই একই ইনপুট অডিওকে পুনরায় এনকোড করে নির্দিষ্টটির জন্য এটি পরীক্ষা করার সিদ্ধান্ত নিয়েছি -af(সঠিক উত্তরগুলি এই উত্তরটির পাদটীকাগুলিতে দেখা যেতে পারে)।

আমি তার পরে ফলাফলের আউটপুট ফাইলগুলির আকারগুলি তুলনা করে দেখতে পেলাম যে তারা একই আকারের বাইট-বাইট ছিল:

এখানে চিত্র বর্ণনা লিখুন

অবশেষে, আমি দু'টি আউটসিটি ফাইল অড্যাসিটিতে খুলেছি এবং তাদের তরঙ্গকারীর তুলনা করেছিলাম যে তারা অভিন্ন ছিল (বড় করার জন্য ক্লিক করুন):

এখানে চিত্র বর্ণনা লিখুন

সুতরাং এটি বেশ চূড়ান্ত বলে মনে হয় যে গ্রেগরির উত্তরে বর্ণিত এটিএসসি সূত্রটি এফএফম্পেগ দ্বারা ইতিমধ্যে প্রয়োগ করা হয়েছে , এবং এটি এমন কিছু না করে যখন এটি কিছুই -ac 2করে না তখন এটি সম্পূর্ণরূপে অপ্রয়োজনীয় হয় এবং এটি আরও জটিল কাজ।

এলএফই চ্যানেলটি ছাড়াই ডাউনমিক্সিং (ডেভ_7৫০ এর উত্তর)

উত্তরের অন্তর্ভুক্ত বেশ কয়েকটিগুলির মধ্যে এটিই ডাউনমিক্স সূত্রগুলির মধ্যে কেবলমাত্র এলএফই চ্যানেলটিকে সম্পূর্ণরূপে বিসর্জনের পরিবর্তে আউটপুট স্টেরিওতে মিশিয়ে প্রদর্শিত হয় এবং ফলস্বরূপ, উত্স থেকে স্বল্পতম শব্দটি নিশ্চিত করে এমন একটি এটি is নিখোঁজ.

সামগ্রিক ভলিউম স্তরটি তুলনায় উচ্চতর এবং পূর্ণ -ac 2, তবে এটি নীচের নাইটমোড ডায়ালগ ডাউনমিক্সের চেয়েও কম। যাইহোক, সংগীত স্তরগুলি নাইটমোড ডায়ালগ ডাউনমিক্সের তুলনায় উত্সের খুব কাছাকাছি এবং এলএফই ট্র্যাক অন্তর্ভুক্তির কারণে, এই ডাউনমিক্স সূত্রটি ব্যবহার করার সময় আউটপুটটির পরিমাণ বাড়িয়ে আউটপুট স্ট্রিম তৈরি করতে পারে যা অন্য সমস্ত সংখ্যার চেয়ে 5.1 উত্সকে সত্য বলে মনে হয় সূত্রগুলি আমি পরীক্ষা করেছি।

আপনার যদি দক্ষতা থাকে তবে আমি এই ডাউনমিক্স সূত্র এবং নাইটমোড ডায়ালগ ডাউন ডাউনমিক্স উভয়টি ব্যবহার করে আপনার অডিও স্ট্রিম (গুলি) কে খুব এনকোড করার পরামর্শ দিচ্ছি এবং কোনটি আরও ভাল তা নির্ধারণ করার জন্য সাবধানতার সাথে দুটির তরঙ্গরূপের সাথে তুলনা করব।

এই সূত্রটি ব্যবহার করে স্টেরিওর 5.1 ট্র্যাক ডাউনমিক্স করা এবং এর ভলিউম স্তরটি 425 (যেখানে 256 মূল উত্সের ভলিউম স্তরের 100%) বাড়িয়ে তুলুন :

ffmpeg -i "sourcetrack.dts" -c dca -vol 425 -af "pan=stereo|FL=0.5*FC+0.707*FL+0.707*BL+0.5*LFE|FR=0.5*FC+0.707*FR+0.707*BR+0.5*LFE" "outputstereo.dts"

রবার্ট কলিয়ার নাইটমোড সংলাপের সাথে ডাউনমিক্সিং (শেন হেরেলসনের উত্তর)

Nightmode সংলাপ সূত্র, দ্বারা নির্মিত রবার্ট কলিয়ার উপর Doom9 ফোরাম ও তার উত্তর শেন হ্যারেলসনের দ্বারা sourced, একটি ফলাফল অনেক ভালো তুলনায় downmix -ac 2সুইচ - পরিবর্তে মাত্রাতিরিক্ত শান্ত সংলাপ, এটি তাদের ফিরিয়ে মাত্রা যে কত কাছাকাছি হয় এনেছে সূত্র.

রবার্ট কলিয়ার মিশ্রণের বর্ণনা থেকে:

Eac3to ব্যবহার করে অনেকগুলি ডিটিএস মুভি ট্র্যাকগুলি 5.1 থেকে 2.0 তে রূপান্তর করার পরে, আমি খুব শান্ত কথোপকথন এবং অতিরিক্ত জোরে সংগীত এবং অ্যাকশন দৃশ্যের জন্য ডিফল্ট eac3to চ্যানেল ম্যাপিংগুলি পেয়েছি। যদিও eac3to চ্যানেল ডাউনমিক্স সহগের একটি বৈজ্ঞানিক ভিত্তি রয়েছে, তারা কম কথোপকথনের ভলিউমের কারণে প্রায়শই অনুশীলনে ভাল বলে মনে হয় না। এই প্রিসেটটি তাদের জন্য বাম এবং ডান চ্যানেল সঙ্গীত এখনও শ্রুতিমধুর হলেও ব্যাকগ্রাউন্ডে আরও স্পষ্ট কথোপকথনের সন্ধান করছে।

আপনি দেখতে পাচ্ছেন - সম্মুখ কেন্দ্র (কথোপকথনগুলি) এখনই সঠিকভাবে আসবে এবং মূল স্তরে থাকুন - যখন সংগীত এবং বিস্ফোরণগুলি একটি পটভূমি প্রভাব হিসাবে থেকে যায় এবং আপনাকে পরাশক্তি দেয় না। এই প্রিসেটটি সংলাপ শোনার জন্য ডিটিএস 5.1 কে 2.0 মুভিতে রূপান্তরিত করা দেখার সময় ক্রমাগত ভলিউম গিঁট দিয়ে যাওয়া আপনার সমস্যার সমাধান করে। (বিশেষত রাতে এমন সিনেমা দেখার জন্য যেখানে আপনি অন্যকে জাগাতে চান না কিন্তু তবুও আপনি ডায়লগ শুনতে সক্ষম হতে চান)।

দুর্ভাগ্যক্রমে, এই ডাউনমিক্স সূত্রটির সংগীত 5.1 উত্সের তুলনায় অনেক কম (যা কলিয়ার "নাইটমোড" মিশ্রণটি তৈরি করার ইচ্ছা বিবেচনা করে তৈরি হয়েছিল) এবং এলএফই ট্র্যাকের সম্পূর্ণ ক্ষতির কারণে, সামগ্রিক আউটপুট অডিওটি না উত্সাহিত ভলিউম সহ ডেভ_750০ এর সূত্র হিসাবে পুরো হিসাবে উত্স বা কাছাকাছি শব্দ ।

যাইহোক, যদি কোনও কারণে আপনি স্ট্রিমের সামগ্রিক পরিমাণকে বাড়ানো এড়াতে চান, তবে নাইটমোড ডায়ালগটি সম্ভবত আপনার সেরা বিকল্প হতে পারে - যদিও আবারও, আমি আপনার অডিও স্ট্রিমটিকে উভয়ের সাথে এনকোড করার এবং দুটির তরঙ্গকারীর সাথে সাবধানতার সাথে তুলনা করার সুপারিশ করব ।

এফএফম্পেগে নাইটমোড ডায়ালগ সূত্রটি ডাউনমিক্স করতে:

ffmpeg -i "sourcetrack.dts" -c dca -af "pan=stereo|FL=FC+0.30*FL+0.30*BL|FR=FC+0.30*FR+0.30*BR" "stereotrack.dts" 

তারকের উত্তর

এই উত্তরটি কেবল শেন হ্যারেলসনের উত্তর থেকে নাইটমোড ডায়ালগ ডাউনমিক্স সূত্রকে এমকেভি কনটেইনে অডিও স্ট্রিমকে রূপান্তর করতে একটি আদেশে রাখে। যদিও এই উত্তরে প্রদত্ত আদেশটি এই জাতীয় অডিও স্ট্রিমটিতে ভাল কাজ করবে, এটিকে স্বতন্ত্র অডিও ট্র্যাকের জন্য খাপ খাইলে ত্রুটি ঘটবে:

ফিল্টারিং এবং স্ট্রিমকপি একসাথে ব্যবহার করা যাবে না

এটি হ'ল ডাউনমিক্সিংয়ের সময় অডিও কোডেক অনুলিপি করা যায় না - এফএফএমপিগ অন্য আউটপুট স্ট্রিমের মতো করে তোলে, ডাউনমিক্সের প্রয়োজন হয় পরিবর্তনগুলি প্রয়োগ করার জন্য ট্র্যাকটি পুনরায় এনকোড করা উচিত।

এই কমান্ডটিতে একটি রিডানড্যান্ট -ac 2সুইচও অন্তর্ভুক্ত ছিল যা এফএফম্পেগ উপেক্ষা করবে।


পরীক্ষা আদেশ

এই উত্তরের জন্য যে পরীক্ষাগুলি আমি চালিয়েছি তার নির্ভরযোগ্যতা প্রদর্শনের জন্য, প্রতিটি ডাউনমিক্স সূত্র পরীক্ষা করার জন্য আমি ব্যবহৃত সমস্ত আদেশ নীচে দেওয়া আছে below

-ac 2বিকল্পের জন্য পরীক্ষামূলক কমান্ড ব্যবহৃত হয়েছে :

ffmpeg -i "signed16bitPCM.wav" -c pcm_s16le -ac 2 "Audio 1 (-ac 2).wav"

গ্রেগরির উত্তরের জন্য পরীক্ষা কমান্ডটি ব্যবহৃত হয়েছিল:

ffmpeg -i "signed16bitPCM.wav" -c pcm_s16le -af "pan=stereo|FL < 1.0*FL + 0.707*FC + 0.707*BL|FR < 1.0*FR + 0.707*FC + 0.707*BR" "Audio 2 (ATSC Algorithm Downmix).wav"

ডেভ_7৫০ এর উত্তরের জন্য পরীক্ষামূলক কমান্ডটি ব্যবহৃত হয়েছে:

ffmpeg -i "signed16bitPCM.wav" -c pcm_s16le -vol 425 -af "pan=stereo|FL=0.5*FC+0.707*FL+0.707*BL+0.5*LFE|FR=0.5*FC+0.707*FR+0.707*BR+0.5*LFE" "Audio 4 (Dave750 Downmix).wav"

শেন হ্যারেলসনের উত্তরের জন্য পরীক্ষার কমান্ডটি ব্যবহৃত হয়েছিল:

ffmpeg -i "signed16bitPCM.wav" -c pcm_s16le -af "pan=stereo|FL=FC+0.30*FL+0.30*BL|FR=FC+0.30*FR+0.30*BR" "Audio 3 (Nightmode Dialogue Downmix).wav"

1
চিত্তাকর্ষক অন্তর্দৃষ্টি! এটি ভাগ করে নেওয়ার জন্য সময় দেওয়ার জন্য ধন্যবাদ। তবে আশ্চর্যের বিষয়, এটি -ac 2আমাকে একটি নিকৃষ্ট ফলাফল দিয়ে শুরু করেছিল, যা মূল পোস্টিংকে প্ররোচিত করেছিল। আমি এটি আবার চেষ্টা করব এবং যদি সম্ভব হয় তবে একটি 5.1 অংশ ভাগ করুন যা বিল্ট-ইন ডাউন-মিশ্রণের সাথে সন্তোষজনক ফলাফল দেয় না। এছাড়াও আপনি ট্রান্সকোডিং ছাড়াই ডাউন-মিক্স করতে পারবেন তা জেনে খুব সুন্দর!
forthrin

@ ফরথ্রিন মনে রাখবেন এনকোডিং এবং ট্রান্সকোডিং দুটি আলাদা জিনিস। ট্রান্সকোডিং এক কোডেক / এক্সটেনশান থেকে অন্যটিতে রূপান্তর করে এবং এনকোডিং একই কোডেক / এক্সটেনশনে রূপান্তর করে। আপনি ট্রান্সকোডিং ছাড়া স্ট্রিমে অন্য এফএফপিজেগ প্রভাবগুলি ডাউনমিক্স এবং প্রয়োগ করতে পারেন, তবে এনকোডিং ছাড়াই নয়। ac -2বিকল্প আমিও সব downmix সূত্রের সবচেয়ে নিকৃষ্ট ফলাফলের দিলেন, আমি মনে করি শুধু এই একটি ATSC মান এর সূত্রের ব্যর্থ হচ্ছে।
হাশিম

আমি এখন এটি চেষ্টা করেছিলাম। মনে হয় এটি ffmpeg -i 5.1.mp4 -ac 2 2.mp4কাজ করে, কিন্তু ffplay -i 5.1.mp4 -ac 2হয় না।
forthrin

9

এই ডাউনমিক্সটি ব্যবহার করে দেখুন:

-ac 2 -af "pan=stereo|FL=FC+0.30*FL+0.30*BL|FR=FC+0.30*FR+0.30*BR" 

যেমনটি ডুম 9 ফোরামে রবার্ট কলিয়ার দ্বারা প্রস্তাবিত


2
এই সমস্ত বিকল্পের অর্থ কী? আপনি যদি তাদের ব্যাখ্যা করেন, লোকেরা কেবল অনুলিপি-পেস্টিংয়ের পরিবর্তে আপনার উত্তরটি বিভিন্ন সমস্যা সমাধানে ব্যবহার করতে সক্ষম হবে।
ডেভিড রিচার্বি

2
@ ডেভিডরিচার্বি -ac = অডিও চ্যানেল (স্টেরিওর জন্য 2), -af = অডিও ফিল্টার
সিস্ট্রিয়ান

3
এটি 5.1 মুভিটির জন্য চেষ্টা করেছিলাম এবং কমপক্ষে আউটপুট স্টিরিও আমার কাছে পুরোপুরি সূক্ষ্ম বলে মনে হয়েছিল। স্পষ্ট কথোপকথন এবং অন্য কিছু অনুপস্থিত মনে হচ্ছে। ভিএলসি জ্ঞানযুক্ত কেউ যদি সেখানে ডিফল্ট 5.1 থেকে 2.0 ডাউনমিক্সে ঠিক কী করা যায় তা ভাগ করে নিতে পারে great
forthrin

2
@ ডেভিডরিচার্বি: অডিও ফিল্টার (-af) এর ভিতরে থাকা বিকল্পগুলি: এফএল = সামনের-বাম; বি এল = পিছনে বামে; এফসি = ফ্রন্ট-কেন্দ্র; এফ আর = ফ্রন্ট-ডান; বিআর = পিছনে-ডানে। গুণগুলি (<1) হ্রাস করতে বা (> 1) গুণিত চ্যানেলের ভলিউম হ্রাস করার জন্য ভাসমানগুলি লিনিয়ার ফ্যাক্টর। এফএল = এফসি + 0.30 * এফএল + 0.30 * বিএল ফ্রন্ট-বাম চ্যানেলটি ফ্রন্ট-সেন্টার চ্যানেলের সাথে সামনের-বামের 30% এবং পিছনে-বাম চ্যানেলের 30% সেট করছে।
kronenpj

1
এফডব্লিউআইডাব্লু: সংগীত এবং পরিবেষ্টনের শব্দের তুলনায় এই মিশ্রণটি ডায়ালগগুলি বেশ জোরে বলে আমি মনে করি। তারকের উত্তরে প্রদত্ত প্রযুক্তিগতভাবে আরও সঠিক মিশ্রণটি আমার কাছে অনেক বেশি আনন্দিত। সুতরাং আমি অনুমান করি যে আপনার জন্য সবচেয়ে ভাল কী কাজ করে তা চেষ্টা করে দেখতে পারেন, এটি পরিস্থিতির উপর নির্ভর করে।
jlh

3

সুতরাং, @ শ্যান হ্যারেলসনকে @ জোর্ডান হ্যারিসের উত্তর দিয়ে অন্য প্রশ্নের উত্তরটি যুক্ত করে - আলস্য মোড চালু করে - এখানে input_51.mkv(৫.১) কে output_stereo.mkv(স্টেরিও) রূপান্তর করতে হবে :

ffmpeg -i input_51.mkv -c:v copy \
    -ac 2 -af "pan=stereo|FL=FC+0.30*FL+0.30*BL|FR=FC+0.30*FR+0.30*BR" \
    output_stereo.mkv

-c:v copyঅংশ মানে যে ভিডিও স্ট্রিম স্পর্শ হচ্ছে না (আমি অনুমান বনাম ঈদেও বাড়িছাড়া odec সেটিংস হচ্ছে পুলিস IED)। এটি ছাড়া, এটি অনেক বেশি সময় লাগবে। সম্পূর্ণতার জন্য উপরের উত্তরটি থেকে কেবল পুনরাবৃত্তি করা, এর -ac 2অর্থ দুটি অডিও চ্যানেল এবং -afএকটি অডিও ফিল্টার নির্দিষ্ট করে।

কমান্ডটি কিছুটা দেখার পরে, আমি বুঝতে পারলাম যে এটি দুটি স্টেরিও চ্যানেল কীভাবে রচিত তা নির্ধারণ করছে; FL(সামনে বাম চ্যানেল) মূল থেকে নেওয়া হয় FC(সামনে কেন্দ্র) প্লাস 0.30*FL(সামনে বাম দিক থেকে 30%) প্লাস 0.30*BL(পেছনে বাঁ দিক থেকে 30%) ইত্যাদি।


এটি কি কেন্দ্রের চ্যানেলটিকে ধারাবাহিক এবং শ্রবণযোগ্য রাখবে?
ফ্রেডো

2

এটি এখন একটি পুরানো প্রশ্ন, তবে আমাকে সঠিক দিকে নির্দেশ করেছেন এবং আমার ফলাফলটি ভাগ করে নিতে চেয়েছিলেন:

-af "pan=stereo|FL=0.5*FC+0.707*FL+0.707*BL+0.5*LFE|FR=0.5*FC+0.707*FR+0.707*BR+0.5*LFE"

বাম এবং ডানদিকে FC এবং LFE অর্ধেক রেখে উভয় স্পিকার থেকে কার্যকর ভলিউম জন্য মোট 1 দেয়। .707 * সম্মুখ / পিছনে বাম / ডান ব্যবহার করে সেই চ্যানেলগুলিকে একটি ভাল স্তরে নামিয়ে আনে যাতে তারা কেন্দ্রকে পরাভূত করতে না পারে।


1

যদি -ac 2 বিকল্পটি আপনাকে একটি ভারসাম্যযুক্ত ডাউনমিক্স দেয় যেখানে সংগীত বা বক্তৃতা উভয়ই অন্য উপাদানগুলির তুলনায় খুব বেশি শোনাচ্ছে না, আপনার কেবলমাত্র এর সাথে ভলিউমটি বাড়ানো দরকার

-vol 512

আমি উদাহরণটিতে 512 ব্যবহার করেছি, যা শব্দটিকে আরও দ্বিগুণ করে তোলে। নিয়মটি হল 256 সমান 100%

মানটি দিয়ে খুব বেশি উপরে যাবেন না এবং মুভিটির সেই অংশগুলিতে বিস্ফোরণ বা জোরে শব্দ সহ ফলাফলগুলি নিশ্চিত করে দেখতে ভুলবেন না। একটি খুব উচ্চ মানের ব্যবহার করে বিকৃতি প্রবর্তন করা খুব সহজ।


1

-ac 2

ডাউনমিক্সে চ্যানেলগুলির ভলিউমটি ভাসমান পয়েন্ট কোডেক -> পিসিএম_ফ 32le, এ্যাকের সাথে অপরিবর্তিত

ডাউনমিক্সের ভলিউম (এলএফই ব্যতীত 5.1 থেকে 2.0) 1 / 2.5 = -7.96 ডিবি দ্বারা পূর্ণসংখ্যার কোডেক -> পিসিএম_স 16 লেল, লিবিফডি কে_এ্যাক দ্বারা হ্রাস পেয়েছে

চলচ্চিত্রগুলির একদিকে নির্দেশিত শব্দ রয়েছে, এবং সমস্ত চ্যানেলে কোনও সাউন্ড চাপ নেই। সুতরাং হ্রাস ডাউনমিক্স ভলিউমটি ভুল, সামান্য স্তরের সংক্ষেপণ সঠিক উপায়। ডলবি তা-ই করে।


0

এই পুরো পৃষ্ঠাটি এবং কিছু পরীক্ষা-নিরীক্ষা পড়ার পরে আমি "ডাউন_মিক্স" নামে এই স্ক্রিপ্টটি নিয়ে এসেছি:

#!/bin/bash -x

FL="0.5*FC + 0.707*FL + 0.707*BL + 0.5*LFE"
FR="0.5*FC + 0.707*FR + 0.707*BR + 0.5*LFE"
AUDIO_FMT="libopus"
CONTAINER="mkv"

ffmpeg -i "$1" -c:v copy -c:s copy \
    -c:a $AUDIO_FMT \
    -af "pan=stereo|FL=$FL|FR=$FR" \
    "${1%.*}"_dm.$CONTAINER

    # how to test a snippet of movie
    # -ss 41:07.0 -t 4 \

উপরের ভেরিয়েবলগুলি আপনার পছন্দ অনুসারে কৌতুক করুন। কম ভলিউম নিয়ে আমার কোনও সমস্যা নেই তাই এড়িয়ে গেল, তবে সহজেই যুক্ত হয়ে গেল।


0

আপনার টার্গেটের পিসিএম_এস 16 এনকোড হওয়া অবধি ffmpeg ফিল্টার "-ac 2" ঠিকঠাক কাজ করে। Wav ফর্ম্যাটে pcm_f32le এ এনকোড করার সময় ভলিউম 9 ডিবি এবং আরও অনেক কিছু বাড়ানো হয়। সুতরাং: এই জাতীয় ক্ষেত্রে "-ac 2" ফিল্টারটি ব্যবহার করবেন না।


কেন আয়তন বৃদ্ধি করা হয়? আপনি এই সম্পর্কে কোথায় শিখলেন?
forthrin

ধারণা নেই, কেন। তবে আমি খুব ঘন ঘন ffmpeg ব্যবহারকারী (এটি নিজেই সংকলন করছি)। যে কোনও 5.1 (সাইড) উত্সটি গ্রহণ করুন এবং এটিকে দু'বার "-ac 2" ব্যবহার করে একটি পিসিএম_ফ 16 লেভেল ওয়েভ ফাইলে একটি পিসি_স 16 লি আনডে রূপান্তর করুন। দুটি ওয়াভ ফাইলের শীর্ষ ভলিউমের তুলনা করুন এবং আপনি দেখতে পাবেন (এবং শুনবেন):
ফ্রাঙ্ক-মাইকেল ফিশার

উদাহরণস্বরূপ ffmpeg সংস্করণ N-93636-g6829c3c ব্যবহার করে এটি ঘটে
ফ্রাঙ্ক-মাইকেল ফিশার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.