একটি ভোকোডার প্রোগ্রামিং


11

আমি আমার নিজের ভোকडर সিনথেসাইজারকে "সানগাইফাই" এর মতো প্রোগ্রাম করতে চাই তবে আমি কোনও ভোকাডার অ্যালগোরিদম খুঁজে পাই না। ভোক্ডার কীভাবে কাজ করে সে সম্পর্কিত তথ্যের সন্ধান করতে বা আপনি কোথায় তা ব্যাখ্যা করতে বা বলতে পারেন।


3
ইউডো জালজার এট আল- দ্বারা ডিএএফএক্সের কিছু ম্যাটল্যাব কোড সহ একটি সাধারণ পর্বের ভোদার রয়েছে।
ফোনন

1
মেলোডাইফাই এসডিকে চেক করুন , এটি একই কাজ করে এবং ডেমো ট্রায়াল উপলব্ধ।
দানিজেল

উত্তর:


18

আমি আশঙ্কা করছি যে এখানে সমস্ত উত্তর প্রশ্নের সাথে সম্পর্কিত নয়। সংগীত প্রযোজনা বিশ্বে কণ্ঠশিল্পী যাকে বলা হয় তার সিগন্যাল প্রসেসিংয়ে ব্যবহৃত ফেজ ভোক্ডারের সাথে খুব একটা সম্পর্ক নেই । বিষয়টিকে আরও খারাপ করে দেওয়ার জন্য মূল পোস্ট দ্বারা উল্লিখিত সংঘিফাই অ্যাপটি ভোক্ডারের উদাহরণ নয়। আসুন আমরা এটিকে বাছাই করি!

1. পর্যায়ের ভোদার

ফেজ vocoder অন্যান্য উত্তর দ্বারা সমর্থিত, সিগন্যাল একটি সময়-ফ্রিকোয়েন্সি প্রতিনিধিত্ব কম্পিউটিং দ্বারা একটি সংকেত প্রক্রিয়াজাতকরণ পন্থা যা সংকেত (সময়-stretching, পিচ-নাড়াচাড়া) এর সময় / পিচ পরিবর্তন সম্পাদন করতে ব্যবহার করা যেতে পারে (স্বল্পমেয়াদী ফুরিয়ার ট্রান্সফর্ম , বা এসটিএফটি) এবং তারপরে সিগন্যাল ফ্রেমগুলি সন্নিবেশ / অপসারণ এবং তারপরে পর্যায়ের তথ্যের সুসংহততা বজায় রাখা। ভয়েসের সাথে এর সম্পর্কটি কেবল historicalতিহাসিক এবং এটি বর্তমানে নিম্ন-প্রান্তের অডিও হার্ডওয়্যার / সফ্টওয়্যারটিতে পিচ-শিফটিং এবং সময়-প্রসারের জন্য ব্যবহৃত হয়। রাবারব্যান্ড ওপেন-সোর্স সি ++ সময় / পিচ পরিবর্তন লাইব্রেরির একটি উদাহরণ যা কোনও ফেজ-ভোডারের উপর ভিত্তি করে।

2. ভোকোডার

সংগীত উত্পাদনের ক্ষেত্রের লোকেরা যখন ভোকোডারকে নির্দেশ করে তখন তারা একটি সিগন্যালের বর্ণালী খামটি বের করার একটি ডিভাইস (সাধারণত ভয়েস, যাকে মডিউলেটার বলা হয়) এবং অন্যান্য সংকেত (সাধারণত সমৃদ্ধ সিন্থ টেক্সচার, যাকে ক্যারিয়ার বলা হয়) ফিল্টার করে এমন ফিল্টার সহ যার প্রতিক্রিয়াটি নিষ্কাশিত বর্ণালী খাম। ফলস্বরূপ শব্দের উদাহরণের জন্য, কয়েক প্রথম সেকেন্ড থেকে ক্র্যাফটর্ক ট্রান্স ইউরোপ এক্সপ্রেসে 0: 23 বা অ্যালান পারসনস প্রকল্প দ্য রেভেন শুনুন । ফলস্বরূপ প্রভাবটি হ'ল কণ্ঠস্বর মতো কাঠখেলা যা ক্যারিয়ার সিগন্যালের মাধ্যমে বাজানো সুর বা তীরগুলিতে প্রয়োগ করা হয়, এই অনুভূতি প্রদান করে যে একটি সংশ্লেষকের মাধ্যমে একটি ভয়েস কথিত।

ভোক্ডারটি মূলত একটি অ্যানালগ ডিভাইস হওয়ায় এটি উচ্চতর Q এর সাথে একটি ডজন বা আরও বেশি ব্যান্ডপাস ফিল্টারগুলির দুটি ব্যাঙ্কের সাথে প্রয়োগ করা হয়েছিল mod প্রথমটি ফিল্টার ব্যাঙ্কের মাধ্যমে মডারেটর সিগন্যাল প্রেরণ করা হয় এবং সমস্ত উপ-ব্যান্ড সংকেতগুলির প্রশস্ততা ট্র্যাক করা হয় খাম অনুসরণকারীদের অ্যারে। সমান্তরালভাবে, ক্যারিয়ার সংকেত অন্য ফিল্টার ব্যাঙ্কের মাধ্যমে প্রেরণ করা হয়। খামের অনুসারীদের দেওয়া লাভের সাথে প্রতিটি উপ-ব্যান্ডটি প্রশস্ত করা হয় (একটি ভিসিএ সহ)। আপনি যদি অ্যানালগটি পড়েন তবে জুরজেন হাইবলের জীবিত ভোকোডার থেকে আপনি এখানে একটি ভোকার চ্যানেলের স্কিম্যাটিক্সটি দেখতে পারেন- শীর্ষে মডুলেটর সিগন্যাল ফিল্টার, নীচে ক্যারিয়ার ফিল্টার এবং ভিসিএ। কণ্ঠশিল্পীদের সফ্টওয়্যার বাস্তবায়নগুলি এটার কাছাকাছি থাকে, কেবল কারণ সঙ্গীত নির্মাতারা ভোকারদের ক্লাসিক অ্যানালগ ডিভাইসের মতো শোনার প্রত্যাশা করেন! তবে আপনি যদি "মদ" ডিভাইসগুলির প্রতি বিশ্বস্ততা না চান এবং 40 বিউক্যাডের চেয়ে কম সস্তা কিছু চান, একই ফলাফলটি অর্জনের অন্য উপায়টি হ'ল একটি মেরু ফিল্টারটি নির্ধারণ করা (আপনি কতটা কাছাকাছি চান তার উপর নির্ভর করে 8 থেকে 20 আদেশের) মূল কণ্ঠে পৌঁছানোর জন্য) মডিটর সংকেত (এআর-মডেলিং) থেকে; এবং তারপরে এই ফিল্টারটি ক্যারিয়ারে প্রয়োগ করুন। এখানে সাধারণ সমস্যাটি হ'ল আপনাকে প্রতি 20 মিমি ফ্রেমে আপনার ফিল্টার সহগকে আপডেট করতে হবে; সুতরাং আপনার অল-পোল ফিল্টারের একটি উপস্থাপনা দরকার যা হঠাৎ সহকারী আপডেটগুলি হ্যান্ডল করে।

৩. অটো-টিউন এবং পিচ-রিম্যাপিং

সানগাইফ যা করেন তা নিম্নলিখিত: রেকর্ডকৃত ভয়েসের প্রোসোডি (পিচ কনট্যুর) এক্সট্র্যাক্ট করুন এবং এটিকে এমন পরিবর্তন করুন যাতে ফলাফল পিচ কনট্যুর একটি লক্ষ্য সুরের সাথে মেলে। এটি অটো-টিউনের সাথে কিছুটা মিল, পার্থক্যের সাথে যে অটো-টিউনটি নিকটতম সংগীতের যথাযথ সেমিটোনটির দিকে পিচটি "রাউন্ড" করে, যখন সানগাইফ কেবল এটি একটি লক্ষ্য মানকে ঠেলে দেয়।

এখানে কাজের অ্যালগরিদমগুলি গতানুগতিক পিচ-শিফটিং সময়-প্রসারক থেকে খুব আলাদা, কারণ ভয়েস সংকেত মনোফোনিক এবং উত্স-ফিল্টার মডেলটির সাথে ফিট করে। টাইম-ডোমেন পিচ-সিঙ্ক্রোনাস-ওভারল্যাপ-অ্যাড (টিডি-পিএসওলা) এর মতো জেনেরিক সময়-প্রসারিত অ্যালগরিদমের তুলনায় স্বচ্ছভাবে ভয়েসের পিচ পরিবর্তন করার জন্য (সাধারণত ফেজ-ভোকার্স দিয়ে করা )। এগুলি বাক্য সংশ্লেষণে উদাহরণস্বরূপ কোনও সংশ্লেষযুক্ত বাক্যটির অনুমানকে পরিবর্তনের জন্য ব্যবহার করা হয় - সানগাইফের প্রকৃত পক্ষে নয়! অটো-টিউনও এ জাতীয় সময়-ডোমেন পদ্ধতিগুলির উপর ভিত্তি করে (ইনপুট তরঙ্গরূপের পূর্ণ চক্র সনাক্তকরণ এবং সেগুলি পুনরায় মডেলিং)।

PSOLA চিত্র



2

ম্যাথওয়ার্কসের সিউডো-কোডের একটি লিঙ্ক এখানে

ডিএসপি ডাইমেনশনে আলগোরিটমের বিবরণ এখানে একটি লিঙ্ক।

একটি এফএফটি বিনের একটি কেন্দ্রের ফ্রিকোয়েন্সি থাকে। সঠিক বিনা ফ্রিকোয়েন্সিটিতে যে কোনও সাইনোসয়েড একই রেফারেন্স সহ ২ টি রেফারেন্স পয়েন্ট রেফারেন্স সহ একই ফেজটি ঠিক 1 এফএফটি ফ্রেম আলাদা করে রাখবে, বা একটি ডেল্টা ফেজ থাকবে যা 2 রেফারেন্স পয়েন্ট বা 2 এফএফটি ফ্রেমের জন্য কিছু নির্বিচার দূরত্ব পৃথক করে (সম্ভবত ওভারল্যাপিং) গণনা করা যেতে পারে । একটি ফেজ ভোকারের প্রাথমিক ধারণাটি প্রতিটি এফএফটি বিন ফ্রিক্যোয়েন্সিটি কাছাকাছি একটি ফ্রিকোয়েন্সিতে সামান্য সামঞ্জস্য করা হয় যাতে এফএফটি বিন কেন্দ্রের ফ্রিকোয়েন্সিগুলি না করে, যদি এই ফ্রিকোয়েন্সিতে একটি সাইনোসয়েড সনাক্ত করা ধাপটি 2 অফসেট এফএফটি ফ্রেমের রেফারেন্স পয়েন্টগুলিতে মেলে।

এই সামঞ্জস্য করা ফ্রিকোয়েন্সিগুলি তখন ওয়েভফর্মের গ্রানুলার সংশ্লেষণের জন্য ব্যবহার করা যেতে পারে যা পুনরায় সংশ্লেষিত ফ্রেমগুলিতে আরও ধারাবাহিকতা প্রদর্শন করে, এমনকি বর্ণালীগুলির মূল ক্রমটি ফ্রিকোয়েন্সি বা সময় ডোমেনগুলিতে স্কেল করা হলেও। এই অফসেট ফ্রিকোয়েন্সিগুলি ফ্রিকোয়েন্সি অনুমানের জন্য বা পিচ অনুমান পদ্ধতির অংশ হিসাবেও ব্যবহার করা যেতে পারে। পিচ অনুমানের পাশাপাশি শব্দ পুনঃসংশোধনের সাহায্যে অন্য একটি পিচ বাদে যে কোনও একটি পিচ থেকে শব্দ নিতে এবং একটি পুনঃসংশোধনকে প্রায় একই রকমের শব্দটিকে ধাক্কা দিতে সক্ষম হতে পারে।


2

নিম্নলিখিত নিবন্ধে স্বল্প সময়ের ফুরিয়ার ট্রান্সফর্ম (এসটিএফটি) ভিত্তিক ফেজ ভোক্ডারের পাশাপাশি সময় এবং অডিও সিগন্যালের পিচ পরিবর্তনগুলি মোকাবেলায় একটি পিচ সিঙ্ক্রোনাস ওভারল্যাপ-অ্যাড (পিএসওএলএ) কৌশল বর্ণনা করা হয়েছে:

মৌলাইনস, ই। এবং লরোচে, জে।
" স্পিচ যোগাযোগ, ১৯৯৫. " পিচ-স্কেল এবং সময়-মাপের ভাষণের পরিবর্তনের জন্য অ-প্যারাম্যাট্রিক কৌশলগুলি " ( গুগল স্কলারের লিঙ্কগুলিতে কিছু পিডিএফ সংস্করণ উপলভ্য )

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.