ফ্রিকোয়েন্সি বজায় রেখে সংগীত প্লে করা কম করুন


10

ধীর গতিতে মিউজিক অডিওর টুকরো বাজানো এর পিচ (ফ্রিকোয়েন্সি) কমিয়ে দেবে। ফ্রিকোয়েন্সি একই রাখার সময় গানটি বাজানো ধীর করার জন্য কি কোনও সরঞ্জাম এবং তত্ত্ব আছে? আমি মনে করি যে কেউ উইন্ডোড ফুরিয়ার ট্রান্সফর্ম বা ওয়েভলেট ট্রান্সফর্ম করতে পারে। দেখে মনে হচ্ছে যে কোনও একটি উইন্ডো আকারের প্রাক-নির্বাচন করতে হবে বা গতিশীলভাবে ওয়েভলেট ভিত্তি নির্বাচন করতে হবে। এটি করার জন্য কি কোনও নির্দিষ্ট এবং বিস্তারিত তত্ত্ব এবং আবেদন রয়েছে?


1
নীচে সরবরাহ করা উত্তর ছাড়াও, আরও তথ্যের জন্য দয়া করে এই লিঙ্কটি দেখুন।
এ_এ

উত্তর:


5

হ্যাঁ আমাদের মধ্যে কেউ কেউ এটি করতে পারেন, আপনি পিচকে প্রভাবিত না করেই গতি বা গতি কমিয়ে দিতে পারেন, কিছু লোক টাইম স্ট্রেচের এই অ্যাপ্লিকেশনগুলি কল করে, এটি করার বিভিন্ন উপায় রয়েছে, আপনি ফ্রিকোয়েন্সি ডোমেন বা টাইম ডোমেইনে করতে পারেন, আপনার পছন্দ করতে হবে আপনার জন্য কি সর্বোত্তম, আপনি প্রত্যেকের কিছু সুবিধা এবং অসুবিধাগুলি পাবেন।

সময় ডোমেন:

টাইম ডোমেনে আপনি কয়েকটি কৌশল চেষ্টা করতে পারেন যেমন:

  • টিডিএইচএস (টাইম ডোমেন হারমনিক স্যাকালিং)
  • সোলা (সিনক্রোনাস ওভারল্যাপ অ্যাড)
  • PSOLA (পিচ সিঙ্ক্রোনাস ওভারল্যাপ অ্যাড)
  • ডাব্লুএসওলা (ওয়েভফর্মের সাদৃশ্য ওভারল্যাপ অ্যাড)

পেশাদাররা: দ্রুত, কিছু অ্যালগরিদমগুলি বোঝা সহজ, মনোফোনিক শব্দগুলিতে ভাল মানের।

কনস: সাধারণত সঠিক অবস্থানে বিচ্ছিন্ন হওয়ার জন্য আপনার খুব সুন্দর পিচ ট্র্যাকের দরকার হবে, এটি করা কঠিন :-(, তাই যদি আপনার পিচ ট্র্যাক ব্যর্থ হয় বা পলিফোনিক শব্দ না কাজ করে তবে এই অ্যালগরিদমগুলি প্রচুর গ্লিটস / আর্টিফিকেট দেবে আউটপুট শব্দে।

কম্পাঙ্ক এলাকা:

ফ্রিকোয়েন্সি ডোমেনে আমি জানি যে সর্বকালের প্রসারিত ফেজ ভোকার কৌশল অবলম্বন করে।

পেশাদাররা: পলিফোনিক বা মনোফোনিক শব্দগুলিতে কাজ করবে।

মতামত: সমস্ত গণিত বোঝার জন্য যন্ত্রণাদায়ক হতে পারে, বাস্তবায়ন কিছুটা শক্ত, সময়ের ডোমেন কোডগুলির মতো অতটা দ্রুত নয়, ভয়েসের জন্য আমি সময় ডোমেন ফলাফল পছন্দ করি, মানক পর্যায়ে ভোকারের ফলাফল উন্নত করার জন্য কিছু কৌশল ভাগ করা হয় না।

আমি বলতে পারি যে উইন্ডো এবং হপ আকারটি ফেজ ভোকার মানের জন্য অন্যতম একটি চাবিকাঠি, সাধারণত আমরা 4xপুনরায় সংশ্লেষণের জন্য ওভারল্যাপ বেছে নিই, আকারের একটি হান উইন্ডোটি 4096আমার কানের জন্য যথেষ্ট (অবশ্যই যদি আপনার এই আকারগুলির জন্য প্রসেসিং শক্তি থাকে) , এই ধরণের সমস্যা এড়াতে চেষ্টা করার জন্য স্ট্যান্ডার্ড ফেজ ভোক্ডার কিছু রিভারব্র্যান্ট এফিটেক্টস যুক্ত করতে পারে, আপনার সম্ভবত এই পর্যায়ে লক করা দরকার।

Datailed মধ্যে কটাক্ষপাত জন্য মিলার Puckette এবং Portnoff কাগজ


আপনার উত্তর করার জন্য আপনাকে ধন্যবাদ। পদ্ধতির সর্বাধিক নির্বুদ্ধিতে সমস্যাটি কী: ফুরিয়ার সিরিজে উইন্ডোজ না করে পুরো সময়ের ব্যবধানে একটি ফাংশন হিসাবে পুরোটির সময় সংকেতটি প্রসারিত করুন এবং একটি ধ্রুবক দ্বারা সমস্ত ফ্রিকোয়েন্সিগুলি গুন করুন। আমি বুঝতে পারি যে ডোমেনের কোনও স্থানীয় ত্রুটি সমস্ত ফুরিয়ার সহগকে প্রভাবিত করবে। তা বাদ দিয়ে, এই নিষ্পাপ অ-স্থানীয়করণ পদ্ধতির ক্ষতি কী?
হ্যান্স

আমি এর আগে কখনও কিছু চেষ্টা করিনি, এটি কাজ করতে পারে, সুস্পষ্ট সমস্যাটি হ'ল এটি বেশ ব্যয়বহুল হতে পারে, এটি অবশ্যই কোনও কার্যকর উপায় নয়, কল্পনা করুন যে আপনার কাছে 44100Hz তে নমুনাযুক্ত অডিও (1 মিনিট) রয়েছে, এখন থেকে আপনি কী প্রস্তাব করছেন তোমার দিকে ফুরিয়ার আবেদন করতে হবে না 44100 * 60 = 2646000, তাই প্রক্রিয়াকরণের যেমন রিয়েল-টাইম যে কোনো প্রয়াস করতে ভুলবেন একবার এবং প্রক্রিয়া এ পয়েন্ট এই ,
ederwander

1
আমি মনে করি না যে আমি আগে যা বলেছিলাম তা খাঁটি গাণিতিক অর্থে কাজ করবে (ব্যয় এবং ত্রুটির সংবেদনশীলতা উপেক্ষা করে)।
হ্যান্স

3

আপনি যে সরঞ্জাম / তত্ত্বটি বর্ণনা করেছেন তা সঙ্গীত প্রযুক্তির গবেষণার একটি বৃহত ক্ষেত্র, যাকে সাধারণত অডিও টাইম-স্কেল পরিবর্তন বলা হয়। এই ক্ষেত্রের একটি বৃহত উপাদান হ'ল আপনি কীভাবে সময় প্রসারিত হওয়ার পরে ফ্রিকোয়েন্সিটিতে শ্রবণযোগ্য পরিবর্তনগুলি রোধ করতে পারেন। আপনার অ্যাপ্লিকেশনটির সীমাবদ্ধতা বা লক্ষ্যগুলির উপর নির্ভর করে এটি উভয় ফ্রিকোয়েন্সি এবং সময়-ডোমেন পদ্ধতির সাথে যোগাযোগ করা যেতে পারে। অডিও টাইম-স্কেল / পিচ পরিবর্তনের জন্য উইকিপিডিয়া এন্ট্রি একটি ভাল শুরুর পয়েন্ট।

আপনি যদি ফ্রিকোয়েন্সি / ওয়েভলেট ভিত্তি ব্যবহার করে কোনও পদ্ধতির অনুসরণ করতে আগ্রহী হন তবে আপনার উইন্ডো-আকার এবং ভিত্তির পছন্দটি আপনি সংকেতকে স্থানীয়করণ করতে কতটা ভাল সক্ষম তা প্রভাবিত করবে। উদাহরণ হিসাবে এসটিএফটি ব্যবহার করতে, একটি দীর্ঘ উইন্ডো স্থির সাইনোসয়েডগুলির জন্য ভাল সঞ্চালন করবে তবে আপনার স্থানান্তরগুলি ধ্বংস করবে। একটি সংক্ষিপ্ত উইন্ডো ফ্রিকোয়েন্সি-ডোমেন স্থানীয়করণের ব্যয়ে একটি পছন্দনীয় ক্ষণস্থায়ী প্রতিক্রিয়া সরবরাহ করবে। অন্যান্য ওয়েভলেট ঘাঁটির পারফরম্যান্স ভিত্তিতে আপনার সিগন্যালের প্রক্ষেপণের প্রকৃতির উপর নির্ভর করবে।


উত্তরের জন্য আপনাকে অনেক ধন্যবাদ। এই সমস্যার তরঙ্গলেটের প্রয়োগ সম্পর্কে আপনার কি কোনও রেফারেন্স রয়েছে?
হ্যান্স

ইডারওন্ডারের জবাবের নীচে আমার মন্তব্যটি দেখুন। ধন্যবাদ।
হ্যান্স

2

নীচে স্টিফান এম বার্ন্সির সি ++ (এসএমবিপিচশিফট.সিপি) -র একটি সাধারণ এবং মূল্যবান টিউটোরিয়াল ফাংশনের লিঙ্ক রয়েছে, যা পিচটি পরিবর্তন না করেই গতি স্লো-ডাউন বা গতি বাড়িয়ে তুলতে পারে।

তিনি এই কোডটি ওয়াইড ওপেন লাইসেন্স (ডাব্লুএল) এর অধীনে প্রকাশ করেছেন। আমার অ্যাপ্লিকেশনটির মধ্যেই আমি তাঁর ফাংশনটিকে রিয়েল-টাইমে গতিতে ডাউন-ডাউন সংগীতের সাথে অভিযোজিত করতে সক্ষম হয়েছি - এটি একটি এমপি 3 ফাইল বাজানোর সময় এবং একই সময়ে সেই এমপি 3 সিগন্যালের উপরে পিচ সনাক্তকরণ করার সময়।

আমি বার্নির ওয়েবসাইটের একটি লিঙ্কও অন্তর্ভুক্ত করেছি যাতে গানের মতো অডিও সংকেতের টাইম-স্ট্রেচিং এবং পিচ-শিফটিং সম্পর্কিত তাঁর বিশদ বিবরণ রয়েছে।

https://github.com/AndyA/BatPhone/blob/master/pitchshift.c

http://blogs.zynaptiq.com/bernsee/time-pitch-overview/


আসল কোড প্রযোজ্য নয় time stretch, মূল কোডটি প্রযোজ্য , এক্ষেত্রে Pitch Shiftটাইম স্কেল সংশোধন করার জন্য আপনাকে একত্রিত করতে হবে Pitch Shifit + Resample (interpolation), বার্নির কোডটি আকারের একটি উইন্ডো ব্যবহার করে ভালভাবে কাজ করে 4096আপনি একটি অষ্টকটি শিফট করতে সক্ষম হবেন (উপরে বা নীচে) এর অর্থ হল যে সেই অনুযায়ী আপনি কেবল 2.0x-0.5x এর মধ্যে একটি গুণমানের সাহায্যে ভাল মানের সাথে টাইম স্কেল তৈরি করতে সক্ষম হবেন, ভালভাবে নির্মিত একটি ফেজ ভোক্ডার একই উইন্ডোর আকার ব্যবহার করে আরও ভাল ফলাফল অর্জন করতে পারবেন এবং আপনি এগুলি বহির্ভূত করতে সক্ষম হবেন উন্নত মানের সাথে উপাদানগুলি
ইডারওয়ান্ডার

ওফস, এখন মনে আছে যে সময়-প্রসারটি সম্পূর্ণ করতে আমাকে পুনরায় স্যাম্পলিং প্রয়োগ করতে হয়েছিল, যাতে মূল পিচটি পরিবর্তন না হয়। দেখে মনে হচ্ছে গিটহাবের সংস্করণটি সংযুক্ত সংস্করণ থেকে বার্নসি তার কোডে কিছু পরিবর্তন তৈরি করেছে। তার নতুন কোডটি তার ওয়েবসাইট থেকে ডাউনলোডের জন্য উপলভ্য - এটি তার মূল স্পেসিফিকেশন থেকে স্থানান্তরিত করার পরিধি বাড়িয়ে তুলতে পারে। আমি তার আসল কোডটি টুইট করেছিলাম যাতে আমি 8x দিয়ে শিফট করতে পারি।
জেমস পল মিলার্ড

আপনার কোড এবং বার্নসি পৃষ্ঠার মধ্যে কোনও পার্থক্য নেই, মূল গণিতটি এখনও একইরকম, আমি যে দৃ difference় পার্থক্যটি দেখতে পাচ্ছি তা হল উইন্ডোর আকার = 8192ডাউনলোড পৃষ্ঠা থেকে কোডগুলিতে, সুতরাং আপনাকে প্রসেসিংয়ে আরও 4x পয়েন্ট করতে হবে? , আমি ফিরে এসে বলেছি যে অর্ধেক উইন্ডো আকারের সাথে 8192/2=4096আপনি ফেজ ভোকারের কিছু গোপনীয়তা ব্যবহার করে একই কাজ করতে পারেন, এখানে মূল বিষয়টি হ'ল আপনি খুব কম প্রক্রিয়াজাতকরণের সাথে মানটি রাখতে পারেন।
ইডারওয়ান্ডার

যদিও আমি ব্যাটফোনে গিটহাব লিঙ্কটি সরবরাহ করেছি, এটি আমার কোড নয়। আমি এসএমবিপিচশিফ্ট () দেখার জন্য এটি একটি ইন্টারনেট অনুসন্ধান থেকে সরিয়েছি। আমার কোড বার্নির সংস্করণ থেকে অনেক বেশি পরিবর্তিত হয়েছে, এবং এই ফাইলে স্থান পেয়েছে
জেমস পল মিলার্ড

হ্যাঁ, এখন আমি দেখতে পাচ্ছি, এটি সত্যিই একটি প্রতিদ্বন্দ্বী, আপনি আমার পর্বের ভোদারকে কার্যক্রমে দেখতে / শুনতে আগ্রহী হতে পারেন ।
ইডারওয়ান্ডার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.