ফুরিয়ার রুপান্তর সাধারণভাবে শব্দ ফ্রিকোয়েন্সি বিশ্লেষণের জন্য ব্যবহার করা হয়। যাইহোক, শব্দের মানুষের উপলব্ধি বিশ্লেষণের ক্ষেত্রে এটির কিছু অসুবিধা রয়েছে। উদাহরণস্বরূপ, এর ফ্রিকোয়েন্সি বিনগুলি রৈখিক হয়, যেখানে মানব কান লাইনারি নয়, ফ্রিকোয়েন্সি লোগারিথে জবাব দেয় ।
ওয়েভলেট রূপান্তরগুলি বিভিন্ন ফ্রিকোয়েন্সি রেঞ্জের রেজোলিউশনকে ফুরিয়ার ট্রান্সফর্মের বিপরীতে পরিবর্তিত করতে পারে। রুপান্তর ক্ষুদ্র তরঙ্গ সম্পত্তিসমূহ যখন উচ্চতর ফ্রিকোয়েন্সি জন্য ছোট সময়গত প্রস্থ বজায় রাখার নিম্ন ফ্রিকোয়েন্সি জন্য বড় সময়গত সমর্থন অনুমতি দেয়।
Morlet ক্ষুদ্র তরঙ্গ ঘনিষ্ঠভাবে শুনানির মানুষের উপলব্ধি সাথে সম্পর্কিত হয়। এটি সঙ্গীত ট্রান্সক্রিপশনটিতে প্রয়োগ করা যেতে পারে এবং খুব সঠিক ফলাফল উত্পাদন করে যা ফুরিয়ার ট্রান্সফর্ম কৌশল ব্যবহার করে সম্ভব নয়। এটি প্রতিটি নোটের সুস্পষ্ট শুরু এবং শেষ সময়ের সাথে সংগীত নোটগুলির পুনরাবৃত্তি এবং বিকল্পের সংক্ষিপ্ত বিস্ফোরণ ক্যাপচারে সক্ষম।
নির্দিষ্ট-প্রশ্ন রুপান্তর (ঘনিষ্ঠভাবে Morlet এর সাথে সম্পর্কিত রুপান্তর ক্ষুদ্র তরঙ্গ) হয় ভাল বাদ্যযন্ত্র ডেটাতে উপযুক্ত । যেহেতু রূপান্তরটির আউটপুট কার্যকরভাবে লগ ফ্রিক্যোয়েন্সি বিরুদ্ধে প্রশস্ততা / পর্ব হয়, নির্দিষ্ট বর্ণনাকে কার্যকরভাবে আবরণ করার জন্য কম বর্ণালি বিনের প্রয়োজন হয় এবং যখন ফ্রিকোয়েন্সিগুলি বেশ কয়েকটি অক্টাভ বিস্তৃত হয় তখন এটি কার্যকর প্রমাণিত হয়।
রূপান্তরটি উচ্চতর ফ্রিকোয়েন্সি বিনগুলির সাথে ফ্রিকোয়েন্সি রেজোলিউশন হ্রাস প্রদর্শন করে যা শ্রুতি অ্যাপ্লিকেশনগুলির জন্য কাম্য। এটি মানব শ্রুতি সিস্টেমের আয়না দেয়, যার মাধ্যমে নিম্ন-ফ্রিকোয়েন্সিগুলিতে বর্ণালী রেজোলিউশন ভাল হয়, তবে অস্থায়ী রেজোলিউশন উচ্চ ফ্রিকোয়েন্সিতে উন্নত হয়।
আমার প্রশ্নটি হ'ল: এমন কি এমন কিছু রূপান্তর আছে যা মানব শ্রুতি সিস্টেমকে ঘনিষ্ঠভাবে নকল করে? কেউ কি এমন রূপান্তর ডিজাইন করার চেষ্টা করেছেন যা শারীরিকভাবে / নিউরোলজিকভাবে মানুষের শ্রুতি পদ্ধতির সাথে যতটা সম্ভব ঘনিষ্ঠভাবে মিলছে?
উদাহরণস্বরূপ, এটি জানা যায় যে মানুষের কানের শব্দ তীব্রতার জন্য লোগারিথমিক প্রতিক্রিয়া রয়েছে । এটি আরও জানা যায় যে সমান উচ্চতা সংকীর্ণতা কেবল তীব্রতার সাথেই নয় , বর্ণালি উপাদানগুলির ফ্রিকোয়েন্সি ব্যবধানের সাথেও পৃথক হয় । অনেকগুলি সমালোচনামূলক ব্যান্ডগুলিতে বর্ণালী উপাদানযুক্ত শব্দগুলি মোট শব্দচাপ স্থির থাকলেও জোরে হিসাবে বিবেচিত হয়।
অবশেষে, মানুষের কানের একটি ফ্রিকোয়েন্সি-নির্ভর সীমিত টেম্পোরাল রেজোলিউশন রয়েছে । সম্ভবত এটিও বিবেচনায় নেওয়া যেতে পারে।