মানব শ্রুতি সিস্টেমকে সবচেয়ে ঘনিষ্ঠভাবে নকল করে কোনটি?


12

ফুরিয়ার রুপান্তর সাধারণভাবে শব্দ ফ্রিকোয়েন্সি বিশ্লেষণের জন্য ব্যবহার করা হয়। যাইহোক, শব্দের মানুষের উপলব্ধি বিশ্লেষণের ক্ষেত্রে এটির কিছু অসুবিধা রয়েছে। উদাহরণস্বরূপ, এর ফ্রিকোয়েন্সি বিনগুলি রৈখিক হয়, যেখানে মানব কান লাইনারি নয়, ফ্রিকোয়েন্সি লোগারিথে জবাব দেয়

ওয়েভলেট রূপান্তরগুলি বিভিন্ন ফ্রিকোয়েন্সি রেঞ্জের রেজোলিউশনকে ফুরিয়ার ট্রান্সফর্মের বিপরীতে পরিবর্তিত করতে পারে। রুপান্তর ক্ষুদ্র তরঙ্গ সম্পত্তিসমূহ যখন উচ্চতর ফ্রিকোয়েন্সি জন্য ছোট সময়গত প্রস্থ বজায় রাখার নিম্ন ফ্রিকোয়েন্সি জন্য বড় সময়গত সমর্থন অনুমতি দেয়।

Morlet ক্ষুদ্র তরঙ্গ ঘনিষ্ঠভাবে শুনানির মানুষের উপলব্ধি সাথে সম্পর্কিত হয়। এটি সঙ্গীত ট্রান্সক্রিপশনটিতে প্রয়োগ করা যেতে পারে এবং খুব সঠিক ফলাফল উত্পাদন করে যা ফুরিয়ার ট্রান্সফর্ম কৌশল ব্যবহার করে সম্ভব নয়। এটি প্রতিটি নোটের সুস্পষ্ট শুরু এবং শেষ সময়ের সাথে সংগীত নোটগুলির পুনরাবৃত্তি এবং বিকল্পের সংক্ষিপ্ত বিস্ফোরণ ক্যাপচারে সক্ষম।

নির্দিষ্ট-প্রশ্ন রুপান্তর (ঘনিষ্ঠভাবে Morlet এর সাথে সম্পর্কিত রুপান্তর ক্ষুদ্র তরঙ্গ) হয় ভাল বাদ্যযন্ত্র ডেটাতে উপযুক্ত । যেহেতু রূপান্তরটির আউটপুট কার্যকরভাবে লগ ফ্রিক্যোয়েন্সি বিরুদ্ধে প্রশস্ততা / পর্ব হয়, নির্দিষ্ট বর্ণনাকে কার্যকরভাবে আবরণ করার জন্য কম বর্ণালি বিনের প্রয়োজন হয় এবং যখন ফ্রিকোয়েন্সিগুলি বেশ কয়েকটি অক্টাভ বিস্তৃত হয় তখন এটি কার্যকর প্রমাণিত হয়।

রূপান্তরটি উচ্চতর ফ্রিকোয়েন্সি বিনগুলির সাথে ফ্রিকোয়েন্সি রেজোলিউশন হ্রাস প্রদর্শন করে যা শ্রুতি অ্যাপ্লিকেশনগুলির জন্য কাম্য। এটি মানব শ্রুতি সিস্টেমের আয়না দেয়, যার মাধ্যমে নিম্ন-ফ্রিকোয়েন্সিগুলিতে বর্ণালী রেজোলিউশন ভাল হয়, তবে অস্থায়ী রেজোলিউশন উচ্চ ফ্রিকোয়েন্সিতে উন্নত হয়।

আমার প্রশ্নটি হ'ল: এমন কি এমন কিছু রূপান্তর আছে যা মানব শ্রুতি সিস্টেমকে ঘনিষ্ঠভাবে নকল করে? কেউ কি এমন রূপান্তর ডিজাইন করার চেষ্টা করেছেন যা শারীরিকভাবে / নিউরোলজিকভাবে মানুষের শ্রুতি পদ্ধতির সাথে যতটা সম্ভব ঘনিষ্ঠভাবে মিলছে?

উদাহরণস্বরূপ, এটি জানা যায় যে মানুষের কানের শব্দ তীব্রতার জন্য লোগারিথমিক প্রতিক্রিয়া রয়েছে । এটি আরও জানা যায় যে সমান উচ্চতা সংকীর্ণতা কেবল তীব্রতার সাথেই নয় , বর্ণালি উপাদানগুলির ফ্রিকোয়েন্সি ব্যবধানের সাথেও পৃথক হয় । অনেকগুলি সমালোচনামূলক ব্যান্ডগুলিতে বর্ণালী উপাদানযুক্ত শব্দগুলি মোট শব্দচাপ স্থির থাকলেও জোরে হিসাবে বিবেচিত হয়।

অবশেষে, মানুষের কানের একটি ফ্রিকোয়েন্সি-নির্ভর সীমিত টেম্পোরাল রেজোলিউশন রয়েছে । সম্ভবত এটিও বিবেচনায় নেওয়া যেতে পারে।


আপনি কি "রূপান্তর" এর উপর কোনও গাণিতিক বিধিনিষেধ আরোপ করেন?
অলি নিমিত্তালো

2
সব লিঙ্কের জন্য কুডোস!
গিলস

কোনও একক রূপান্তর মানব শ্রুতি সিস্টেমের মতো জটিল হিসাবে কোনও সিস্টেমকে পর্যাপ্ত পরিমাণে অনুকরণ করতে পারে না। বিদ্যমান এইচএস মডেলগুলি জটিল সিগন্যাল প্রসেসিং আর্কিটেকচার এবং একাধিক রূপান্তরকে প্রতিটি মডেলিংয়ের শুনানির অন্য দিকটি ব্যবহার করে। আপনি কি টুকরো টুকরো করে মডেলিং বিবেচনা করতে চান।
ফ্যাট 32

উত্তর:


9

এই ধরনের রূপান্তরগুলি ডিজাইনের ক্ষেত্রে প্রতিযোগী আগ্রহগুলি বিবেচনায় নেওয়া উচিত:

  • অ-রৈখিক এমনকি বিশৃঙ্খলাযুক্ত দিকগুলি সহ মানব শ্রুতি সিস্টেমের (যা লোকের সাথে পরিবর্তিত হয়) বিশ্বস্ততা (টিনিটাস)
  • বিশ্লেষণ অংশের জন্য গাণিতিক গঠনের স্বাচ্ছন্দ্য
  • এটিকে বিযুক্ত করার বা দ্রুত প্রয়োগের অনুমতি দেওয়ার সম্ভাবনা
  • একটি উপযুক্ত স্থিতিশীল বিপরীত অস্তিত্ব

দুটি রিটেন্ট ডিজাইন সম্প্রতি আমার কান ধরেছে : শ্রুতি-অনুপ্রাণিত গ্যাম্যাটোন ওয়েভলেট রূপান্তর , সিগন্যাল প্রসেসিং, ২০১৪

অবিচ্ছিন্ন ওয়েভলেট ট্রান্সফর্ম (সিডাব্লুটি) ভাল সময় এবং ফ্রিকোয়েন্সি স্থানীয়করণ সরবরাহের দক্ষতা এটিকে সময়ের একটি জনপ্রিয় হাতিয়ার হিসাবে তৈরি করেছে sign সংকেতগুলির ফ্রিকোয়েন্সি বিশ্লেষণ। ওয়েভলেটগুলি ধ্রুবক-কিউ সম্পত্তি প্রদর্শন করে যা পেরিফেরিয়াল অডিটরি সিস্টেমটিতে বেসিলার মেমব্রেন ফিল্টারগুলির দ্বারাও ধারণ করে। বেসিলার ঝিল্লি ফিল্টার বা শ্রুতি ফিল্টারগুলি প্রায়শই গ্যাম্যাটোন ফাংশন দ্বারা মডেল করা হয়, যা পরীক্ষামূলকভাবে নির্ধারিত প্রতিক্রিয়াগুলির জন্য একটি ভাল আনুমানিকতা সরবরাহ করে। এই ফিল্টারগুলি থেকে প্রাপ্ত ফিল্টারব্যাঙ্ককে গ্যাম্যাটোন ফিল্টারব্যাঙ্ক হিসাবে উল্লেখ করা হয়। সাধারণভাবে ওয়েভলেট বিশ্লেষণকে ফিল্টারব্যাঙ্ক বিশ্লেষণের সাথে তুলনা করা যেতে পারে এবং তাই স্ট্যান্ডার্ড ওয়েভলেট বিশ্লেষণ এবং গ্যাম্যাটোন ফিল্টারব্যাঙ্কের মধ্যে আকর্ষণীয় লিঙ্ক। যাইহোক, গ্যাম্যাটোন ফাংশনটি তরঙ্গলেটের হিসাবে যথাযথভাবে যোগ্যতা অর্জন করে না কারণ এর গড় গড় শূন্য নয়। গ্যামাটোন ফাংশনগুলির বাইরে কীভাবে উত্সাহ তরঙ্গমালা তৈরি করা যায় তা আমরা দেখাই। আমরা গ্রহণযোগ্যতা, টাইম-ব্যান্ডউইথ পণ্য, বিলুপ্ত হওয়া মুহুর্তের মতো বৈশিষ্ট্যগুলি বিশ্লেষণ করি যা তরঙ্গলেটের প্রসঙ্গে বিশেষভাবে প্রাসঙ্গিক। আমরা স্থির সহগের সাথে লিনিয়ার ডিফারেনশিয়াল সমীকরণ দ্বারা নিয়ন্ত্রিত রৈখিক, শিফট-ইনগ্রেন্ট সিস্টেমের অনুপ্রেরণামূলক প্রতিক্রিয়া হিসাবে কীভাবে প্রস্তাবিত শ্রাবণ তরঙ্গগুলি তৈরি করা হয় তাও আমরা দেখাই। আমরা প্রস্তাবিত সিডাব্লুটিটির এনালগ সার্কিট বাস্তবায়ন প্রস্তাব করি। আমরা গ্যামাটোন থেকে প্রাপ্ত তরঙ্গগুলি কীভাবে এককত্ব সনাক্তকরণ এবং সময় trans ক্ষণস্থায়ী সংকেতগুলির ফ্রিকোয়েন্সি বিশ্লেষণের জন্য ব্যবহার করতে পারি তাও দেখাই। আমরা স্থির সহগের সাথে লিনিয়ার ডিফারেনশিয়াল সমীকরণ দ্বারা নিয়ন্ত্রিত রৈখিক, শিফট-ইনগ্রেন্ট সিস্টেমের অনুপ্রেরণামূলক প্রতিক্রিয়া হিসাবে কীভাবে প্রস্তাবিত শ্রাবণ তরঙ্গগুলি তৈরি করা হয় তাও আমরা দেখাই। আমরা প্রস্তাবিত সিডাব্লুটিটির এনালগ সার্কিট বাস্তবায়ন প্রস্তাব করি। আমরা গ্যামাটোন থেকে প্রাপ্ত তরঙ্গগুলি কীভাবে এককত্ব সনাক্তকরণ এবং সময় trans ক্ষণস্থায়ী সংকেতগুলির ফ্রিকোয়েন্সি বিশ্লেষণের জন্য ব্যবহার করতে পারি তাও দেখাই। আমরা স্থির সহগের সাথে লিনিয়ার ডিফারেনশিয়াল সমীকরণ দ্বারা নিয়ন্ত্রিত রৈখিক, শিফট-ইনগ্রেন্ট সিস্টেমের অনুপ্রেরণামূলক প্রতিক্রিয়া হিসাবে কীভাবে প্রস্তাবিত শ্রাবণ তরঙ্গগুলি তৈরি করা হয় তাও আমরা দেখাই। আমরা প্রস্তাবিত সিডাব্লুটিটির এনালগ সার্কিট বাস্তবায়ন প্রস্তাব করি। আমরা গ্যামাটোন থেকে প্রাপ্ত তরঙ্গগুলি কীভাবে এককত্ব সনাক্তকরণ এবং সময় trans ক্ষণস্থায়ী সংকেতগুলির ফ্রিকোয়েন্সি বিশ্লেষণের জন্য ব্যবহার করতে পারি তাও দেখাই।

ERBlet রূপান্তর: নিখুঁত পুনর্গঠন সহ শ্রুতি-ভিত্তিক সময়-ফ্রিকোয়েন্সি উপস্থাপনা , আইসিএএসএসপি 2013

এই কাগজটি একটি সাউন্ড সিগন্যালের প্রত্যক্ষভাবে অনুপ্রাণিত এবং পুরোপুরি অবলম্বনীয় সময়-ফ্রিকোয়েন্সি উপস্থাপনের জন্য একটি পদ্ধতি বর্ণনা করে। ফ্রেম তত্ত্ব এবং সাম্প্রতিক অ-স্থিতিশীল গ্যাবার ট্রান্সফর্মের ভিত্তিতে, ফ্রিকোয়েন্সি জুড়ে বিবর্তনের রেজোলিউশন সহ একটি রৈখিক উপস্থাপনাটি অ-ইউনিফর্ম ফিল্টারব্যাঙ্ক হিসাবে তৈরি এবং প্রয়োগ করা হয়। মানব শ্রাবণ সময়-ফ্রিকোয়েন্সি রেজোলিউশনের সাথে মেলে, রূপান্তরটি মনোবিজ্ঞানীয় "ERB" ফ্রিকোয়েন্সি স্কেলগুলিতে সমানভাবে গাউস উইন্ডো ব্যবহার করে। অতিরিক্তভাবে, রূপান্তরটিতে অভিযোজ্য রেজোলিউশন এবং রিডানড্যান্সির বৈশিষ্ট্য রয়েছে। সিমুলেশনগুলি দেখিয়েছিল যে দ্রুত পুনরাবৃত্ত পদ্ধতিগুলি ব্যবহার করে এবং ইআরবি প্রতি একটি ফিল্টার এবং খুব কম রিডানডেন্সি (1.08) ব্যবহার করে পূর্বশর্ত তৈরি করে নিখুঁত পুনর্গঠন করা সম্ভব।

এবং আমি আরও উল্লেখ করব:

অডিও সিগন্যাল প্রসেসিংয়ের জন্য একটি শ্রুতি-ভিত্তিক রূপান্তর , ডাব্লুএএসপিএএ ২০০৯

একটি শ্রুতি ভিত্তিক রূপান্তর এই কাগজে উপস্থাপন করা হয়। একটি বিশ্লেষণ প্রক্রিয়ার মাধ্যমে, রূপান্তরটি সময়-ডোমেন সংকেতগুলিকে ফিল্টার ব্যাঙ্ক আউটপুটের একটি সেটে রূপান্তর করে। ফিল্টার ব্যাংকের ফ্রিকোয়েন্সি প্রতিক্রিয়া এবং বিতরণ কোচলের বেসিলার ঝিল্লির মতো। সংকেত প্রক্রিয়াকরণ পচনশীল সংকেত ডোমেনে পরিচালনা করা যেতে পারে। সংশ্লেষণ প্রক্রিয়াটির মাধ্যমে, পচনশীল সংকেতগুলি একটি সাধারণ গণনার মাধ্যমে মূল সংকেতকে আবার সংশ্লেষ করা যায়। এছাড়াও, বিচ্ছিন্ন সময় সংকেতগুলির জন্য দ্রুত অ্যালগরিদমগুলি উভয়ই সামনের এবং বিপরীত রূপান্তরগুলির জন্য উপস্থাপিত হয়। রূপান্তরটি তত্ত্বটিতে অনুমোদিত হয়েছে এবং পরীক্ষায় বৈধ হয়েছে valid শব্দ হ্রাস আবেদনের উপর একটি উদাহরণ উপস্থাপন করা হয়। প্রস্তাবিত রূপান্তরটি পটভূমিতে এবং গণনার শব্দের কাছে দৃ is় এবং পিচ সুরেলা থেকে মুক্ত।


1
আমি ঠিক এটিই খুঁজছিলাম। ধন্যবাদ.
ব্যবহারকারী 76284
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.