স্পেকট্রামগ্রাম থেকে অডিও সংকেত পুনর্গঠন


19

আমার কাছে গানের একটি সেট রয়েছে যার জন্য আমি হ্যামিং উইন্ডো ব্যবহার করে 50% ওভারল্যাপ ব্যবহার করে প্রসারিত বর্ণালীটি বের করেছি। বর্ণালী বের করার পরে, আমি অধ্যক্ষ উপাদান বিশ্লেষণ (পিসিএ) ব্যবহার করে কিছু মাত্রিক হ্রাস করেছি। এটিকে নিম্ন মাত্রিকতায় হ্রাস করার পরে, আমি বর্ণালীগুলি নিম্ন মাত্রা থেকে পুনর্গঠন করেছি। সুতরাং এখন, মূল বর্ণালী এবং পুনর্গঠিত বর্ণালীতে কিছু ত্রুটি থাকবে। আমি এই বর্ণালীটিকে আবার অডিও সিগন্যালে রূপান্তর করতে এবং এটি খেলতে চাই, যাতে কম মাত্রায় পুনর্গঠন করার সময়, অডিও কীভাবে শব্দ হয় তা আমি জানতে সক্ষম হয়েছি।

মতলব বলে কোনও ফাংশন পাওয়া যায় কি না? একটি দৈর্ঘ্যের স্পেকট্রগ্রামকে একটি অডিও সিগন্যালে রূপান্তর করতে ??


2
আপনি সত্যই এসটিএফটি এবং বিপরীত এসটিএফটি চান। "স্পেকট্রামগ্রাম" এসটিএফটি-এর মাত্রার উত্তাপের মানচিত্রের একটি নাম এবং কেবলমাত্র একটি মাত্রার সংকেত পুনর্গঠন করার পক্ষে যথেষ্ট নয়। এ mathworks.com/matlabcentral/fileexchange/12902-dafx-toolbox/... ?
এন্ডোলিথ

4
@ এন্ডোলিথের মন্তব্যে প্রসারিত করার জন্য, আপনি এসটিএফটি থেকে স্পেকটারগ্রামে যাওয়ার সময় আপনি কী অনুপস্থিত তা হ'ল পর্যায় সম্পর্কিত তথ্য, যা আপনার সিগন্যালের ফ্রিকোয়েন্সি ডোমেন উপস্থাপনের একটি গুরুত্বপূর্ণ উপাদান।
বজর্ন রোচে

সুতরাং এর অর্থ যদি আমি মূল অডিও সিগন্যালটি পুনর্গঠন করতে চাই তবে আমার প্রশস্ততা পাশাপাশি এসটিএফটির উভয় পর্যায়েও প্রয়োজন? তবে সাধারণভাবে অডিও বৈশিষ্ট্যগুলি বানাতে, | এস | জটিল নম্বরের প্রশস্ততা যা ব্যবহৃত হয় তা এবং পর্যায়ের তথ্য বাতিল করা হয়। আমি মেল বর্ণালীতে পিসিএ সম্পাদন করেছি যা আমি এম হিসাবে গণনা করেছি , এটি মেল ফিল্টারব্যাঙ্ক গুণিত ম্যাট্রিক্স। সুতরাং আপনি কীভাবে given প্রদত্ত অডিও সিগন্যালটি পুনর্গঠন করবেন , এক্সের সমাপ্তি পিসিএর পরে পেয়েছে? এক্স=(এম|এস|)এক্স^
ব্যবহারকারী 76170

@ এন্ডোলিথ: আপনি যে লিঙ্কটি ম্যাথওয়ার্কস / ম্যাটলাবসেন্ট্রাল / ফাইলেক্সচেঞ্জ / 12902-dafx-toolbox/… দিয়েছিলেন তা ব্যবহার করার চেষ্টা করেছি আমি পর্যায় এবং প্রশস্ততার তথ্য উভয়ই ( উপরের ফাংশনটিতে জটিল ) হিসাবে ব্যবহার করেছি। এটি ব্যবহার করে আমি সিগন্যালটি বাজানোর চেষ্টা করেছি এবং এটি চপ্পটি শোনাচ্ছে। কেন এমন হয়? আমি তারপরে মূল সংকেতটির মধ্যে আদর্শটি গণনা করেছিলাম এবং উপরে হিসাবে উল্টো এসটিএফটি পদ্ধতিটি পেয়েছি এবং এটির একটি বিশাল মান দেখা গেছে 3.46 * 10 ^ 3। কোন ধারণা কেন এমন হয় ?? এস
ব্যবহারকারী 76170

@ ইউজার 61১7070০: চপ্পি হ'ল কারণ এসটিএফটি সিগন্যালটিকে ফ্রেমের মধ্যে টুকরো টুকরো করে তোলে, কখনও কখনও ওভারল্যাপিং করে এবং আপনাকে সেগুলি একইভাবে ডিকনস্ট্রাক্ট করতে হয় বা প্রতিটিটিতেই বিচ্ছিন্নতা থাকবে। আপনি কি এই লিঙ্কটি থেকে এসটিএফটি এবং আইএসটিএফটি ফাংশন ব্যবহার করেছেন? চপি সিগন্যালের তরঙ্গরূপটি দেখুন যাতে সমস্যাটি কী তা আপনি দেখতে পান।
এন্ডোলিথ

উত্তর:


15

ওভারল্যাপিং উইন্ডো থেকে স্বল্প সময়ের চারিয়ার রূপান্তর হিসাবে স্পেকট্রগ্রামটি গণনা করা হয় , তবে বর্ণালীতে স্পষ্টত কিছু পর্যায়ের তথ্য রয়েছে।

নিম্নলিখিত পুনরাবৃত্তি কাজ করে:

এক্সএন+ +1=istft(এসমেপুঃ(আমিকোণ(stft(এক্সএন))))

স্টাফএস হ'ল বর্ণালী, হ'ল ফরোয়ার্ড-শর্ট ফিউরিয়ার ট্রান্সফর্ম, আইফট হ'ল ইনভার্স-শর্ট টাইম ফুরিয়ার ট্রান্সফর্ম।stftisft


আমি সরাসরি ইডওর্ডে মন্তব্য করতে চাই, তবে আমার যথেষ্ট খ্যাতি নেই। তার উত্তরে কী তা কি কেউ জানে ? এছাড়াও আমি এক্স 0 টি কীভাবে শুরু করব ? শুধু এলোমেলো? কি এক্স এন পুনরাবৃত্তির এ সম্পূর্ণ পুনঃনির্মাণ সংকেত এন বা শুধু এন সহগ এক্স ? ধন্যবাদ। আমিএক্স0এক্সএনএনএনএক্স
পিআর

1
@ পিপি এটি ইউনিট কাল্পনিক সংখ্যা, -1
পিটার কে

3

@ ইদোয়ার্ডের উত্তরটি বুঝতে আমার বেশ কষ্ট হয়েছে, যা সঠিক কাজ করছে। Https://dsp.stackexchange.com/a/3410/9031 এর সাথে তুলনা করুন , যা আমি আমার পুনর্গঠন বাস্তবায়নের জন্য ব্যবহার করেছি।

দ্রষ্টব্য যে কল্পিত সংখ্যা, এবং x n হ'ল n পুনরাবৃত্তির পুনর্গঠিত সংকেত । এক্স 0 দিয়ে অডিও সংকেতের দৈর্ঘ্যের এলোমেলো ভেক্টর হয়ে শুরু করুন। আমার পক্ষে কয়েকটি পুনরাবৃত্তি এমন ফলাফল পেতে যথেষ্ট ছিল যা ঠিক মতো শোনাচ্ছে। মূল সিগন্যালের পরম ত্রুটি তবুও বেশ বেশি ছিল। এছাড়াও পুনর্গঠিত সিগন্যাল থেকে উত্পন্ন স্পেকট্রামগ্রামের উত্পন্ন, যদিও একই কাঠামোগুলি সাধারণভাবে দেখানো হচ্ছে, বেশ ভিন্নতা ছিল।ixnnthএক্স0


2

আপনি একটি ফিল্টার ডিজাইন করতে মূল বর্ণালী বনাম পুনর্গঠিত স্পেকট্রামগ্রাম ব্যবহার করতে পারেন যার দৈর্ঘ্যের প্রতিক্রিয়া অন্য বর্ণালীতে রূপান্তর করে। তারপরে আপনি এই ফিল্টারটি মূল সময়ের ডোমেন ডেটাতে, বা ওভারল্যাপ অ্যাড / সেভ ফাস্ট কনভোলিউশন ফিল্টারিংয়ের জন্য মূল এফএফটিগুলিতে প্রয়োগ করতে পারেন।


@ হটপা 2: আমি আপনার প্রতিক্রিয়া বুঝতে পারি নি, কেন আমি একটি বর্ণালীকে অন্যটিতে রূপান্তর করতে চাই? আমি অডিও সংকেত পুনর্গঠন করার জন্য একটি বর্ণালির আলোকক চিত্র বা রেখা চিত্র ম্যাট্রিক্স দেওয়া চান । এমন ফিল্টার ডিজাইনের প্রয়োজনীয়তা যা একটি বর্ণালী থেকে অন্য বর্ণনায় রূপান্তর করে এবং ওভারল্যাপে দ্রুত রূপান্তর ফিল্টারিং যুক্ত / সংরক্ষণ করা যায়? আমি | থেকে অডিওটি পুনর্গঠন করতে চাই এস | যাতে আমি দেখতে পারি যে পিসিএ কতটা কার্যকর। সুতরাং বলুন আমি দুটি ক্লিপ খেলতে পারি, একটি মূল অডিও সিগন্যাল এবং অন্যটি নিম্ন মাত্রা থেকে পুনর্গঠিত | এস | |এস||এস||এস^|
ব্যবহারকারী 76170

2
একটি বর্ণালী ম্যাট্রিক্স ক্ষয়ক্ষতিজনক, তাই পুনর্নির্মাণের জন্য ব্যবহার করা যাবে না। তবে আপনি যদি নিজের কাঙ্ক্ষিত বর্ণালী উত্পাদন করতে ইঞ্জিনিয়ারকে রূপান্তর করতে পারেন তবে আপনি এটিকে মূল অ-ক্ষতির সময় ডোমেন ডেটা বা সম্ভবত মূল জটিল ফল এফএফটিতে প্রয়োগ করতে পারেন।
হটপাউ 2

এস|এস||এস|

1
@ user76170 এর দীর্ঘ এবং সংক্ষিপ্তটি হ'ল আপনি আপনার সিগন্যালটি পুনর্গঠন করার আগে জটিল এসটিএফটি দরকার। আপনার যদি মাত্রাতিরিক্ত STFT থাকে তবে এটি যথেষ্ট নয়। এই নিয়মের ব্যতিক্রম রয়েছে, তবে সাধারণত, আপনার কেবল মাত্রার নয়, জটিল এসটিএফটি দরকার।
তারিন জিয়াই

|এস||এস^|

-1

গ্র্যাফিন-লিম অ্যালগরিদমটি বর্ণালী থেকে অডিও সিগন্যালটি উল্টাতে ব্যবহার করুন, যদি আপনি গণনার জটিলতা নিয়ে উদ্বিগ্ন না হন।


আপনি দয়া করে আপনার উত্তরটি কিছুটা প্রসারিত করতে পারেন? সম্ভবত একটি প্রতিনিধি কাগজ যুক্ত করা বা অ্যালগরিদমের লিঙ্ক এবং এটি এই প্রশ্নের (?) এর সাথে কীভাবে প্রাসঙ্গিক তার একটি সংক্ষিপ্ত ব্যাখ্যা
এ_এ

আমি যদি আপনার প্রশ্নটি সঠিকভাবে বুঝতে পারি তবে সংক্ষেপে, আপনি আসল পর্বের তথ্য না ব্যবহার করে একটি বর্ণালী থেকে অডিও সিগন্যালটি পুনর্গঠন করতে চান। গ্রিফিন-লিম অ্যালগরিদমের ইনপুট হিসাবে একটি বর্ণালী ম্যাট্রিক্স প্রয়োজন এবং পুনরুক্তি পর্বটি পুনরাবৃত্তিভাবে করা উচিত। আপনি পেপারটি IEeexplore.ieee.org/docament/1164317
জিতেন্দ্র ধীমান

আমাকে অবগত করার জন্য ধন্যবাদ. শুধু এই বিষয়টি স্পষ্ট করার জন্য। এই প্রতিক্রিয়াটি আমার পর্যালোচনা সারিতে "নিম্নমানের" হিসাবে তুলে ধরে। "পর্যালোচনা" এর শর্তে আমার কাছে যে বিকল্পগুলি রয়েছে সেগুলির মধ্যে "উন্নতি" এর জন্য মন্তব্য সরবরাহ করা অন্তর্ভুক্ত। এই উত্তরটি ডিএসপি.এসই-তে সাধারণত যে ধরণের প্রশ্নের মুখোমুখি হয় তার সাথে সামঞ্জস্যপূর্ণ হওয়ার জন্য, ওপি কী জিজ্ঞাসা করছে তার সাথে এটি কীভাবে প্রাসঙ্গিক তা দেখানোর জন্য গ্রিফিন লিম অ্যালগরিদমে কিছুটা যেতে হবে। ভবিষ্যতের যে কোনও সম্পাদনা, আপনি সরাসরি আপনার উত্তরে আবেদন করতে পারেন। এর মূল
বক্তব্যটি

আপনার কাছে আসল এফএফটি তথ্য না থাকলে সেক্ষেত্রে সেরা উত্তর এখানে (গ্রিফিন-লিম ব্যবহার করে)। timsainb.github.io/…
আর্টেমি ক্রিমস্কি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.