অডিওর কোন গাণিতিক মডেলটি (টিমব্রোললি কমপ্লেক্স) বহুবিজ্ঞানে পৃথক নোটগুলি পিচ স্থানান্তর করা সম্ভব করতে পারে?


24

আমার প্রশ্নটি হল: পলিফোনিক শব্দের কোন গাণিতিক মডেলটি কোনও পলিফোনিক অ্যাকোস্টিক বাদ্যযন্ত্রটির মাল্টি-ভয়েস-ইন-সিঙ্গল-চ্যানেল অডিও রেকর্ডিংয়ে পৃথক সংগীত নোটগুলির পরিবর্তনের (অর্থ পিচ শিফটিং) সম্ভব করে তুলতে পারে? 'পলিফোনিক অডিওতে নোট পরিবর্তন করা' দ্বারা, আমি সেলিবির মেলোডিন সফ্টওয়্যারটিতে তথাকথিত ' ডাইরেক্ট নোট অ্যাক্সেস ' বৈশিষ্ট্য সহ শব্দ সম্পাদনা করার মতো কিছু করার অর্থ ।

উইকিপিডিয়া অনুসারে , মেলোডিন একু লাস্ট মেলোডি বাজানোর জন্য অডিও সিগন্যালের মডেল করতে যা ব্যবহার করেন তা হ'ল হেনিং থিলিম্যান তাঁর গবেষণাপত্রে ' নিরবচ্ছিন্ন পর্যায়ে এবং মনোফোনিক শব্দগুলির সময় ' শিরোনামের মতো বর্ণনা করেছেন তবে, পলিফোনিক বাদ্যযন্ত্রগুলির অডিও সিগন্যালের মডেলগুলির জন্য আমি কোনও উল্লেখ খুঁজে পাই না; পিটার নিউউব্যাকারের ইউটিউবে একটি সাক্ষাত্কার অনুসারে (নীচে লিপিবদ্ধ), পলিফোনিক অডিও সম্পাদনা করার জন্য মেলোডিনের বৈশিষ্ট্যের জন্য থিলেম্যানের বর্ণিত মতটির চেয়ে ভিন্ন দৃষ্টিভঙ্গির প্রয়োজন।

অন্য ইউটিউব ক্লিপটির একটি সূত্রটি হ'ল নুব্যাকারের মডেলটি কেবলমাত্র এক ধরণের ইন্সট্রুমেন্টের অডিও রেকর্ডের সাথে আরও ভাল কাজ করে (যেমন কেবল পিয়ানো, কেবল গিটার, কেবল স্ট্রিং, কেবল বাতাস ইত্যাদি)। আরেকটি ক্লু হ'ল আর একটি ক্লিপ যা কেবলমাত্র একটি নোটের পিচটি বদলানোর ক্ষমতা নয় তবে এটির (শুরু এবং শেষ) সময়ও প্রদর্শন করে।


নীচে ইউটিউব ভিডিওটির প্রতিলিপি দেওয়া আছে যাতে উল্লেখ করা হয়েছে যে 'পলিফোনিক উপকরণগুলি আলাদা পদ্ধতির জন্য আহ্বান জানায়' (যদি আপনার 22:00 তারিখ থেকে এটি দেখার সময় না থাকে)।

  • প্রশ্ন, যা থেকে মেলোডিন উঠেছিল: আমি কীভাবে এইভাবে [হাতে পাথরের ইশারায়] একটি ত্রি-মাত্রিক রূপ থেকে শব্দ পেতে পারি? কোন মাধ্যমে, অবিচ্ছিন্ন সময়ের উপর নির্ভরতা থেকে শব্দটি মুক্ত করা যায়? এই ভাস্কর্যটি যা এ থেকে উদ্ভূত হয়েছিল ... এটি প্লাস্টিকের এক টুকরো .... এটি সরাসরি সংগীত সম্পর্কিত ডেটা থেকে নেওয়া হয়েছিল। এই অবজেক্টটি এই নোটটিকে [লুটে একটি নোট টানছে]। বাম থেকে ডানে এটি এটিকে সেরা রূপান্তরিত করা হয়। সময় এই দিকে চলে [ইশারা করে বাম থেকে ডান]। এবং এটি প্রশস্ততা [আঙ্গুলের বিরোধী থাম্ব দিয়ে বড় এবং ছোট অঙ্গভঙ্গি করা]। যদি আমি এটি ঘুরিয়ে নিই, এটি ... কোনও নির্দিষ্ট পরিস্থিতিতে এই শব্দটির কাঠের প্রতিনিধিত্ব করে। আপনি এখানে খুব স্পষ্ট দেখতে পাচ্ছেন একটি কাঠামো [ভাস্কর্যের নীচে অংশটি অতিক্রম করে দেখানো] যা কিছুটা ত্রিভুজাকার; কারণ এই শব্দে,

    যেহেতু মেলোডিনের অস্তিত্ব এখনও নেই এবং আমি কেবল শব্দটি এই আকারে অনুবাদ করার জন্য পরীক্ষা করছিলাম, তাই আমি প্রায় এক বছর এই শব্দটির সাথে কাজ করেছি one ... আমি এই শব্দটি ভিতরে এবং বাইরে এবং হৃদয় দিয়ে জানি। এটি স্থানীয় শব্দগুলির একটি ভাল চিত্রও সরবরাহ করে। আমি কেবল শব্দটি [মাউস ক্লিক করে] ফিরে প্লে করতে পারি না, তবে আমি যেকোন পয়েন্টের শব্দটিও প্রবেশ করতে পারি এবং এটি যতটা ধীরে ধীরে বা দ্রুত পছন্দ করি তত দ্রুত সরিয়ে নিতে পারি। আমি এমনকি শব্দে দীর্ঘায়িত হতে পারি, বা সামনের দিকে এবং পিছনের দিকে যেতে পারি, তাই যদি আমি এখানে একটি জায়গা পরীক্ষা করি ... এটির চারপাশে যান। ... দশ বছর আগে এটা নতুন ছিল।

    সম্প্রতি ডিএনএ (সরাসরি নোট অ্যাক্সেস) যুক্ত করা হয়েছে। এটির সাহায্যে আমি পলিফোনিক সংগীতও সম্পাদনা করতে পারি। অন্য কথায়, আমি স্বতন্ত্রভাবে নোটগুলি একসাথে শোনার মতো সম্পাদনা করতে পারি যেমন উদাহরণস্বরূপ গিটার রেকর্ডিং। যদি আমি এখন একটি ছোট জেল বাজান [পলি -> স্ক্রিনে পৃথক নোটগুলি নির্বাচন করে] খেলেন তবে আমরা এখানে 3 টি নোট দেখতে পেয়েছি যা আমি পৃথক সত্ত্বা হিসাবে খেলেছি। আসুন আমরা আবার শুনি [কম্পিউটার গৌণ জোরে বাজায়]। এবং এখন, যেন আমার আঙুলটি আরও উচ্চ শিখরে নিয়ে যায়, আমি এই একটি নোট বাড়াতে পারি [স্ক্রিনে একটি নোট টেনে আনতে; কম্পিউটার মেজর বাজায়] বিভক্ত-আপ অডিওর জন্য, আমি এই একটি নোটটি বিচ্ছিন্ন করতে পারি, এবং এখনই ইচ্ছে করে এটিকে উপরে বা নীচে সরানো যেতে পারে, দয়া করে যে কোনও পিচে to

    জটিল পদার্থের মধ্যে এভাবে আলাদা আলাদা স্বর আলাদা করতে কেউ আগে সক্ষম হয় নি কেন? আমি সত্যই জানি না। বিজ্ঞানের ক্ষেত্রে, প্রাকৃতিক প্রবণতা হ'ল সহজ কিছু দিয়ে শুরু করা, উদাহরণস্বরূপ একটি সাইন ওয়েভ বা স্বতন্ত্র নোটগুলি এবং বিশ্লেষণ করা উচিত যে কেবল তখন আবিষ্কার করা যায় যখন উপাদানটি আরও জটিল হয়ে ওঠে বা তার সম্পূর্ণরূপে চিকিত্সা করতে হয়, সিস্টেমটি কাজ করে না আমার পন্থা আলাদা। আমি আসলে জটিল সংকেত দিয়ে শুরু করি এবং আমি কেবল তখনই সাধারণের কাছে ফিরে যাব এমন কিছু বিশদ পরীক্ষা করতে চাইলে তবে প্রথমে বাস্তবে কী ঘটছে তার সামগ্রিক ধারণা আমার থাকতে হবে।

    গোপনীয়তা সম্ভবত এই রোল মধ্যে আছে? হেইহে, এটি আসলে লু রোল। মূলত প্রস্তর দ্বারা উত্থাপিত প্রশ্নটি ছিল আমি কীভাবে প্রদত্ত শব্দকে ত্রিমাত্রিক আকারে অনুবাদ করতে পারি। এখানে আমি পৃথক শব্দের পৃথকীকরণের মানগুলি পৃথক করে রেখেছি, এখানে একটি দু'তিন দ্বারা নির্দেশিত এবং তাই সর্পিল। এবং দেখা যাচ্ছে যে আপনি যদি পয়েন্টগুলির মধ্যে [সর্পিলটি জুড়ে অঙ্গভঙ্গি করে] বিভক্ত হন তবে একটি আড়াআড়ি উত্থিত হয় যা শব্দের [ভাস্কর্যের ক্রস বিভাগগুলি ইঙ্গিতকারী] স্বতন্ত্র ক্রস-বিভাগকেও উপস্থাপন করে।

    রোলটির বয়স কত? 1 ২ বছর. তাহলে সেই ধারণাটি মেলোডিনের ভাল-বসন্ত, যা আমরা আজ দেখেছি ...? হ্যাঁ, তবে শব্দটি গুছিয়ে দেওয়ার এই পদ্ধতিটি পলিফোনিক উপকরণগুলির জন্য আর ব্যবহারযোগ্য হবে না, যা আলাদা পদ্ধতির জন্য ডাকে।


কোন সময় এখন, অতঃপর তোমাদের কেউ কেউ পড়তে চাইবেন বিল Sethares ' কাজ সাদৃশ্য । আমি আপনার পোস্ট হজম করার চেষ্টা করব এবং আগামী কয়েকদিনে আরও পুরোপুরি উত্তর দেব।
পিটার কে।

আমি নিশ্চিত না যে প্রশ্নটি কী। পৃথক নোট পৃথকরূপে এবং তোলে আমাকে একটি সর্পিল একটি বর্ণালী মোড়কে মনে "শব্দ আপ পেঁচানোর" তাই একে অপরের সাথে একটি নোট লাইন আপ এর সুরবিজ্ঞান: nastechservices.com/Spectrograms.html nastechservices.com/Spectratune.html
endolith

উত্তর:


12

টি এল; ডিআর? সুরেলা আংশিক পৃথকীকরণের জন্য গুগল স্কলার ।


একটি ভাল প্রারম্ভিক বিন্দু হ'ল সাইনোসয়েডাল মডেলিং কৌশলগুলি যা সিগন্যালকে সাইনস + নয়েজ (ডিটারমিনিস্টিক এবং স্টোকাস্টিক) উপাদানগুলিতে পৃথক করে। সাইনস দ্বারা গঠিত ডিটারমিনিস্টিক উপাদানটি দৃinc়তার সাথে পুনরায় সংশ্লেষিত হতে পারে:

http://mtg.upf.edu/files/projectsweb/sms-piano-original.wav

http://mtg.upf.edu/files/projectsweb/sms-piano-deterministic.wav

সাইনগুলি সংকেত থেকে বিয়োগ করা হয় এবং গোলমাল / স্টোকাস্টিক অংশটি থেকে যায়।

http://mtg.upf.edu/files/projectsweb/sms-piano-stochastic.wav

স্টোচাস্টিক অংশটি কিছু শব্দ-আকার দেওয়ার ফিল্টারটির মাধ্যমে শব্দ ছড়িয়ে দিয়ে সংশ্লেষিত হয়। অন্য কেউ কেউ এটি একটি সাইনস + নয়েজ + ট্রান্সিয়েন্টস মডেলটিতে প্রসারিত করেছেন যা সময় প্রসারিত ক্ষেত্রে ক্ষণস্থায়ী স্টোকাস্টিক বৈশিষ্ট্যগুলি সংরক্ষণে সহায়তা করে।

https://ccrma.stanford.edu/~jos/sasp/Sines_Noise_Modeling.html

http://mtg.upf.edu/technologies/sms

আপনার কাছে একবার সিগন্যালের সাইনোসয়েডাল প্যারামিটারগুলি হয়ে গেলে, সুরেলা অনুপাত এবং গোষ্ঠী সূচনা দ্বারা গোপনীয়করণের দ্বারা ওভারল্যাপিং নোটগুলির আকারগুলি পৃথক করা সম্ভব etc.

http://recherche.ircam.fr/equipes/analyse-synthese/lagrange/research/papers/lagrangeIcassp05.pdf

http://dream.cs.bath.ac.uk/software/sndan/mqan.html

লুকায়িত মার্কভ মডেল , polynomials এবং ম্যাকলে-Quatieri পদ্ধতি কিছু। আমি স্টোকাস্টিক বাম ওভার দুটি নোটে পৃথক করা সম্পর্কে স্ট্যাম্পড। আমি জানি না মেলোডিন কীভাবে এটিকে সম্বোধন করে।


5

মেলোডিনে ব্যবহৃত পদ্ধতির জন্য 2 টি পৃথক ফ্রিকোয়েন্সি ডোমেন ক্রিয়াকলাপ প্রয়োজন। প্রথমত, পলিফোনিক ট্রান্সক্রিপশন কৌশলগুলি পলিফোনিক অডিওর নোট ক্রিয়াকলাপগুলিতে গ্রুপের ফ্রিকোয়েন্সি উপাদানগুলিকে (একটি স্ট্যান্ডার্ড ফ্রিকোয়েন্সি রূপান্তর থেকে) গোষ্ঠী হিসাবে ব্যবহার করা হয়। অন্য কথায়, সম্ভবত সম্ভাব্য নোট ক্রিয়াকলাপ অনুসারে গ্রুপ সুরেলা সাবলেট। রেফারেন্স এবং গাণিতিক মডেলগুলির জন্য এই ফোরামে "বিপরীত পলফোনিক কর্ড স্বীকৃতি" পোস্টে আমার প্রতিক্রিয়া দেখুন।

দ্বিতীয় ক্রিয়াকলাপটি হ'ল উপরে বর্ণিত সুরেলা সাবলেটগুলির ফ্রিকোয়েন্সি ডোমেন পিচ স্থানান্তর। আমি নিশ্চিত নই তবে আমি প্রায় গ্যারান্টি দিয়ে যাব যে মেলোডিন এটি অর্জনের জন্য একটি ফেজ ভোকার পদ্ধতির ব্যবহার করে। আপনি এই কৌশলটি ব্যবহার করে সময় প্রসারিতও করতে পারেন । আমরা রিফস্টেশনে এগুলির মতো কৌশলগুলি ব্যবহার করি এবং তারা বেশ ভালভাবে কাজ করে।


3

একটি সম্ভাবনা স্ট্যাটিস্টিকাল প্যাটার্ন মেলানো পদ্ধতির ব্যবহার করে বিশ্লেষণ / পুনরায় সংশ্লেষণ হতে পারে। সমস্ত প্রত্যাশিত নোটের জন্য যন্ত্রের শব্দগুলির জন্য যদি আপনি জানেন বা যুক্তিসঙ্গতভাবে জড়িত যন্ত্রগুলির মিশ্রণটি অনুমান করতে পারেন এবং টেমপ্লেটগুলি (প্রাথমিক ট্রান্সজেন্টস, বর্ণালী প্লাস বর্ণালী বিবর্তন ইত্যাদি) পেয়ে থাকেন তবে আপনি প্রচুর সংখ্যক বুদ্ধির জোরের একটি পরিসংখ্যানগত মিল চেষ্টা করতে পারেন সর্বাধিক সম্ভাব্য পলিফোনিক সংমিশ্রণ (গুলি) অনুমান করতে টেমপ্লেটের শব্দ নিদর্শনগুলি ব্যবহার করে সংমিশ্রণগুলি। এটি সম্ভবত বিশ্বব্যাপী মিনিমা'র জন্য খুব কমপিটেশনাল নিবিড় অনুসন্ধান হবে, যেখানে বিভিন্ন "এআই" -র মতো অনুসন্ধান কৌশল কার্যকর হতে পারে। তারপরে আপনি বিভিন্ন স্বতন্ত্র জ্যাড সম্ভাব্যতা নিতে পারেন এবং তারপরে সময় সর্বাধিক সম্ভাব্য পলিফোনিক ক্রমগুলি চয়ন করার জন্য সিদ্ধান্ত তত্ত্বগুলি ব্যবহার করতে পারেন।

তারপরে আনুমানিক নোটগুলি নিন এবং সেগুলি আপনার নির্বাচিত কী পিচ এবং সময়কালে পুনরায় সংশ্লেষিত করুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.