স্কিপি - অডিও প্রসেসিং


14

আমি অডিও সিগন্যাল প্রসেসিংয়ের জন্য ভাল সরঞ্জামগুলি সন্ধান করছি। উদাহরণস্বরূপ স্পিচ এবং সংগীত বিশ্লেষণ, স্বয়ংক্রিয় ভাষার সনাক্তকরণ ইত্যাদি

স্কিপি লাইব্রেরি অডিও প্রসেসিংয়ের জন্য ফাংশন সরবরাহ করে? এটিতে অডিও সিগন্যাল প্রসেসিংয়ের জন্য কোনও ভাল সরঞ্জাম রয়েছে?

আপনি কি দয়া করে এর জন্য কোনও সরঞ্জাম প্রস্তাব করতে পারেন?


1
হ্যাঁ, স্কিপি এই ধরণের কাজগুলি করার জন্য অবকাঠামো সরবরাহ করে তবে আরও কার্যকর উত্তর পেতে আপনি যা করছেন তা সম্পর্কে আপনাকে আরও কিছুটা সুনির্দিষ্ট হওয়া দরকার (বিশেষত "[স্কিপি] এর চেয়ে ভাল সরঞ্জাম" আছে কি না তা উত্তর দেওয়ার জন্য) )।
এ_এ

1
রিয়েলটাইম না অফলাইন?
এন্ডোলিথ

অফলাইন। আমি স্পিচ / সংগীত শ্রেণিবিন্যাস খুঁজছি।
ব্যবহারকারী 1147663

1
স্কিপি এবং নম্পি একসাথে ডেটা রিয়েল-টাইম এবং অফলাইন উভয় প্রসেসিংয়ের জন্য দুর্দান্ত সরঞ্জাম সরবরাহ করে। সিথন বা সিটিপস (আমি সাইথন পদ্ধতির পছন্দকে প্রাধান্য দিই) এর সংমিশ্রণে সিটিতে লিখিত নিম্ন স্তরের দ্রুত অপারেশন সহ ন্যালি অ্যারেগুলিতে কাজ করা সহজ, যদি অন্য লাইব্রেরিগুলি ফিট করতে রাজি না হয়।
হেনরি গোমারসাল

1
ম্যাটল্যাবের একটি জিনিস যার অভাব রয়েছে তা হ'ল অ্যারের উত্সকে ১ ব্যতীত অন্য কিছু হিসাবে সংজ্ঞায়িত করার ক্ষমতা so সুতরাং কোনও এফএফটি আউটপুটে ডিসি মান যেমন বিন # 0 এর পরিবর্তে বিন # 1 এ থাকে। ম্যাটল্যাব (বা অকটাভ) সম্পর্কে আরও কিছু বোকামি জিনিস রয়েছে।
রবার্ট ব্রিস্টো-জনসন

উত্তর:


9

ব্যক্তিগতভাবে আমি পাইথনকে সেখানে সেরা পছন্দগুলির মধ্যে একটি পাই এবং অডিও শনাক্তকরণের ক্ষেত্রে আমি নিজে কিছু কাজ করেছি। গোলমাল অডিও রেকর্ডিং থেকে পাখিদের স্বয়ংক্রিয়ভাবে সনাক্তকরণের জন্য উদাহরণস্বরূপ আমার সফ্টওয়্যারটি পরীক্ষা করে দেখার জন্য আপনাকে স্বাগত জানানো হচ্ছে: অরনিথোক্রিটস । প্রোগ্রামটি নিউজিল্যান্ডের সংরক্ষণ বিভাগ দ্বারা ব্যবহৃত হয় এবং তারা এটি সম্পর্কে খুশি। এই উদাহরণের উপর ভিত্তি করে আমি পাইথন ব্যবহারের কয়েকটি সুবিধা উল্লেখ করতে চাই:

  1. বিশাল, দ্রুত বিকাশকারী সম্প্রদায় প্রচুর গ্রন্থাগার সরবরাহ করে। SciPy সিগন্যাল প্রক্রিয়াজাতকরণের জন্য পদ্ধতিগুলির আধিক্য সরবরাহ করে (মাতালব হিসাবে মঞ্জুর হয় না এবং প্রাপ্ত হয় না)। যদিও সায়্পাই মনে রাখবেন, যদিও এটি সর্বাধিক গুরুত্বপূর্ণ, তবে শত শতগুলির মধ্যে একটি যা আপনাকে আপনার প্রচেষ্টাতে সহায়তা করতে পারে। আমি সংগীত বিশ্লেষণের জন্য অবিওকে সেরা খুঁজে পেয়েছিস্পষ্টভাবে বক্তৃতা এবং সংগীতের স্বীকৃতির জন্য আপনি প্রচুর অডিও বৈশিষ্ট্য উপভোগ করবেন যা ইয়াফা বের করতে পারে।
  2. এটা বিনামূল্যে! একাডেমী থেকে বের হয়ে গেলে আপনি দ্রুত আবিষ্কার করতে পারেন যে মতলব বরং ব্যয়বহুল। এমনকি আপনি যদি এটি সামর্থ্যও করতে পারেন তবে আপনার দৃষ্টিভঙ্গি ব্যবহারকারীরা এই নির্ভরতা সম্পর্কে খুশি হবেন না। উদাহরণস্বরূপ, উল্লিখিত সংরক্ষণ অধিদফতর মালিকানাধীন সফ্টওয়্যার গ্রহণ করবে না।
  3. সনাক্তকরণের জন্য প্রায়শই মেশিন লার্নিং প্রয়োজন হয় এবং পাইথনের জন্য দুর্দান্ত টুলকিট রয়েছে: স্কলার এটি আর্ট লাইব্রেরির রাষ্ট্র - এবং ব্যবহার করা সহজ। কটাক্ষপাত আছে Kaggle প্রতিযোগিতায় (মেশিন লার্নিং) এবং চেক কত শীর্ষ প্রোগ্রামারদের পাইথন এবং sklearn ব্যবহার করছেন।
  4. আপনি "বড় ডেটা" পরিচালনা করতে পারেন। আপনি যদি রেকর্ডিংয়ের বিশাল নেটওয়ার্কযুক্ত ডেটাবেসগুলির বিরুদ্ধে বিশ্লেষণ চালাতে চান তবে পাইথন ভাল সরঞ্জাম স্থাপন করেছে। আমি মতাদাব / অক্টাভ ইন্টারফেসটি সহজেই উদাহরণস্বরূপ হ্যাডোপের সাথে মনে করি না, যদিও আমি ভুল হলে আমাকে সংশোধন করুন। আর এই অঞ্চলটি আরও ভাল করে।
  5. ইন্টারফেসিংয়ের কথা বলতে গিয়ে আপনি সহজেই কোনও ওয়েব সাইটের সাথে আপনার প্রোগ্রামটি ইন্টারফেস করতে পারেন। এইভাবেই আমি অরনিথোক্রিটস (পাখির স্বীকৃতি) পরিচালনা করি: প্রোগ্রামটি অ্যামাজন ওয়েব সার্ভিসেস ক্লাউড কম্পিউটিং পরিষেবাতে চলে। দুর্দান্ত আপনি যদি অন্য সমস্ত লোককে আপনার সফ্টওয়্যার সরবরাহ করতে চান যারা প্রয়োজনীয় সমস্ত গ্রন্থাগারগুলির ইনস্টলেশন প্রক্রিয়াটি অগত্যা যেতে চান না।

আমার দ্বিতীয় পছন্দটি আর হবে Although যদিও পাইথনের মতো বৈশিষ্ট্য সমৃদ্ধ না হলেও এটিতে প্রচুর উপকারী লাইব্রেরি রয়েছে (যেমন আপনার অ্যাপ্লিকেশনগুলির জন্য দৃষ্টান্তের ওয়েভ পরীক্ষা করুন )। উইন্ডোজ এবং লিনাক্স উভয় ক্ষেত্রেই ইনস্টল করা কেকের টুকরো, যা আপনি যদি অন্যদের আপনার প্রোগ্রামটি ব্যবহার করতে চান তবে গুরুত্বপূর্ণ। তবে, আমার অভিজ্ঞতার সাথে আর-তে উচ্চ-পারফরম্যান্সের কম্পিউটিং আরও বেশি কঠিন - আপনার যদি প্রসেসিং এবং সনাক্তকরণের প্রচুর পরিমাণে প্রয়োজন হয় তা লক্ষ করার জন্য একটি গুরুত্বপূর্ণ বিষয় লক্ষ্য করা।

পাইথনে সংগীত শ্রেণিবিন্যাসের উদাহরণ:

পাইথনের সাথে বুক বিল্ডিং মেশিন লার্নিং সিস্টেমগুলির সংগীত শ্রেণিবিন্যাস সম্পর্কিত একটি অধ্যায় রয়েছে

অন্যান্য সরঞ্জাম (কোনও উপায়ে তালিকা সম্পূর্ণ নয়): সঙ্গীতে পাইথন


2

দেখে মনে হচ্ছে যে পাইথন এটির জন্য জনপ্রিয় কিছু টিউসসেট রয়েছে যার ভিত্তিতে ভাল ... আমি এটি কয়েকটি সংগীত প্রযুক্তি গ্রেড বিভাগ এবং সংস্থাগুলিতে ব্যবহার করতে দেখেছি।

একাডেমিয়ায়, মতলব-এ এই ধরণের কাজ করা দেখা খুব সাধারণ বিষয়, যেহেতু এটি সহজে-তদন্তের আইডিইতে অনেক শক্তিশালী টুলকিট (সিগন্যাল প্রসেসিং, সমান্তরাল কম্পিউটিং, গ্রাফিং, ডেটাবেস ইউটিলিটিস, মেশিন লার্নিং, এআই) একত্রিত করে। তবে এটির জন্য অর্থ ব্যয় হয় এবং কিছু ত্রুটিও রয়েছে (অ্যাপ্লিকেশন ডিজাইন এবং কার্য সম্পাদনের দিক থেকে সেরা প্রোগ্রামিং ভাষা নয়, তাই এটি মূলত একটি প্রোটোটাইপিং টুল তবে সি তে সংকলন করতে পারে)। অক্টাভ বিনামূল্যে বিকল্প, তবে আমি সিগন্যাল প্রসেসিং সরঞ্জামগুলির নিজস্ব বা সফ্টওয়্যারটি ব্যবহার না করায় মানের গুণগত মান দিতে পারি না।


এর জন্য দুর্দান্ত গ্রন্থাগার হ'ল github.com/worldveil/dejavu । পাইথন, ওপেন সোর্স, এমআইটি লাইসেন্সযুক্ত এবং অডিও স্বীকৃতি এবং ফিঙ্গারপ্রিন্ট করে।
লোলারকোস্টার 16

scipyবাস্তুতন্ত্রের ম্যাটল্যাবের প্রচুর কার্যকারিতা রয়েছে।
ডার্লিসন রডরিগস

2

আপনি পাই অডিও অ্যানালাইসিসও পরীক্ষা করতে পারেন : এটি প্যাটার্ন সনাক্তকরণ এবং কয়েকটি অডিও বৈশিষ্ট্য বাস্তবায়নের জন্য উন্মুক্ত গ্রন্থাগারগুলিকে একত্রিত করে। পাই অডিও অ্যানালাইসিসে প্রয়োগ করা কয়েকটি উদাহরণ অ্যাপ্লিকেশন , যা আপনার আকর্ষণীয় মনে হতে পারে:

  • নীরবতা অপসারণ
  • স্পিকার ডায়রিয়েশন
  • এসভিএম, কেএনএন, ইত্যাদি ব্যবহার করে বিভাগের শ্রেণিবিন্যাস (এবং প্রশিক্ষণ)
  • যৌথ বিভাজন-শ্রেণিবিন্যাস (এইচএমএম ব্যবহার করে)
  • অডিও থাম্বনেইলিং
  • অডিও সামগ্রী দৃশ্যায়ন

0

আপনি এসেন্টিয়া অডিও বিশ্লেষণ সি ++ লাইব্রেরি ব্যবহার করতে পারেন , এতে পাইথন বাইন্ডিং রয়েছে। আপনি অজগর / স্কিপি পরিবেশ এবং এসেনটিয়ার সাথে আসা প্রচুর অডিও / সঙ্গীত বিশ্লেষণ অ্যালগরিদমের সমস্ত সুবিধা নেবেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.