আকারগুলিতে ক্লাস্টার করা ডেটা সনাক্তকরণ


9

কিছু পাখির গান সনাক্ত ও শ্রেণীবদ্ধ করার জন্য আমি পাইথনের একটি প্রকল্পে কাজ করছি এবং আমি নিজেকে এমন একটি অবস্থানে পেয়েছি যেখানে আমাকে একটি তরঙ্গ ফাইলকে ফ্রিকোয়েন্সি বনাম সময়ের ডেটাতে রূপান্তর করতে হবে। এটি খুব একটা সমস্যা হয়ে ওঠেনি, তবে বিভিন্ন সিলেবলগুলি গ্রুপে শ্রেণিবদ্ধ করতে সক্ষম হতে, আমাকে এমন কিছু লিখতে হবে যা সনাক্ত করবে যখন ডেটাগুলি একটি নির্দিষ্ট আকারে ক্লাস্ট হবে। ডেটা দেখতে কেমন লাগে সে সম্পর্কে আপনাকে ধারণা দেওয়ার জন্য, প্লট করার সময় ডেটা কীভাবে দেখায় তা এখানে একটি চিত্র:

এখানে চিত্র বর্ণনা লিখুন

প্রতিটি স্বাক্ষরীয় (উভয় পক্ষের পৃথকীকরণের সাথে প্রতিটি আকার) পাওয়ার জন্য আমার কিছু উপায় প্রয়োজন এবং সেগুলি কোনও ভেরিয়েবল বা তাদের নিজস্ব ফাইলগুলিতে সংরক্ষণ করুন যাতে আমি সাইপাই ব্যবহার করে তাদের মধ্যে পিয়ারসন পারস্পরিক সম্পর্ক চালাতে পারি।

এছাড়াও, আমি পাইথনটিকে পছন্দ করি তবে আপনার যদি অন্যভাবে করার উপায় থাকে তবে আমি অন্য ভাষায় কোডিং করতে প্রস্তুত।

ধন্যবাদ!


আমি যা প্রস্তাব করতে চলেছি তার সাথে আমি পুরোপুরি পরিচিত নই, তবে আপনার অক্ষরের বৈশিষ্ট্যযুক্ত একটি ওয়েভলেট সহ অবিচ্ছিন্ন ওয়েভলেট ট্রান্সফর্মের মতো দেখতে একবার নজর রাখা মূল্যবান।
হেলটনবাইকার

আপনার কি কোনও আকার খুঁজে পাওয়া দরকার বা আপনি পাখিগুলিকে শ্রেণিবদ্ধ করার চেষ্টা করছেন? যদি তাই হয় লুকানো মার্কভ মডেলের শব্দটি ব্যবহার করে?
মিখাইল

উত্তর:


2

দুটি প্রশ্ন:

1 / কাছাকাছি 8 এর দশকে, আমরা 100 মিমি বা তার জন্য স্থিতিশীল পিচটি পর্যবেক্ষণ করতে পারি, তারপরে হঠাৎ 8.5s অবধি ঝরে পড়ে। এই পুরো ক্রমটি (8s থেকে 8.5s) কোনও একক সত্তা গঠন করে, বা আপনি দুটি স্তরের (স্থিতিশীল তারপর হ্রাস) দুটি সত্তা হিসাবে বিবেচনা করেন?

2 / আপনি তদারকির সাথে বা ছাড়াই কাজ করতে চান। আপনি কি আগে থেকেই "প্যাটার্নগুলি" সন্ধান করতে চান?

  • আপনি যদি তদারকি না করেই কাজ করতে চান (বলুন যে আপনি রেকর্ডিংগুলি সংগ্রহ করেছেন এবং এটির থেকে "কাঠামোগত উপস্থাপনা" তোলার লক্ষ্য নিয়েছেন) তবে আপনার সমস্যাটি ভয়েস ক্রিয়াকলাপ সনাক্তকরণের পক্ষে প্রথম ধাপে kin কেবলমাত্র "পিচনেস" মেট্রিকের সাথে সংযুক্ত হয়ে কেবলমাত্র সংকেতের তীব্রতা ব্যবহার করুন (একটি ব্রিজ রেঞ্জের স্বতঃসংশ্লিষ্ট সর্বাধিকের অনুপাত বলুন, এখানে 1kHz - 5kHz এখানে) যেখানে সক্রিয় শক্তিশালী পিচ সুর রয়েছে। এটিকে মসৃণ করতে ফলাফলের ক্রমটিকে মিডিয়েন-ফিল্টার করুন এবং তারপরে বিভিন্ন বিভাগগুলি পাওয়ার জন্য এটি প্রসারিত করুন। আপনি একবারে আপনার সিগন্যালটিকে বিভাগগুলিতে বিভক্ত করার পরে, আপনি তাদের সাথে আকর্ষণীয় জিনিস করতে পারেন। উদাহরণস্বরূপ, আপনি তাদের প্রত্যেকের জন্য একটি পিচ ট্র্যাজেক্টোরি বের করতে পারেন (প্রতিটি এফএফটি ফ্রেমের জন্য সবচেয়ে শক্তিশালী ফ্রিকোয়েন্সি শিখর বা একটি সত্য পিচ অনুমানকারী দিয়ে আরও শক্তিশালী কিছু বের করা), প্রতিটি ব্লকের মধ্যে জোড়ওয়ালা দূরত্বের একটি ম্যাট্রিক্স গণনা করতে ডিটিডাব্লু ব্যবহার করুন এবং অনুরূপ পিচ নিদর্শনগুলির গ্রুপগুলি (8: 8.5 এবং 10: 10.5 বিভাগ) সনাক্ত করতে একটি ক্লাস্টারিং অ্যালগরিদম (কে-মানে, agglomerative ক্লাস্টারিং) ব্যবহার করুন। সম্ভবত এটির নিষ্ক্রিয় পদ্ধতির উপরের অংশটি হবে - উদাহরণস্বরূপ 7.6: 8.5 এবং 9.6: 10.5 দুটি একই ব্লকের পুনরাবৃত্তি হিসাবে স্বীকৃত হবে, যখন আপনার কাছে তারা মূলত একটি একক প্যাটার্ন হতে পারে তবে আপনি এমন কিছু ব্যবহার করতে পারেনসিকুইটরের কাঠামোর এক স্তর উচ্চতর হতে হবে।

  • আপনার যদি "প্যাটার্নগুলি" এর পূর্বনির্ধারিত অভিধান থাকে তবে আপনি আপনার সিগন্যালটি লেবেল করতে চান, তবে বক্তৃতা স্বীকৃতির জন্য যে ধরণের পদ্ধতির ব্যবহার করা উচিত তা আপনি আরও ভালভাবে অনুসরণ করতে পারেন, তবে কেবলমাত্র বক্তৃতা স্বীকৃতিটি পিচটিকে বিবেচনা করে না, যদিও আপনার মধ্যে কেস পিচ একমাত্র তথ্য বিবেচনা করা হবে! একটি স্পিচ রিকগনিশন সিস্টেম একটি একক এফএসটি ডকোডিং অপারেশনে বিভাগ এবং স্বীকৃতি উভয় কাজকেই মোকাবেলা করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.