বিভিন্ন সোনিক ওয়েভফর্মের মধ্যে বৈষম্যের জন্য একটি বৈশিষ্ট্য ভেক্টর ডিজাইন করা


10

নিম্নলিখিত 4 টি তরঙ্গরূপ সংকেত বিবেচনা করুন:

signal1 = [4.1880   11.5270   55.8612  110.6730  146.2967  145.4113  104.1815   60.1679   14.3949  -53.7558  -72.6384  -88.0250  -98.4607]

signal2 = [ -39.6966   44.8127   95.0896  145.4097  144.5878   95.5007   61.0545   47.2886   28.1277  -40.9720  -53.6246  -63.4821  -72.3029  -74.8313  -77.8124]

signal3 = [-225.5691 -192.8458 -145.6628  151.0867  172.0412  172.5784  164.2109  160.3817  164.5383  171.8134  178.3905  180.8994  172.1375  149.2719  -51.9629 -148.1348 -150.4799 -149.6639]

signal4 = [ -218.5187 -211.5729 -181.9739 -144.8084  127.3846  162.9755  162.6934  150.8078  145.8774  156.9846  175.2362  188.0448  189.4951  175.9540  147.4631  -89.9513 -154.1579 -151.0851]

সংকেত

আমরা লক্ষ করি যে 1 এবং 2 এর সংকেত একই দেখাচ্ছে এবং সেই সংকেত 3 এবং 4 একইরকম দেখায়।

আমি একটি অ্যালগরিদম খুঁজছি যা ইনপুট এন সিগন্যাল হিসাবে গ্রহণ করে এবং তাদেরকে এম গ্রুপগুলিতে ভাগ করবে, যেখানে প্রতিটি দলের মধ্যে সংকেতগুলি একই রকম are

এই জাতীয় অ্যালগরিদমের প্রথম পদক্ষেপটি সাধারণত প্রতিটি সংকেতের জন্য একটি বৈশিষ্ট্য ভেক্টরের গণনা করা হয় : ।এফআমি

উদাহরণ হিসাবে আমরা বৈশিষ্ট্যটির ভেক্টরটিকে সংজ্ঞায়িত করতে পারি: [প্রস্থ, সর্বাধিক, সর্বাধিক-মিনিট]। কোন ক্ষেত্রে আমরা নিম্নলিখিত বৈশিষ্ট্য ভেক্টর পেতে হবে:

এফ1=[13,146,245]

এফ2=[15,145,223]

এফ3=[18,181,406]

এফ4=[18,189,408]

কোনও বৈশিষ্ট্য ভেক্টরের বিষয়ে সিদ্ধান্ত নেওয়ার সময় গুরুত্বপূর্ণ বিষয়টি হ'ল অনুরূপ সংকেতগুলি একে অপরের নিকটবর্তী এবং ভিন্ন ভিন্ন সংকেতগুলি এমন বৈশিষ্ট্যযুক্ত ভেক্টরগুলি পায় যা দূরে রয়েছে feature

উপরের উদাহরণে আমরা পাই:

|এফ2-এফ1|=22.1,|এফ3-এফ1|=164,8

সুতরাং আমরা উপসংহারে পৌঁছে যেতে পারি যে সিগন্যাল 2 সিগন্যাল 3 এর চেয়ে সিগন্যাল 1 এর সাথে অনেক বেশি অনুরূপ।

বৈশিষ্ট্য ভেক্টর হিসাবে আমি সংকেতের পৃথক কোসাইন রূপান্তর থেকেও শর্তাদি ব্যবহার করতে পারি। নীচের চিত্রটি পৃথক কোসাইন রূপান্তর থেকে প্রথম 5 টি শর্ত দ্বারা সংকেতগুলির সান্নিধ্যের পাশাপাশি সংকেতগুলি দেখায়: কোসিন রূপান্তর করে

এই ক্ষেত্রে স্বতন্ত্র কোসাইন সহগগুলি হ'ল:

F1 = [94.2496  192.7706 -211.4520  -82.8782   11.2105]

F2 = [61.7481  230.3206 -114.1549 -129.2138  -65.9035]

F3 = [182.2051   18.6785 -595.3893  -46.9929 -236.3459]

F4 = [148.6924 -171.0035 -593.7428   16.8965 -223.8754]

এই ক্ষেত্রে আমরা পেতে:

|এফ2-এফ1|=141,5,|এফ3-এফ1|=498,0

উপরের সরল বৈশিষ্ট্য ভেক্টরের জন্য অনুপাতটি তেমন বড় নয়। এর অর্থ কি সহজ বৈশিষ্ট্যের ভেক্টর আরও ভাল?

এখন পর্যন্ত আমি কেবল 2 টি তরঙ্গরূপ দেখিয়েছি। নীচের প্লটটিতে কিছু অন্যান্য তরঙ্গরূপ দেখানো হয়েছে যা এই জাতীয় অ্যালগরিদমের ইনপুট হবে। এই চক্রান্তের প্রতিটি শিখর থেকে একটি সিগন্যাল বের করা হবে, শিখরের বাম দিকে নিকটতম মিনিট থেকে শুরু হয়ে শিখরের ডানদিকে নিকটতম মিনিটে থামানো হবে:চিহ্ন

উদাহরণস্বরূপ 217 থেকে 234 নমুনার মধ্যে এই প্লট থেকে সিগন্যাল 3 বের করা হয়েছিল another অন্য প্লট থেকে সিগন্যাল 4 বের করা হয়েছিল।

যদি আপনি কৌতূহলী হন; এই জাতীয় প্রতিটি প্লট স্থানের বিভিন্ন অবস্থানে মাইক্রোফোন দ্বারা শব্দ পরিমাপের সাথে মিলে যায়। প্রতিটি মাইক্রোফোন একই সংকেত গ্রহণ করে তবে সংকেতগুলি সময়মতো সামান্য স্থানান্তরিত হয় এবং মাইক্রোফোন থেকে মাইক্রোফোনে বিকৃত হয়।

বৈশিষ্ট্য ভেক্টরকে ক্লাস্টারিং অ্যালগরিদমে যেমন কে-মানে প্রেরণ করা যেতে পারে যা একে অপরের নিকটবর্তী বৈশিষ্ট্য ভেক্টরগুলির সাথে সংকেতগুলিকে একসাথে গ্রুপ করবে।

আপনারা কারও কাছে এমন কোনও বৈশিষ্ট্য ভেক্টর ডিজাইন করার অভিজ্ঞতা বা পরামর্শ আছে যা তরঙ্গাকার সংকেতকে বৈষম্যমূলক করতে ভাল হবে?

এছাড়াও আপনি কোন ক্লাস্টারিং অ্যালগরিদম ব্যবহার করবেন?

কোনও উত্তরের জন্য অগ্রিম ধন্যবাদ!


কোনও একটি এম টেম্পলেটগুলির সাথে ইনপুট সিগন্যালের ভাল-ডল ডট পণ্য সম্পর্কে কী? আপনি সর্বনিম্ন-স্কোয়ার-ত্রুটিযুক্ত এমন একটিটিকে গ্রহণ করবেন। আমার কাছে এটিই যেখানে আমি শুরু করব। আপনি কি কোনও সুযোগে এরকম কিছু চেষ্টা করেছেন?
স্পেসি

হাই মোহাম্মদ! সমস্যাটি হ'ল আমি তরঙ্গকার্যগুলি আগাম জানি না। আমি শিখরের চারপাশে সমস্ত সিগন্যালে আগ্রহী এবং তাদের অনেকগুলি বিভিন্ন ফর্ম থাকতে পারে যা আমি আগে থেকে জানি না।
অ্যান্ডি

এই ভেক্টরগুলিকে সরাসরি "বৈশিষ্ট্য" হিসাবে ব্যবহার করার চেয়ে নতুন বৈশিষ্ট্যগুলি অনুসন্ধান করার চেষ্টা করার কারণ কী? (যদিও তাদের একই দৈর্ঘ্য হতে হবে)। কে-অর্থের ক্ষেত্রে অর্জিত সংকেতের মিনিমায় আহৃত ছোট ছোট ভেক্টরগুলির মধ্যে "দূরত্বগুলি" গুছিয়ে নেওয়ার ক্ষেত্রে প্রথমে গণনা করা হবে এবং তারপরে অ্যালগরিদম তাদের ন্যূনতম বৈকল্পিকের কে-সেটগুলিতে একটি গ্রুপিং সন্ধান করার চেষ্টা করবে যা কি আপনি পরে মনে হয়।
এ_এ

হাই এ_এ! 1. ভেক্টরগুলির মাত্রা হ্রাস পেয়েছে। পৃথক কোসাইন সহগগুলি ব্যবহার করার সময় 18 থেকে 5 পর্যন্ত সংকেত 3 এর ক্ষেত্রে। 2. একটি স্মুথিং ঘটছে। সংকেতগুলি গোলমাল, এবং আমি দ্রুত ওঠানামাতে আগ্রহী নই।
অ্যান্ডি

3
মেশিন লার্নিং লোকেদের যুক্তি দেওয়া উচিত যে আপনার কখনই তথ্য ফেলে দেওয়া উচিত নয় - সিস্টেমকে সব কিছু শিখতে হবে। অবশ্যই, তারা একই লোক যারা অ্যালগরিদমগুলি ডিজাইন করেন যা চালাতে দশ মিলিয়ন বছর সময় লাগবে, তবে বিষয়টি কিছুটা যোগ্যতা ছাড়াই নয়। সংক্ষেপে, আপনি যতটা সম্ভব কম তথ্য ফেলে দিতে এবং কী বাকী রয়েছে তা শিখতে চান। এটি আমাকে এমন একটি সমস্যা হিসাবে আঘাত করে যা একটি বায়েশিয়ান কাঠামোর মধ্যে করা উচিত (স্পষ্টতই, যেহেতু আজকাল বেশিরভাগ সিগন্যাল প্রসেসিং হওয়া উচিত) যদিও এর অর্থ এই নয় যে মূল বৈশিষ্ট্যগুলি কাজ করা গুরুত্বপূর্ণ নয়।
হেনরি গোমারসাল

উত্তর:


2

আপনি সিগন্যালগুলি পৃথক করার জন্য কেবলমাত্র উদ্দেশ্যমূলক মানদণ্ড চান বা কারও কথায় কান দেওয়ার সময় তাদের মধ্যে কিছুটা মিল রয়েছে তা গুরুত্বপূর্ণ? অবশ্যই আপনাকে কিছুটা দীর্ঘ সিগন্যালগুলিতে সীমাবদ্ধ করতে হবে (1000 টিরও বেশি নমুনা)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.