শব্দে সংকেতের উপস্থিতি নির্ধারণ করতে কোন পরিসংখ্যান ব্যবহার করা হয়?


12

এটি আমার বিশ্বাস একটি সনাক্তকারী সমস্যা:

একটি সাধারণ সমস্যা বলে মনে হচ্ছে যা আমি স্ট্যাম্পড হয়ে যাচ্ছি। মূলত, আমার আগ্রহের ব্যান্ড রয়েছে। যদি আগ্রহের এই ব্যান্ডের মধ্যে যদি সংকেত শক্তিগুলি উপস্থিত থাকে তবে আমি আমার সিগন্যালে এক্স অপারেশন করি।

আমার সমস্যাটি হ'ল কোনও সংকেত উপস্থিত থাকলে বা না থাকলে আমি কীভাবে 'সিদ্ধান্ত' নেব সে সম্পর্কে ঠিক নিশ্চিত নই। এটিতে, আমি কোনও এফএফটি করার পরে, আমি শিখর সন্ধান করতে পারি।

তবে এখন কী?

  • পরিসংখ্যানগুলি সাধারণত এই শিখরের সাথে বর্ণালীটির পার্শ্ববর্তী গড়ের সাথে তুলনা করে? নাকি এটি অন্য কোনও পরিসংখ্যান?
  • কোনও সংকেত উপস্থিত রয়েছে কিনা তা নির্ধারণ করার জন্য এবং সেখান থেকে চলে যাওয়ার জন্য আমি কোন পরিসংখ্যান পরিমাপ ব্যবহার করি?
  • আমি এই মানটি কীভাবে সেট করব? সাধারণ থ্রেশোল্ডিং?

প্রতিক্রিয়ার ভিত্তিতে সম্পাদনা করুন:

এই সাধারণ ক্ষেত্রে, আমি সাদা গাউসির আওয়াজে স্বর অনুমান করছি। আমি যেটি হ্যান্ডেলটি পেতে চেষ্টা করছি সেগুলি হ'ল:

  1. একজন কীভাবে একটি আরওসি বক্ররেখা উত্পন্ন করে । একজনকে কি প্রথমে সমস্ত ডেটা লেবেল করতে হবে এবং তারপরেই থ্রেশহোল্ডগুলির এক বিশাল সংখ্যার জন্য সত্য-ধনাত্মক এবং মিথ্যা-ইতিবাচক হারগুলি পেতে হবে?

  2. হ্রাস হওয়া এসএনআর কীভাবে আরওসি বক্ররেখা প্রভাবিত করে? এটি তির্যক দিকে সরানো?

  3. একটি প্রদত্ত আরওসি বক্ররেখাটি অ্যাডাপটিভ থিশোল্ডিং কী করছে যা অন্যথায় একটি অভিযোজিত প্রান্তিকতা ব্যতীত উত্পন্ন হয়েছিল?

    3a। সাধারণ যে অভিযোজিত প্রান্তিক কৌশলগুলি আমি দেখতে পারি তা সাধারণ কী?


আপনি কি ব্যাচ (অফলাইন) অ্যালগরিদম, বা ক্রমিক (অনলাইন) একটি চান? আপনার কি শব্দ এবং সংকেত পরিসংখ্যান রয়েছে (যেমন, আপনি সম্ভাবনা অনুপাতকে চিহ্নিত করতে পারেন)? যদি তা হয় তবে আপনি কি এসপিআরটি ব্যবহার করার চেষ্টা করেছেন ?
এমেরে

@ এমরে এটি অফলাইন হতে পারে। আপনি সিগন্যাল / শব্দের পরিসংখ্যান বলতে কী বোঝাতে চেয়েছেন তা আমি সত্যই জানি না, আমার কাছে এমন একটি সেন্সর রয়েছে যা শব্দের উপস্থিতিতে একটি সংকেত (স্বর) পরিমাপ করবে এবং এর এসএনআর বিভিন্ন রকম হতে পারে ...
স্পেসি

তার অর্থ: গোলমাল এবং সংকেতের পরিসংখ্যানগত বৈশিষ্ট্যগুলি কী? আপনি কি গোলমাল বিতরণ জানেন? সিগন্যাল প্লাস গোলমাল বিতরণ সম্পর্কে কি?
জেসন আর

পছন্দ করেছেন ঠিক আছে, সংকেতটি একটি সুর হবে, এবং আওয়াজটি গাউসিয়ান। আমি কিছু অনুপস্থিত করছি?
স্পেসি

হতে পারে. সাদা গাউসিয়ান? মুল বক্তব্যটি এটি তাত্ত্বিকভাবে বিশ্লেষণ করার জন্য আপনাকে গোলমাল এবং সংকেত প্লাস শোরগোলের জন্য কিছু সম্ভাবনা মডেল ধরে নেওয়া উচিত। সেই উত্তরের ভিত্তিতে আপনি এটি করতে পারেন।
জেসন আর

উত্তর:


9

এটি প্রাচীনতম সংকেত প্রক্রিয়াজাতকরণের একটি সমস্যা এবং সনাক্তকরণ তত্ত্বের পরিচিতিতে একটি সাধারণ ফর্মের মুখোমুখি হতে পারে। এ জাতীয় সমস্যা সমাধানের জন্য তাত্ত্বিক এবং ব্যবহারিক পদ্ধতি রয়েছে যা নির্দিষ্ট প্রয়োগের উপর নির্ভর করে ওভারল্যাপ হতে পারে বা নাও পারে।

Pd Pfa

PdPfaPd=1Pfa=0এবং এটি একটি দিন কল। আপনি যেমন আশা করতে পারেন, এটি এত সহজ নয়। দুটি মেট্রিকের মধ্যে একটি সহজাত বাণিজ্য রয়েছে; সাধারণত যদি আপনি এমন কিছু করেন যা একটির উন্নতি করে তবে আপনি অন্যটিতে কিছুটা অবনতি লক্ষ্য করবেন।

একটি সাধারণ উদাহরণ: আপনি যদি শব্দের পটভূমির বিরুদ্ধে স্পন্দনের উপস্থিতি সন্ধান করছেন, আপনি "আদর্শ" শব্দের স্তর থেকে উপরে কোথাও একটি প্রান্তিক সেট নির্ধারণ করতে এবং আপনার সনাক্তকরণের পরিসংখ্যান ভঙ্গ হলে আগ্রহের সংকেতের উপস্থিতি নির্দেশ করার সিদ্ধান্ত নিতে পারেন প্রান্তিকের উপরে। সত্যিই কি কম ভুয়া-অ্যালার্ম সম্ভাবনা আছে? প্রান্তিক উচ্চতম সেট করুন। তবে তারপরে, যদি এলিভেটেড থ্রেশহোল্ডটি প্রত্যাশিত সিগন্যাল পাওয়ার স্তর বা তার উপরে থাকে তবে সনাক্তকরণের সম্ভাবনা উল্লেখযোগ্যভাবে হ্রাস পেতে পারে!

PdPfa

এখানে চিত্র বর্ণনা লিখুন

একটি আদর্শ আবিষ্কারকের একটি আরওসি বক্ররেখা থাকে যা প্লটের শীর্ষটিকে আলিঙ্গন করে; এটি কোনও মিথ্যা অ্যালার্ম রেটের জন্য নিশ্চিত সনাক্তকরণ সরবরাহ করতে পারে dete বাস্তবে, একটি ডিটেক্টরটির এমন বৈশিষ্ট্য থাকবে যা দেখতে উপরের চক্রান্তগুলির মতো দেখায়; সনাক্তকরণের সম্ভাবনা বাড়ানোও মিথ্যা অ্যালার্মের হারকে বাড়িয়ে তুলবে এবং বিপরীতভাবে।

তাত্ত্বিক দৃষ্টিকোণ থেকে, অতএব, এই ধরণের সমস্যাগুলি সনাক্তকরণের কার্য সম্পাদন এবং ভুয়া-অ্যালার্ম সম্ভাবনার মধ্যে কিছুটা ভারসাম্য নির্বাচন করতে সিদ্ধ হয়। কীভাবে সেই ভারসাম্যটি গাণিতিকভাবে বর্ণিত হয় তা আবিষ্কারক পর্যবেক্ষণ করে যে এলোমেলো প্রক্রিয়াটির জন্য আপনার পরিসংখ্যানের মডেলের উপর নির্ভর করে। মডেলের সাধারণত দুটি রাজ্য বা অনুমান থাকবে:

H0:no signal is present
H1:signal is present

সাধারণত, যে পরিসংখ্যানগুলি ডিটেক্টর পর্যবেক্ষণ করে তার দুটি বিতরণের একটি হতে পারে, যা অনুসারে অনুমানটি সত্য। ডিটেক্টর তারপরে এমন এক ধরণের পরীক্ষার প্রয়োগ করে যা সত্য অনুমানটি নির্ধারণ করতে ব্যবহৃত হয় এবং সিগন্যালটি উপস্থিত রয়েছে কিনা তা নির্ধারণ করা হয়। সনাক্তকরণের পরিসংখ্যানগুলির বিতরণগুলি আপনার অ্যাপ্লিকেশনের জন্য উপযুক্ত হিসাবে বেছে নেওয়া সিগন্যাল মডেলের একটি ফাংশন choose

সাধারণ সংকেত মডেলগুলি হ'ল সংযোজনীয় সাদা গাউসিয়ান শোরগোলের (এডাব্লুজিএন) পটভূমির বিরুদ্ধে একটি পালস-প্রশস্ততা-মডুলেটেড সংকেত সনাক্তকরণ । যদিও সেই বিবরণটি ডিজিটাল যোগাযোগের জন্য কিছুটা সুনির্দিষ্ট, তবুও অনেকগুলি সমস্যা সেই জাতীয় মডেলটিতে ম্যাপ করা যেতে পারে। বিশেষত, আপনি যদি AWGN এর ব্যাকগ্রাউন্ডের বিপরীতে সময়ের সাথে স্থানীয়ভাবে স্থিত-মূল্যবান সুরের সন্ধান করেন এবং সনাক্তকারী সংকেত প্রস্থের পর্যবেক্ষণ করেন, তবে কোনও স্বন উপস্থিত না থাকলে স্ট্যাটিস্টিকের একটি রেলেইগ বিতরণ এবং যদি উপস্থিত থাকে তবে রাইশিয়ান বিতরণ থাকবে।

একবার একটি পরিসংখ্যানের মডেল তৈরি হয়ে গেলে, সনাক্তকারীর সিদ্ধান্তের নিয়মটি নির্দিষ্ট করতে হবে। আপনার আবেদনের জন্য কী বোঝায় তা নির্ভর করে এটি আপনার ইচ্ছার মতো জটিল হতে পারে। আদর্শভাবে, আপনি উভয় অনুমানের অধীনে সনাক্তকরণের পরিসংখ্যান বিতরণ সম্পর্কে আপনার জ্ঞানের উপর ভিত্তি করে, এমন কোনও সিদ্ধান্ত নিতে চাইবেন যা প্রতিটি অনুমানের সত্যতা হওয়ার সম্ভাবনা, এবং উভয় অনুমানের সম্পর্কে ভুল হওয়ার তুলনামূলক ব্যয় ( যা আমি কিছুটা সম্পর্কে আরও কথা বলব)। তাত্ত্বিক দৃষ্টিকোণ থেকে সমস্যার এই দিকটির কাছে যাওয়ার জন্য কাঠামো হিসাবে বায়েশিয়ান সিদ্ধান্ত তত্ত্বকে ব্যবহার করা যেতে পারে।

TT(t)t

TT=5Pd=0.9999Pfa=0.01

যেখানে আপনি শেষ পর্যন্ত পারফরম্যান্স কার্ভে বসে থাকার সিদ্ধান্ত নেবেন তা আপনার উপর নির্ভর করে এবং এটি একটি গুরুত্বপূর্ণ ডিজাইনের প্যারামিটার। সঠিক পারফরম্যান্স পয়েন্টটি বেছে নেওয়ার সম্ভাব্য ব্যর্থতার দুই ধরণের আপেক্ষিক ব্যয়ের উপর নির্ভর করে: আপনার ডিটেক্টরের পক্ষে এটি সংঘটিত হওয়ার সময় সংঘটনটি মিস করা বা যখন ঘটেছিল না তখনই সংকেতটির ঘটনাটি নিবন্ধ করা কি আরও খারাপ? একটি উদাহরণ: স্বয়ংক্রিয়-স্ট্রাইকব্যাক-সক্ষমতার সাথে একটি কল্পিত ব্যালিস্টিক-মিসাইল-ডিটেক্টরকে খুব ভুয়া অ্যালার্ম রেট দেওয়ার জন্য সর্বোত্তমভাবে পরিবেশন করা হবে; একটি তীব্র সনাক্তকরণের কারণে একটি বিশ্বযুদ্ধ শুরু করাই দুর্ভাগ্যজনক। কথোপকথন পরিস্থিতির একটি উদাহরণ হ'ল একটি যোগাযোগ রিসিভার যা জীবনের নিরাপত্তার জন্য ব্যবহৃত হয়; যদি আপনি সর্বাধিক আস্থা রাখতে চান যে এটি কোনও ঝামেলা বার্তা পেতে ব্যর্থ হয় না,


ধন্যবাদ জেসনআর, খুব সুন্দর পোস্ট। আমি এখনও আপনার পোস্ট হজম করছি, তবে একটি প্রশ্ন মাথায় আসে। এই আরওসি বক্ররেখাটি ঠিক কীভাবে উত্পন্ন হচ্ছে? আমি বুঝতে পারি যে আমি যে কোনও শ্রেণিবদ্ধের জন্য সত্য-ধনাত্মক এবং মিথ্যা-পজিটিভ হার পরিমাপ করি এবং এটি আরওসি বক্ররেখার একটি বিন্দু চিহ্নিত করে। সুতরাং এমন কী পরিবর্তন করা হচ্ছে যে আমি অনেকগুলি পয়েন্ট পাই যাতে আমি যে কোনও এক শ্রেণিবদ্ধের জন্য একটি বক্ররেখা তৈরি করতে পারি?
স্পেসি

1
PdPfa

1

পরিসংখ্যান হ'ল সম্ভাবনা অনুপাত (এলআর), এবং পরীক্ষাটি একটি প্রান্তিকের তুলনায় এলআরের তুলনা। আপনি হর মধ্যে নাল হাইপোথিসিস সম্ভাবনা স্থাপন ঐতিহ্য অনুসরণ করেন, তাহলে আপনি পক্ষে সিদ্ধান্ত নেন বিকল্প হাইপোথিসিস ( বিরুদ্ধে নাল হাইপোথিসিস ) যদি এল আর পর্যাপ্ত উচ্চ। অনুপাত যত বেশি, আপনার আত্মবিশ্বাস তত বেশি। আপনি যদি ইতিমধ্যে ডেটা সংগ্রহ করে থাকেন তবে এটি আপনি পরীক্ষা করবেন। আপনি যদি ডেটা টুকরা-খাবার আসার সাথে সাথে সিদ্ধান্ত নিতে চান, আপনি এসপিআরটি এর মতো ক্রমিক পরীক্ষার ব্যবহার করতে পারেন ।

এই পর্যায়ে আপনি হাইপোথিসিস টেস্টিং বা সিদ্ধান্ত তত্ত্ব (আরও সাধারণ) সম্পর্কিত একটি বই থেকে উপকৃত হতে পারেন ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.