100% হিট রেট সম্ভাব্যতা এবং 0% ভুয়া অ্যালার্ম সম্ভাবনা সহ ডি প্রাইম


10

আমি পুরানো এবং নতুন আইটেম সনাক্তকরণ জড়িত একটি মেমরি টাস্কের জন্য ডি প্রাইম গণনা করতে চাই । আমার সমস্যাটি হ'ল কিছু বিষয় হিট রেট 1 এবং / অথবা ভুয়া অ্যালার্মের হার 0, যা সম্ভাব্যতাগুলিকে যথাক্রমে 100% এবং 0% করে তোলে।

জন্য সূত্র ঘ মৌলিক হয় d' = z(H) - z(F), যেখানে z(H)এবং z(F)হিট হার এবং মিথ্যা সংকেত যথাক্রমে z- র বদলে দেয় হয়।

জেড ট্রান্সফর্মটি গণনা করতে, আমি এক্সেল ফাংশন NORMSINV (অর্থাত্ z(H)=NORMSINV(hit rate)) ব্যবহার করি। তবে, হিট রেট বা ভুয়া অ্যালার্ম রেট যথাক্রমে 1 বা 0 হলে, ফাংশনটি একটি ত্রুটি প্রদান করে। এটি কারণ z ট্রান্সফর্ম, যেমন আমি বুঝতে পেরেছি, আরওসি বক্ররেখার অধীনে অঞ্চলটি নির্দেশ করে, যা গাণিতিকভাবে 100% বা 0% সম্ভাবনার পক্ষে অনুমতি দেয় না। সেক্ষেত্রে সিলিং পারফরম্যান্স সহ আমি কীভাবে সাবজেক্টের জন্য ডি 'গণনা করব তা নিশ্চিত নই।

একটি ওয়েবসাইট 1 এবং 0 হারের পরিবর্তে 1 - 1 / (2N) এবং 1 / 2N এর পরিবর্তে সর্বাধিক সংখ্যক হিট এবং ভুয়া অ্যালার্মের প্রস্তাব দেয়। অন্য একটি ওয়েবসাইট বলছে "H বা F উভয়ই 0 বা 1 হতে পারে না (যদি থাকে তবে সামান্য উপরে বা নীচে সামঞ্জস্য করুন)"। এটি নির্বিচারে মনে হয়। কারও কি এ সম্পর্কে মতামত আছে বা আমাকে সঠিক সংস্থানগুলিতে নির্দেশ করতে চান?

উত্তর:


13

স্ট্যানিসলাউ এবং টোডোরভ (১৯৯৯) এর জিরো বা ওয়ান হিট এবং মিথ্যা-বিপদের হারের শিরোনামে এর একটি ভাল আলোচনা হয়েছে ।

তারা এই চূড়ান্ত মানগুলির মোকাবিলার জন্য কয়েকটি পদ্ধতির উপকারিতা এবং বিধিগুলি আলোচনা করে, যার মধ্যে রয়েছে:

  • পরিবর্তে মতো প্যারাম্যাট্রিক পরিসংখ্যান ব্যবহার করুন (ক্র্যাগ, 1979)ডি Ad

  • পরিসংখ্যান গণনা করার আগে একাধিক বিষয় থেকে সমষ্টিগত ডেটা (ম্যাকমিলান এবং কাপলান, 1985)

  • হিটের সংখ্যা এবং ভুয়া অ্যালার্মের সংখ্যায় উভয়কে 0.5 যোগ করুন এবং সংকেত পরীক্ষার সংখ্যা এবং শব্দ শোনার সংখ্যার সাথে 1 যোগ করুন; লগলাইনার পদ্ধতির ডাব করা (হাউটাস, 1995)

  • হার এবং ১ এর সাথে প্রতিস্থাপন করে কেবলমাত্র চূড়ান্ত মানগুলি সামঞ্জস্য করুন যেখানে সংকেত বা শোনার ট্রায়ালগুলির সংখ্যা (ম্যাকমিলান এবং কাপলান, 1985)( এন - ০.০ ) / এন এন0.5/n(n0.5)/nn

পছন্দটি শেষ পর্যন্ত আপনার উপর নির্ভর করে। ব্যক্তিগতভাবে আমি তৃতীয় পদ্ধতির পছন্দ করি। প্রথম পদ্ধতির অপূর্ণতা আছে যে সাথে আরও বেশি পরিচিত আপনার পাঠকদের কাছে কম ব্যাখ্যামূলক । যদি আপনি একক-বিষয় আচরণে আগ্রহী হন তবে দ্বিতীয় পদ্ধতিটি উপযুক্ত নাও হতে পারে। চতুর্থ পদ্ধতির পক্ষপাতদুষ্ট কারণ আপনি আপনার ডেটা পয়েন্টগুলি সমানভাবে আচরণ করছেন না।ডি Ad


ম্যাকমিলান ও কাপলান একটি জনপ্রিয় রেফারেন্স তবে আমি বিশ্বাস করি যে গ্রীক বা রাশিয়ান লেখক আছেন যারা তাদের একই পরামর্শের জন্য পূর্বাভাস দেন ... নামটি মনে রাখা আমার পক্ষে খুব দীর্ঘ। এস এন্ড টি সম্পর্কে আমার তাত্ক্ষণিক দৃষ্টিভঙ্গি এটি খুব ব্যাপক নয় তবে এটি আমাকে মনে করিয়ে দেয় যে আমি সম্ভবত 'এ'র উল্লেখ না করেই ভুল করেছি। অবশ্যই, একবার আপনি এটি করার পরে আপনাকে এটি বোঝাতে হবে যে এটির অর্থ কী অ-প্যারাম্যাট্রিকগুলিতে স্যুইচ করা means
জন

6

উভয় সাইটই একই জিনিসটির পরামর্শ দিচ্ছে তবে একটি নিয়মিত সামঞ্জস্যতার পরিমাণ নির্বাচন করার জন্য একটি উপায় প্রকাশ করছে। এটি বেশিরভাগ লোককে দায়ী করা হয়েছে তবে আমি মনে করি না যে কেহ জানে এটি আগে সত্যিকার অর্থে এসেছিল। বিভিন্ন ক্ষেত্রের সিগন্যাল শনাক্তকরণে একটি আলাদা সেমিনাল বই বা লেখক রয়েছে। সবচেয়ে গুরুত্বপূর্ণটি হ'ল আপনি নির্বাচন করা পদ্ধতিটি যুক্তিসঙ্গত।

আপনার পোস্ট করা একটি পদ্ধতিটি বোঝাতে নেওয়া হয় যে আপনার যদি আইটেমগুলির একটি বড় সেট (2 এন) থাকে তবে আপনি কমপক্ষে একটি ত্রুটি সনাক্ত করতে সক্ষম হয়েছিলেন। যদি সমস্যাটি সম্পর্কে ভাবার যুক্তিসঙ্গত উপায় হয় তবে আপনি হয়ে গেছেন। আমি সন্দেহ করি এটি একটি স্মৃতি পরীক্ষার জন্য। ভবিষ্যতে আপনি বীমা বাড়ানোর জন্য এন বাড়াতে চাইতে পারেন এটি হওয়ার সম্ভাবনা খুব কম। তবুও, যদি আপনি এটি অন্যভাবে বিবেচনা করেন তবে পদ্ধতিটি উদ্ধারযোগ্য। আপনি একই সংখ্যক মেমরি আইটেমের দুটি রানের একটি অনুমানিক গড়টি সামঞ্জস্য করছেন। সেক্ষেত্রে আপনি বলছেন যে পরীক্ষার আর একটি দৌড়ে (নতুন আইটেম ধরে নেওয়া বা তারা পুরানো সবগুলি ভুলে গেছে) একটি ত্রুটি হত। অথবা, আরও সহজভাবে, আপনি সর্বাধিক অসম্পূর্ণ স্কোর যা আপনি পরিমাপ করতে পারেন এবং একটি নিখুঁত স্কোরের মধ্যে অর্ধেক পথটি বেছে নিচ্ছেন।

এটি কোনও সাধারণ সার্বজনীন সমাধান সহ একটি সমস্যা। আপনার প্রথম প্রশ্নটি জিজ্ঞাসা করা উচিত তা হল আপনি বিশ্বাস করেন কিনা, আপনার ক্ষেত্রে আপনার খাঁটি নিখুঁত শ্রেণিবিন্যাস রয়েছে। সেক্ষেত্রে আপনার ডেটা আপনার ডেটা। যদি তা না হয় তবে আপনি বিশ্বাস করেন যে এটি নমুনায় কেবল পরিবর্তনশীল কারণ হিটগুলি 100% হতে পারে। একবার আপনি সিদ্ধান্ত নেওয়ার পরে সিদ্ধান্ত নেন যে আপনি কী বিশ্বাস করেন তার অনুমান তৈরির যুক্তিসঙ্গত উপায়গুলি বিবেচনা করতে হবে। এবং তাই নিজেকে জিজ্ঞাসা করতে হবে এটি আসলে কী।

ডি 'কী হওয়া উচিত তা নির্ধারণের সবচেয়ে সহজ উপায় হ'ল একই অবস্থায় অন্যান্য ডেটাতে নজর দেওয়া। আপনি সম্ভবত অনুমান করতে পারেন যে এই একজন অংশগ্রহীতার যথার্থতা আপনার পরবর্তী সেরা মূল্য এবং 100% (যা আপনি খুঁজে পেয়েছেন মানের হিসাবে ঠিক একই হতে পারে) এর মধ্যে অর্ধেক পথ। অথবা, এটি কিছুটা খুব সামান্য পরিমাণেও বেশি হতে পারে। অথবা এটি কেবল সেরা মানের সমান হতে পারে। আপনি যা বিশ্বাস করেন তা আপনার ডেটা ভিত্তিক সেরা উত্তরটি বেছে নিতে পারেন। পোস্ট করা আরও নির্দিষ্ট প্রশ্ন আপনাকে এখানে সহায়তা করতে পারে।

আপনার করা উচিত বীমা করানোর চেষ্টা করা যতটা সম্ভব মানদণ্ডের উপর সামান্য প্রভাব ফেলবে। আপনার ক্ষেত্রে হিট এবং এফএ-এর সামঞ্জস্যের ফলে মানদণ্ড একেবারে স্থানান্তরিত হবে না। যাইহোক, যদি আপনি হিটগুলি সামঞ্জস্য করেন, যখন এফএএস = 0.2 হয়, তবে আপনাকে কীভাবে এই সামঞ্জস্যটি মানদণ্ডের ব্যাখ্যায় প্রভাব ফেলবে তা সম্পর্কে সতর্কতা অবলম্বন করতে হবে। হিটগুলি খুব বেশি make


আপনার দৃষ্টিভঙ্গি এবং যুক্তির জন্য আপনাকে ধন্যবাদ, জন। এটা সত্যিই সাহায্য করে। আমার যোগ করা উচিত যে এন এর ক্রমবর্ধমান সংখ্যা একটি ভাল সমাধান তবে আমাদের কাজটি এফএমআরআই স্ক্যানারের অভ্যন্তরে সম্পন্ন হয় এবং আমরা বিষয়গুলি কতটা পরীক্ষামূলকভাবে তৈরি করতে পারি তা সেগুলি সীমাবদ্ধ করার আগেই তারা আমাদের ডেটা নষ্ট করে দেবে motion
রাইনার

"আপনি সম্ভবত অনুমান করতে পারেন যে এই একজন অংশগ্রহীতার যথার্থতা আপনার পরবর্তী পরবর্তী সেরা মানের যে অর্ধতম পথ এবং 100% (যা আপনি খুঁজে পেয়েছেন মানের হিসাবে ঠিক একই রকম হতে পারে) ভাল পরামর্শ"। এটি সাবজেক্ট পারফরম্যান্স র‌্যাঙ্কিংয়ের ক্রম সংরক্ষণ করবে।
রাইনার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.