"ইন্টিগ্রালের গড়" এর চেয়ে আরও ভাল নাম আছে কি?


12

আমি আমার ব্যবসা বিক্রি করে থ্রটল পজিশন সেন্সর (টিপিএস) পরীক্ষা করছি এবং আমি থ্রটল শ্যাফটের ঘূর্ণনের ভোল্টেজের প্রতিক্রিয়াটির মুদ্রণ করেছি। একটি টিপিএস হ'ল rot 90 or পরিসীমা সহ একটি ঘূর্ণমান সংবেদক এবং আউটপুট সম্পূর্ণ উন্মুক্ত 5V (বা সেন্সরের ইনপুট মান) সহ প্রাথমিক ওপেনিং 0 এবং 0.5V এর মধ্যে কিছুটা মান হিসাবে হয়। আমি প্রতি 0.75 ° ভোল্টেজ পরিমাপ নিতে একটি পিআইসি 32 কন্ট্রোলারের সাথে একটি পরীক্ষা বেঞ্চ তৈরি করেছি এবং কালো রেখা এই পরিমাপগুলিকে সংযুক্ত করে।

আমার পণ্যগুলির মধ্যে একটিতে স্থানীয় রেখাচিত্রমালা, কম প্রশস্ততার বিভিন্নতা আদর্শ রেখা থেকে দূরে (এবং এর নীচে) করার প্রবণতা রয়েছে। এই স্থানীয় স্থানীয় "dips" পরিমাণযুক্ত করার জন্য আমার অ্যালগরিদম সম্পর্কে; ডিপগুলি পরিমাপ করার প্রক্রিয়াটির জন্য একটি ভাল নাম বা বিবরণ কী? (পুরো ব্যাখ্যা অনুসরণ করে) নীচের ছবিতে, প্লটটির বাম তৃতীয় অংশে ডুব দেখা দেয় এবং আমি এই অংশটি পাস করব বা ব্যর্থ হব তা প্রান্তিক ক্ষেত্রে:

সন্দেহজনক অংশটি মুদ্রণ করুন

সুতরাং আমি আমার অন্ত্রের অনুভূতির পরিমাণ নির্ধারণের জন্য একটি ডিপ ডিটেক্টর ( অ্যালগোরিদম সম্পর্কে স্ট্যাকওভারফ্লো ক্যু ) তৈরি করেছি। আমি প্রথমে ভেবেছিলাম আমি "অঞ্চল" পরিমাপ করছি। এই গ্রাফটি উপরের প্রিন্টআউট এবং গ্রাফিকভাবে অ্যালগরিদম ব্যাখ্যা করার জন্য আমার প্রচেষ্টার উপর ভিত্তি করে। 17 এবং 31 এর মধ্যে 13 টি নমুনার জন্য স্থায়ী একটি নিমজ্জন রয়েছে:

নমুনাযুক্ত ডেটা "ডিপ" দিয়ে দেখানো হয়েছে magn

পরীক্ষার ডেটা একটি অ্যারেতে যায় এবং আমি একটি ডেটা পয়েন্ট থেকে পরের দিকে "বৃদ্ধি" করার জন্য আরও একটি অ্যারে তৈরি করি, যাকে আমি বলি । গড় এবং মানক বিচ্যুতি পেতে আমি একটি লাইব্রেরি ব্যবহার করি ।deltasdeltas

অ্যারের বিশ্লেষণ নীচের গ্রাফটিতে প্রতিনিধিত্ব করা হয়েছে, যেখানে উপরের গ্রাফ থেকে opeালু সরিয়ে ফেলা হয়েছে। মূলত, আমি এটিকে এক্স অক্ষ হিসাবে সমান পদক্ষেপ হিসাবে ডেটা "নরমালাইজিং" বা "আনাইটিজাইজিং" হিসাবে ভেবেছিলাম এবং আমি এখন সম্পূর্ণভাবে ডেটা পয়েন্টগুলির মধ্যে বৃদ্ধি নিয়ে কাজ করছি। এই প্রশ্নটি গবেষণা করার সময়, আমি মনে করলাম এটি হ'ল মূল ডেটারdeltasdydx

ডেরাইভেটিভ বিশ্লেষণ ...?

আমি ডেল্টাসের মধ্য দিয়ে যেখানে 5 বা ততোধিক সংলগ্ন নেতিবাচক মান রয়েছে সিকোয়েন্সগুলি সন্ধান করতে । নীল বারগুলি এমন সমস্ত ডেটা পয়েন্টগুলির একটি সিরিজ যা সমস্ত গড়ের নীচে । নীল বারগুলির মানগুলি:deltasdeltas

0.7+1.2+1.3+1.4+1.8+2.5+2.9+3.0+2.5+2.0+1.5+1.0+1.2

তাদের যোগফল , যা অঞ্চলটি (বা অবিচ্ছেদ্য) প্রতিনিধিত্ব করে। আমার প্রথম চিন্তাটি হ'ল "আমি কেবল ডেরাইভেটিভকে একীভূত করেছি" যার অর্থ হওয়া উচিত যে আমি আসল ডেটা ফিরে পাই, যদিও আমি নিশ্চিত যে এর জন্য একটি শব্দ রয়েছে term23

সবুজ রেখাটি এই "গড় নীচের নীচের মানেরগুলিতে গড়" যা ডিপের দৈর্ঘ্য দ্বারা অঞ্চলটিকে বিভক্ত করার মাধ্যমে পাওয়া যায়:

23÷13=1.77

100+ অংশের পরীক্ষার সময়, আমি সিদ্ধান্ত নিতে এসেছি যে আমার সবুজ লাইনের গড় এর কম গ্রহণযোগ্য। পুরো ডেটা সেট জুড়ে গণনা করা স্ট্যান্ডার্ড বিচ্যুতি এই ডিপগুলির জন্য কঠোর পর্যাপ্ত পরীক্ষা ছিল না, যথেষ্ট মোট ক্ষেত্র ব্যতীত এগুলি এখনও ভাল অংশগুলির জন্য আমি যে সীমা স্থির করেছিলাম তার মধ্যে পড়ে যায়। আমি পর্যবেক্ষণের স্ট্যান্ডার্ড ডেভিয়েশন বেছে নেওয়া হয়েছে সর্বোচ্চ আমি সম্ভব হবে না।2.63.0

এই অংশটি ব্যর্থ হওয়ার পক্ষে যথেষ্ট পরিমাণে স্ট্যান্ডার্ড বিচ্যুতির জন্য একটি কাটফুল সেট করা এমন অংশগুলিতে ব্যর্থ হওয়া এত কঠোর হবে যা অন্যথায় দুর্দান্ত চক্রান্ত রয়েছে বলে মনে হয়। আমার কাছে একটি স্পাইক ডিটেক্টর রয়েছে যা কোনও অংশ যদি ব্যর্থ হয় তবে ।|deltasavg|>avg+stddev

ক্যালক ১ থেকে প্রায় 20 বছর কেটে গেছে, সুতরাং দয়া করে আমার উপর সহজ হন, তবে এটি অনেকটা অনুভূত হয় যখন কোনও অধ্যাপক যখন রেসিংয়ের ক্ষেত্রে ব্যাখ্যা করার জন্য ক্যালকুলাস এবং স্থানচ্যুতি সমীকরণটি ব্যবহার করেছিলেন, কম ত্বরণ সহকারী একজন প্রতিযোগী যিনি উচ্চ কোণার গতি বজায় রাখেন তারা অন্যকে মারতে পারে প্রতিদ্বন্দ্বী পরবর্তী টার্নে আরও ত্বরণযুক্ত: পূর্ববর্তী পালাটি দ্রুত গতিতে চলেছে, উচ্চতর প্রাথমিক গতির অর্থ তার বেগের অধীনে অঞ্চল (স্থানচ্যুতি) বেশি।

আমার প্রশ্নের এটিকে অনুবাদ করতে আমার মনে হচ্ছে আমার সবুজ রেখাটি ত্বরণের মতো হবে, মূল তথ্যটির দ্বিতীয় iv

আমি ক্যালকুলাসের মূলসূত্রগুলি এবং ডেরাইভেটিভ এবং ইন্টিগ্রালগুলির সংজ্ঞাগুলি পুনরায় পড়তে উইকিপিডিয়ায় গিয়েছিলাম , সংখ্যার একীকরণ হিসাবে বিচক্ষণ পরিমাপের মাধ্যমে একটি বক্ররেখার অধীনে অঞ্চলটি যুক্ত করার জন্য উপযুক্ত শব্দটি শিখেছি । অবিচ্ছেদ্য গড় গড়ে আরও অনেক বেশি গুগল করা এবং আমি অনৈখিকতা এবং ডিজিটাল সিগন্যাল প্রসেসিংয়ের বিষয়টিতে নেতৃত্ব দিচ্ছি। অবিচ্ছেদ্য গড় ডেটা মাপার জন্য একটি জনপ্রিয় মেট্রিক বলে মনে হচ্ছে

ইন্টিগ্রালের গড় গড়ের জন্য কি কোনও শব্দ আছে? ( , সবুজ রেখা)? 1.77
... বা ডেটা মূল্যায়নের জন্য এটি ব্যবহারের প্রক্রিয়াটির জন্য?


আমার মনে হয় "গড় ডিপ" যথেষ্ট ভাল। এটির ত্বরণের মাত্রা নেই, সুতরাং এটির সাথে এটি করার কিছুই অবশ্যই নয়।
শ্রীভত্সআর

এবং আমি সামগ্রিকভাবে এই বিষয় সম্পর্কে কোন পর্যবেক্ষণ বা মন্তব্য প্রশংসা করব। এই "অন্ত্র অনুভূতি" পরিমাপটি গাণিতিকভাবে কীভাবে আরও ভালভাবে প্রকাশ করা যায় না তা নিয়ে আমি কিছুটা বিরক্ত হয়েছি am
ক্রিস কে

আপনি সম্ভবত আদর্শ রেখাটি তৈরি করতে ব্যবহার করেছিলেন এমন সমস্ত ডেটা পয়েন্ট যুক্ত করতে বা নীল দণ্ডগুলিকে ন্যায্যতা প্রমাণ করার জন্য কীভাবে বিন্দুযুক্ত লাল রেখাটি গণনা করা হয় সে সম্পর্কে আরও কিছু তথ্য যুক্ত করতে পারেন "ডেল্টাস যারা সকলের গড়ের নীচে রয়েছে?" তথ্য পয়েন্ট "? যদি এটি নৈতিকভাবে গড় থেকে গড় দূরত্ব হয় তবে এটির জন্য একটি ত্বক-শৈলীর নাম থাকা উচিত, গড় গ্রহণের সাথে অবশ্যই পৃথকীকরণের পরিবর্তে।

1
ওপি অনুরোধের মাধ্যমে ম্যাথ.এসই থেকে স্থানান্তরিত: মেটা.স্ট্যাটস.স্ট্যাকেক্সেঞ্জিং
উইলি ওয়াং

1
আমি "স্থানীয়" শব্দটি যুক্ত করে এটি পরিষ্কার করতে পারি যে প্রথম পদক্ষেপটি 1 রয়েছে - আমি @ গ্লেন_বি (অন্য গ্লেন - হাই!) এর সাথে একমত যে এটি গুরুত্বপূর্ণ is সুতরাং আমি স্থায়ীভাবে "স্থানীয় গড় ত্রুটি" প্রস্তাব করব যেখানে আমি "আদর্শ থেকে বিচ্যুতি" "ত্রুটি" থেকে সবেমাত্র যুক্তিযুক্ত করেছি। উপযুক্ত মনে হচ্ছে।
গ্লেন হুইলার

উত্তর:


3

প্রথমত, এটি আপনার প্রকল্প এবং সমস্যাটির দুর্দান্ত বর্ণনা। এবং আমি আপনার বাড়ির তৈরি পরিমাপ কাঠামোর একটি বড় অনুরাগী, যা দুর্দান্ত শীতল ... সুতরাং আপনি কেন "ইন্টিগ্রালগুলি গড় গড়" বলছেন কেন পৃথিবীতে তা বিবেচ্য নয়?

আপনি যদি আপনার কাজের কিছু বিস্তৃত অবস্থানের বিষয়ে আগ্রহী হন তবে আপনি যা করতে চান তা প্রায়শই অ্যানোমালি সনাক্তকরণ হিসাবে উল্লেখ করা হয় । এর সহজতম সেটিংয়ে এটি পূর্বের মানগুলির স্ট্যান্ডার্ড বিচ্যুতির বিরুদ্ধে একটি টাইম-সিরিজের একটি মানের তুলনা জড়িত। এর পরে নিয়মটি হল যদি যেখানে এর মান হয় সিরিজ, হল এবং মান, এবং মধ্যে পূর্ববর্তী সমস্ত মানগুলির স্ট্যান্ডার্ড বিচ্যুতি is

x[n]>αSD(x[1:n1])=>x[n] is outlier
x[n]nthSD(x[1:n1])1st(n1)thα1 বা 2 এর মতো আপনি বেছে নেওয়া কিছু উপযুক্ত প্যারামিটার হ'ল আপনি ডিটেক্টরটি যে সংবেদনশীল হতে চান তার উপর নির্ভর করে। আপনি অবশ্যই কাজ করার জন্য এই সূত্র শুধুমাত্র স্থানীয়ভাবে অভিযোজিত করতে পারে (দৈর্ঘ্য কিছু বিরতি উপর ) h
x[n]>αSD(x[nh1:n1])=>x[n] is outlier

যদি আমি সঠিকভাবে বুঝতে পারি তবে আপনি নিজের ডিভাইসগুলির পরীক্ষা স্বয়ংক্রিয় করার একটি উপায় সন্ধান করছেন, এটি হ'ল সম্পূর্ণ পরীক্ষা করার পরে কোনও ডিভাইসটিকে ভাল / ত্রুটিযুক্ত হিসাবে ঘোষণা করুন (পুরো তির্যকটি আঁকুন)। সেক্ষেত্রে কেবলমাত্র উপরের সূত্রগুলিকে সমস্ত মানের মানক বিচ্যুতির বিপরীতে তুলনা হিসাবে বিবেচনা করুন ।x[n]

ডিভাইসটিকে ত্রুটিযুক্ত হিসাবে শ্রেণিবদ্ধ করার উদ্দেশ্যে আপনি অন্যান্য নিয়মগুলি বিবেচনা করতে চাইতে পারেন:

  • যদি কোনও বিচ্যুতি (ব-দ্বীপ) সমস্ত ব-দ্বীপের এসডি-র একাধিকের চেয়ে বেশি হয়
  • যদি বিচ্যুতির বর্গফল একটি নির্দিষ্ট প্রান্তিকের চেয়ে বড় হয়
  • যদি ধনাত্মক এবং নেতিবাচক ডেল্টাসের যোগফলের অনুপাত প্রায় সমান না হয় (তবে আপনি যদি একক দিকের দৃias় পক্ষপাতের চেয়ে উভয় দিকের ছোট ত্রুটি পছন্দ করেন তবে কার্যকর হতে পারে)

অবশ্যই আপনি বুলিয়ান যুক্তি ব্যবহার করে আরও নিয়মাবলী সন্ধান করতে এবং এগুলিকে একত্র করতে পারেন তবে আমি মনে করি আপনি উপরের তিনটি দিয়ে খুব দূরে যেতে পারেন।

শেষ পর্যন্ত নয়, একবার এটি সেট আপ করার পরে আপনাকে ক্লাসিফায়ার পরীক্ষা করতে হবে (একটি শ্রেণিবদ্ধকারী একটি সিস্টেম / মডেল যা কোনও শ্রেণিতে একটি ইনপুট ম্যাপ করে, আপনার ক্ষেত্রে প্রতিটি ডিভাইসের ডেটা হয় "ভাল" বা " ত্রুটিপূর্ণ ")। প্রতিটি ডিভাইসের কর্মক্ষমতা ম্যানুয়ালি লেবেল করে একটি পরীক্ষা সেট তৈরি করুন। তারপরে আরওসি দেখুন , যা আপনার সিস্টেমটি কতটি ত্রুটিযুক্ত ডিভাইস তুলেছে সে সম্পর্কে আপনার সিস্টেমটি সঠিকভাবে রিটার্ন থেকে নেওয়া কতটি ডিভাইসের মধ্যে অফসেটটি বলে দেয়।


আমি বিশ্বাস করি "পৃথিবীতে কেন এটি গুরুত্বপূর্ণ" আপনার নিজের ব্যবহারকারীর নাম। :) কেন? ইলিয়াক ক্রেস্ট একই কারণ: আমাদের জীবনের অনন্য সমস্ত কিছুর জন্য স্বতন্ত্রভাবে শব্দগুলির প্রয়োজন। ইমো, এই QA শব্দভাণ্ডার পরিসংখ্যানের মধ্যে কতটা সীমিত তার একটি উদাহরণ। "চোখের কাছে" কী এত সহজ, তার জন্য আমাদের বিভ্রান্তিকর বা বিপরীতমুখী বর্ণনাকারীদের একত্রিত করতে হবে।
ক্রিস কে

হেই, ভাল দাগী স্যার! :) আমি যদি ক্রিয়েটিভ ব্র্যান্ডিংয়ের ভূমিতে কোনও উদ্যোগ বাদ দিয়ে থাকি তবে এটি কেবল কারণেই আমি আপনার প্রচেষ্টা এবং ধারণাগুলির বিকাশ এবং লেবেলকে সংকীর্ণ করার পরিবর্তে সাবলীলতা এবং উত্সর্গকে সমর্থন করতে বাধ্য বোধ করেছি। যেহেতু আপনি অবিচ্ছেদ্যের গড়টির নামকরণের জন্য জোর দিয়েছিলেন, তাই সাবধান হন যে আপনি "ইন্টিগ্রালের গড়" হিসাবে বিবেচনা করছেন তা আপনার ডেল্টাসের একটি সহজ মাধ্যম। এবং এর মতো, আপনার আউটলিয়াররা কেবল "গড় থেকে বিচ্যুতি" বা স্থানীয় গড় থেকে সম্ভবত বিচ্যুতি। ইন্টিগ্রালগুলিতে চিন্তা করার সুবিধাটি আমি বেশ দেখতে পাচ্ছি না, যদি না আপনার কাছে পর্যাপ্ত নমুনা পয়েন্ট না থাকে।
মানে-থেকে-অর্থ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.