ত্রুটির ব্যবস্থা কীভাবে ব্যাখ্যা করবেন?


41

আমি একটি নির্দিষ্ট ডেটাসেটের জন্য ওয়েকার মধ্যে শ্রেণিবদ্ধ করছি I've তবে, এখন আমি এটি একটি সংখ্যাসূচক বৈশিষ্ট্যের জন্য চালাচ্ছি এবং আউটপুটটি হ'ল:

Correlation coefficient                 0.3305
Mean absolute error                     11.6268
Root mean squared error                 46.8547
Relative absolute error                 89.2645 %
Root relative squared error             94.3886 %
Total Number of Instances               36441 

আমি কীভাবে এটি ব্যাখ্যা করব? আমি প্রতিটি ধারণাকে গুগল করার চেষ্টা করেছি কিন্তু আমার দক্ষতার ক্ষেত্রে পরিসংখ্যান মোটেও নয় বলে আমি বেশি কিছু বুঝতে পারি না। আমি পরিসংখ্যানের দিক থেকে একটি ELI5 প্রকারের উত্তরকে প্রশংসা করব।

উত্তর:


52

আসুন যেমন সুদ প্রকৃত মূল্য বোঝাতে এবং মান কিছু অ্যালগোরিদম ব্যবহার করে আনুমানিক ।θθθ^

সম্পর্কটি আপনাকে জানায় যে কতটা এবং related সম্পর্কিত। এটি এবং মধ্যে মান দেয় , যেখানে কোনও সম্পর্ক নয়, খুব শক্তিশালী, লিনিয়ার সম্পর্ক এবং একটি বিপরীতমুখী রৈখিক সম্পর্ক (অর্থাত্ বৃহত্তর মানগুলি , বা ভাইস এর ছোট মানগুলি নির্দেশ করে) বিপরীতভাবে)। নীচে আপনি সম্পর্কের একটি সচিত্র উদাহরণ পাবেন।θ - 1 1 0 1 - 1 θ θθθ^11011θθ^

সম্পর্কের উদাহরণ

(উত্স: http://www.mathsisfun.com/data/correlation.html )

গড় পরম ত্রুটি হ'ল:

MAE=1Ni=1N|θ^iθi|

মূলের স্কোয়ার ত্রুটিটি হ'ল:

RMSE=1Ni=1N(θ^iθi)2

আপেক্ষিক পরম ত্রুটি :

RAE=i=1N|θ^iθi|i=1N|θ¯θi|

যেখানে এর একটি গড় মান ।θ¯θ

রুট আপেক্ষিক স্কোয়ার ত্রুটি:

RRSE=i=1N(θ^iθi)2i=1N(θ¯θi)2

আপনি দেখতে পাচ্ছেন যে সমস্ত পরিসংখ্যান সত্যের মানগুলিকে তাদের অনুমানের সাথে তুলনা করে তবে কিছুটা ভিন্ন উপায়ে এটি করুন। তারা সবাই আপনাকে বলবে যে "কতটা দূরে" estimated আসল মান থেকে আপনার আনুমানিক মান । কখনও কখনও স্কোয়ার শিকড় ব্যবহার করা হয় এবং কখনও কখনও নিখুঁত মানগুলি - এটি কারণ কারণ বর্গাকার শিকড় ব্যবহার করার সময় চূড়ান্ত মানগুলির ফলাফলের উপর আরও বেশি প্রভাব থাকে (দেখুন স্ট্যান্ডার্ড বিচ্যুতির ক্ষেত্রে নিরঙ্কুশ মান গ্রহণের পরিবর্তে পার্থক্যটি কেন বর্গাকার? বা ম্যাথওভারফ্লোতে )।θ

ইন এবং আপনি কেবল সেই দুটি মানের মধ্যে "গড়পড়তা পার্থক্য" তাকান - তাই আপনি তাদের আপনার valiable স্কেল, (অর্থাত তুলনায় ব্যাখ্যা 1 পয়েন্ট একটি হল এবং মধ্যে 1 পয়েন্টের পার্থক্য ।আর এম এস এম এস θ θ θMAERMSEMSEθθ^θ

ইন এবং তোমাদের প্রকরণ দ্বারা যারা পার্থক্য ভাগ তাই তারা 0 থেকে 1 থেকে এবং যদি আপনি সংখ্যাবৃদ্ধি আপনি 0-100 স্কেল মধ্যে সাদৃশ্য পেতে 100 দ্বারা এই মান একটি স্কেল আছে (অর্থাত শতাংশ )। মান বাআপনাকে বলতে হবে যে এর গড় মান থেকে কতটা পৃথক - তাই আপনি বলতে পারেন যে এটি কতটা about নিজের থেকে আলাদা ( বৈকল্পিকের সাথে তুলনা করুন )। সে কারণে পদক্ষেপগুলির নাম দেওয়া হয়েছে "আপেক্ষিক" - এগুলি আপনাকে স্কেলের সাথে সম্পর্কিত ফলাফল দেয় ।আর আর এস θ Σ ( ¯ θ - θ আমি ) 2 Σ | ¯ θ - θ i | θ θ θRAERRSEθ(θ¯θi)2|θ¯θi|θθθ

সেই স্লাইডগুলিও পরীক্ষা করে দেখুন ।


তোমার ব্যাখ্যার জন্য ধন্যবাদ! আমি বিভিন্ন অ্যালগরিদমের পারফরম্যান্স মূল্যায়নের চেষ্টা করছি। সুতরাং উদাহরণস্বরূপ, আমি যদি এই অন্যান্য আউটপুটটি পাই (সম্পর্ক: 0.3044, এমএই: 10.832, এমএসই: ​​47.2971, আরএই: 83.163%, আরএসই: 95.2797%) এবং আমি এটি প্রথমটির সাথে তুলনা করার চেষ্টা করব, যা আমি বলতে পারি যে এটি সম্পাদিত হতে পারে? উত্তম?
FloIancu

5
বৃহত্তর সম্পর্ক এবং ছোট ত্রুটির প্রাক্কলন সহ আপনার মডেলটি বেছে নেওয়া উচিত। আপনি দেখতে পাচ্ছেন, মডেল পারফরম্যান্সের একাধিক ব্যবস্থা রয়েছে (এবং এগুলি কেবলমাত্র কয়েকটি) এবং কখনও কখনও তারা বিভিন্ন উত্তর দেয়। এটি আপনি "হ্যাঁ / না" ধরণের উত্তর পান না। মডেল নির্বাচনের কাজটি সহজ হয়ে উঠবে যদি আপনি তত্ত্বটি ধরেন, আপনি উদাহরণস্বরূপ সেই বক্তৃতাগুলি পরীক্ষা করতে পারেন ।
টিম

আপনাকে অনেক ধন্যবাদ! আমি এগিয়ে গিয়েছিলাম এবং আপনার উত্তরটিকে উত্তর হিসাবে চিহ্নিত করেছি কারণ আপনি আমাকে প্রচুর সাহায্য করেছেন!
FloIancu

1
@ টিম মিনেজ নিখুঁত ত্রুটি সম্ভবত এমএই :) হিসাবে সংক্ষেপিত হওয়া উচিত
এন্টোইন

1
@ মেওএক্স আপনি কি ধরণের রেফারেন্সগুলি খুঁজছেন? এটি মূলত একটি উদ্ধার হওয়া আরএমএসই। এ সম্পর্কে অনেক কিছুই বলার নেই ...
টিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.