অর্থ নিখুঁত ত্রুটি বা মূল মানে স্কোয়ার ত্রুটি?


58

কেন মিনিট অ্যাবসুলিউট ত্রুটি (এমএই) এর পরিবর্তে রুট মিন স্কোয়ার্ড ত্রুটি (আরএমএসই) ব্যবহার করবেন ??

ওহে

আমি একটি গণনায় উত্পন্ন ত্রুটিটি তদন্ত করছি - আমি প্রাথমিকভাবে ত্রুটিটিকে রুট মিন নরমালাইজড স্কোয়ার ত্রুটি হিসাবে গণনা করি।

কিছুটা কাছ থেকে তাকালে আমি দেখতে পাচ্ছি যে ত্রুটিটিকে স্কোয়ার করার প্রভাবগুলি অজানা আউটলেটারের দিকে ত্রুটি অনুমানটি স্কুইং করে ছোট ছোটগুলির চেয়ে বড় ত্রুটির আরও বেশি ওজন দেয় weight পূর্ববর্তী ক্ষেত্রে এটি বেশ সুস্পষ্ট।

সুতরাং আমার প্রশ্ন - কোন উদাহরণে রুট মানে স্কোয়ার্ড ত্রুটিটি গড় নিখুঁত ত্রুটির চেয়ে ত্রুটির আরও উপযুক্ত পরিমাপ হবে? পরেরটি আমার কাছে আরও উপযুক্ত বলে মনে হচ্ছে বা আমি কিছু মিস করছি?

এটি চিত্রিত করার জন্য আমি নীচে একটি উদাহরণ সংযুক্ত করেছি:

  • স্ক্যাটার প্লট একটি ভাল পারস্পরিক সম্পর্ক সহ দুটি ভেরিয়েবল দেখায়,

  • ডায়াল্টে দুটি হিস্টোগ্রামগুলি Y (পর্যবেক্ষণ) এবং Y (পূর্বাভাস) এর মধ্যে স্বাভাবিকায়িত আরএমএসই (শীর্ষ) এবং এমএই (নীচে) ব্যবহার করে ত্রুটি।

এখানে চিত্র বর্ণনা লিখুন

এই ডেটাতে কোনও উল্লেখযোগ্য বহিরাগত নেই এবং এমএই আরএমএসইয়ের চেয়ে কম ত্রুটি দেয়। অন্যের তুলনায় এক পরিমাপের ত্রুটি ব্যবহারের জন্য এম এ ই ব্যতীত অন্য কোন যুক্তিবাদী কি পছন্দযোগ্য?


9
কারণ আরএমএসই এবং এমএই দুটি ত্রুটির দুটি পৃথক ব্যবস্থা, তাদের মধ্যে একটি সংখ্যাসূচক তুলনা (যা এমএই আরএমএসইয়ের তুলনায় "কম" জোর দিয়ে জড়িত) অর্থবোধক বলে মনে হয় না। সেই রেখাটি অবশ্যই কিছু মাপদণ্ড অনুসারে মাপসই করা উচিত: সেই মাপদণ্ড যা-ই হোক না কেন অবশ্যই ত্রুটির প্রাসঙ্গিক পরিমাপ।
হোয়বার

লাইনটি সর্বনিম্ন স্কোয়ার ব্যবহার করে লাগানো হয়েছিল - তবে চিত্রটি পরিমাপ করা ত্রুটির পার্থক্য দেখানোর জন্য কেবল উদাহরণ। আমার আসল সমস্যাটি হ'ল অপেক্ষাকৃত চারটি ফাংশন পরামিতিগুলির সমাধানের জন্য কিছুটা পরিমাপযোগ্য ত্রুটি, এমএই বা আরএমএসইয়ের সমাধান করা।
ব্যবহারকারী 1665220

সুস্পষ্ট করার জন্য ধন্যবাদ. তবে আপনি কোন ত্রুটি সম্পর্কে আগ্রহী, অবিকল? ত্রুটি হইয়া বা ত্রুটি পরামিতি অনুমান ?
whuber

1
ফিট মধ্যে ত্রুটি। আমার কাছে কয়েকটি ল্যাব নমুনা রয়েছে যা y দেয় যা আমি কোনও ফাংশন ব্যবহার করে ভবিষ্যদ্বাণী করতে চাই। আমি পর্যবেক্ষক এবং পূর্বাভাসযুক্ত ডেটাগুলির মধ্যে ফিটের জন্য ত্রুটিটি হ্রাস করে 4 টি এক্সপোজারের জন্য ফাংশনটি অনুকূল করে তুলেছি।
ব্যবহারকারী 1665220

আরএমএসইতে আমরা আইটেমের সংখ্যা বিবেচনা করি (এন) n এটি এনএস এর মূল দ্বারা বিভক্ত এমএসইর মূল। এমএসইর মূলটি ঠিক আছে, তবে এন দ্বারা বিভক্ত হওয়ার পরিবর্তে এটি আরএমএস পেতে n এর মূল দ্বারা বিভক্ত। আমি অনুভব করছি যে এটি একটি নীতি হবে। বাস্তবতা হবে (এমএসই এর মূল) / এন। সেই পথে এমএই আরও ভাল।

উত্তর:


57

এটি আপনার ক্ষতির কার্যকারিতার উপর নির্ভর করে। অনেক পরিস্থিতিতে অর্থ থেকে আরও দূরে পয়েন্টগুলিতে আরও ওজন দেওয়া বুদ্ধিমানের অর্থ - যেটি, 10 দ্বারা বন্ধ হওয়া 5 এর চেয়ে দ্বিগুণ খারাপ হওয়ার থেকে দূরে such এই জাতীয় ক্ষেত্রে আরএমএসই ত্রুটির আরও উপযুক্ত পরিমাপ।

যদি দশ দ্বারা বন্ধ হয়ে যাওয়া 5 দ্বারা বন্ধ হওয়ার চেয়ে দ্বিগুণ খারাপ হয় তবে এমএই আরও উপযুক্ত।

যাই হোক না কেন, আপনি দ্বিতীয়-শেষ-শেষ বাক্যে ("এমএইএম আরএমএসই এর চেয়ে কম ত্রুটি দেয়") হিসাবে আরএমএসই এবং এমএইকে একে অপরের সাথে তুলনা করা অর্থহীন নয়। এমএই কখন আরএমএসইর চেয়ে বেশি হবে না কারণ সেগুলি গণনা করা হয়। তারা কেবল ত্রুটির একই পরিমাপের সাথে তুলনা করে বোঝায়: আপনি মেথড 1 এর জন্য আরএমএসই পদ্ধতি 2 এর জন্য আরএমএসই তুলনা করতে পারেন, বা পদ্ধতি 2 এর জন্য এমএই পদ্ধতিতে 1 থেকে এমএই করতে পারেন, তবে আপনি বলতে পারবেন না যে এমএই পদ্ধতির জন্য আরএমএসই থেকে ভাল is 1 কারণ এটি ছোট।


আমি বুঝতে পারি যে এমএই আরএমএসই-র চেয়ে কখনই উচ্চ হতে পারে না। আমি উভয়ই ত্রুটির অনুমান ব্যবহার করেছি এবং বহিরাগতদের প্রভাব সম্পর্কে ইঙ্গিত দিতে মানগুলির মধ্যে পার্থক্যটি দেখছি। উদাহরণস্বরূপ তারা যখন খুব কাছাকাছি থাকে, যখন তারা আরও আলাদা হয় আমি কী ঘটছে তা দেখার জন্য তদন্ত করি। পরিশেষে আমি এমন পরামিতিগুলির পূর্বাভাস দিতে চাই যা উপাত্তগুলিকে সর্বোত্তম করে তোলে এবং 12% এর চেয়ে 9% ত্রুটি ভাল বলে মনে হয় - আমি ঠিক নিশ্চিত করতে চেয়েছিলাম যে আমি সঠিক কারণে সঠিকটি বেছে নিচ্ছি। আপনার পরামর্শের জন্য চিয়ার্স
ব্যবহারকারী 1665220

আরএমএসই (ফলস্বরূপ এমএসই) এবং এমএইয়ের মধ্যে প্রধান পার্থক্য কীভাবে তারা ওজন ত্রুটি করে তা নয়। প্রয়োজনে আপনি ওজন ফাংশন ব্যবহার করতে পারেন। মূল পার্থক্যটি হ'ল এমএসই এল 2 স্পেসের সাথে সম্পর্কিত (এমএই তেমন কোনও জিনিস নেই)। সুতরাং উদাহরণস্বরূপ, এমএসই একটি বদ্ধ লুপ নিয়ন্ত্রণের জন্য প্রয়োজনীয় পরিমাণের পরিমাণ পরিমাপ করতে পারে যখন ই ফিডব্যাক সংকেত হয় (মনে রাখবেন একটি সিগন্যালের গড় স্কোয়ার, এই ক্ষেত্রে ত্রুটি, এটি শক্তির তুলনামূলক)। এছাড়াও অনেক গণিত এবং ফলস্বরূপ মার্কোয়ার্ড-লেভেনবার্গের মতো অ্যালগরিদম এই স্থানটিতে কাজ করে। সহজ কথায় বলতে গেলে তারা এমএসই তাদের উদ্দেশ্যমূলক কাজ হিসাবে ব্যবহার করে।
eulerleibniz

17

আপনি যখন এমএই এর পরিবর্তে (আর) এমএসই ব্যবহার করতে চান তখন এখানে আরেকটি পরিস্থিতি রয়েছে: যখন আপনার পর্যবেক্ষণগুলির শর্তসাপেক্ষ বিতরণ অসমমিত এবং আপনি একটি নিরপেক্ষ ফিট চান। (আর) এমএসই শর্তসাপেক্ষ মাধ্যম দ্বারা কমানো হয় , শর্তাধীন মধ্যস্থতার দ্বারা এমএই করা হয় । সুতরাং আপনি যদি এমএইকে ন্যূনতম করেন তবে ফিটটি মাঝারি এবং পক্ষপাতদুষ্টের কাছাকাছি থাকবে।

অবশ্যই, এই সমস্ত আপনার ক্ষতি ফাংশনের উপর নির্ভর করে।

আপনি যদি ভবিষ্যদ্বাণী বা পূর্বাভাসের মূল্যায়ন করতে এমএই বা (আর) এমএসই ব্যবহার করছেন তবে একই সমস্যা দেখা দেয় । উদাহরণস্বরূপ, কম ভলিউম বিক্রয় ডেটার সাধারণত একটি অসমমিতি বিতরণ থাকে। আপনি যদি এমএইটিকে অনুকূলিত করেন, তবে আপনি অবাক হতে পারেন যে এমএই-অনুকূল পূর্বাভাসটি একটি সমতল শূন্য পূর্বাভাস।

এটি কভার করার জন্য এখানে একটি সামান্য উপস্থাপনা দেওয়া হয়েছে , এবং এখানে এম 4 পূর্বাভাস প্রতিযোগিতায় সাম্প্রতিক আমন্ত্রিত ভাষ্য দেওয়া হয়েছে যেখানে আমি এই প্রভাবটি ব্যাখ্যা করেছি


+1 টি। ডিস্ট্রিবিউশনগুলির সাথে তুলনা করার ধারণাটি দুর্দান্ত তবে ... আপনি যেভাবে উপস্থাপন করেছেন তার মতো কোনও মেট্রিক খারাপ কিছুতে ব্যর্থ হবে না N = 1e3; set.seed(1); y = rpois(N, lambda=1); yhat = c(y[2:N],0)? ভবিষ্যদ্বাণীমূলক ঘনত্ব "পার্থক্য" ন্যূনতম হলেও yhatআসলটি অকেজো হবে। মঞ্জুর, এটি চরম ঘটনা। (আমি সম্ভবত কিছু
স্পষ্টরূপে

y^=1

স্পষ্টির জন্য আপনাকে অনেক ধন্যবাদ; আমি এখন উপস্থাপনা আরও ভাল ধারণা করতে পারেন। (হুম ... আমাকে সর্বোপরি আপনার কাগজটি ধরে রাখা দরকার :) :))
ইউএসআর 11852 বলেছেন

@ usεr11852: ইমেলের মাধ্যমে আমার সাথে নির্দ্বিধায় যোগাযোগ করুন ( ঠিকানাটি এখানে সন্ধান করুন ) - যদি আপনার মেইলটি আমার স্প্যাম ফিল্টারটিতে শেষ না হয় তবে আমি আপনাকে সেই কাগজটি খুশিতে পাঠিয়ে দেব।
এস। কোলাসা - মনিকা

@ usεr11852 আমি আপনাকে "লাইক এন =" এর পরে পুরোপুরি হারিয়ে ফেলেছি তা কী?
সাক

5

এখানে চিত্র বর্ণনা লিখুন

ইউক্যালিডিয়ান দূরত্বের ক্ষয় বর্ণনা করার আরএমএসই হ'ল একটি প্রাকৃতিক উপায়। অতএব আপনি যদি এটি 3D এ গ্রাফ করেন তবে ক্ষতিটি শঙ্কু আকারে রয়েছে, যেমন আপনি উপরে সবুজ দেখতে পাচ্ছেন। এটি উচ্চতর মাত্রার ক্ষেত্রেও প্রযোজ্য, যদিও এটির কল্পনা করা শক্ত er

এমএই শহর নগরীর দূরত্ব হিসাবে বিবেচনা করা যেতে পারে। ক্ষয়টি পরিমাপ করার কোনও উপায় এটি এতটা স্বাভাবিক নয়, যেমন আপনি নীল রঙে গ্রাফটিতে দেখতে পাচ্ছেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.