আরএমএসই বনাম নির্ধারণের সহগ


21

আমি একটি শারীরিক মডেলটি মূল্যায়ন করছি এবং আমি জানতে চাই যে আমার এখানে কোন পদ্ধতি ব্যবহার করা উচিত (আরএমএসই এবং নির্ণয়ের আর 2 এর সহগের মধ্যে)

সমস্যাটি নিম্নরূপ: আমার একটি ফাংশন রয়েছে যা ইনপুট মান x, পূর্বাভাস দেয় । আমি যে মানকে y x বলি তার মানটির জন্য আমার প্রকৃত পর্যবেক্ষণও রয়েছে ।yx¯=f(x)yx

আমার প্রশ্নটি আরএমএসই বা কিসের পক্ষে মতামত রয়েছে ? আমি যে দু'দিক থেকে কাজ করছি তার জন্য উভয়কেই কাগজপত্রে ব্যবহৃত হতে দেখেছি।R2

উত্তর:


16

আমি সেগুলি উভয়ই ব্যবহার করেছি এবং এর জন্য আমার কয়েকটি পয়েন্ট রয়েছে।

  • Rmse দরকারী কারণ এটি ব্যাখ্যা করা সহজ। সকলেই জানেন এটি কী।
  • Rmse আপেক্ষিক মান প্রদর্শন করে না। তাহলে , আপনি বিশেষভাবে পরিসীমা জানতে হবে α < Y এক্স < β । যদি α = 1 , β = 1000 হয় তবে 0.2 ভাল মান is যদি α = 0 , β = 1 হয় তবে এটি আর ভাল লাগবে না।rmse=0.2α<yx<βα=1,β=1000α=0,β=1
  • পূর্ববর্তী পদ্ধতির সাথে ইনলাইন করে, আপনি জরিপ করেছেন এমন লোকেরা বা আপনি যে পরিমাপ করেছেন সেগুলি বেশিরভাগই অভিন্ন (প্রত্যেককে পণ্যটি 3 তারা দিয়ে রেট করেছে) এবং আপনার ফলাফলগুলি দেখতে ভাল লাগে কারণ ডেটা আপনাকে সহায়তা করেছিল এই সত্যটি লুকানোর জন্য rmse একটি ভাল উপায়। যদি ডেটাটি কিছুটা এলোমেলো হয়ে থাকে তবে আপনি আপনার মডেলটি বৃহস্পতির প্রদক্ষেত্রে দেখতে পাবেন।
  • সাধারণ আর 2 এর চেয়ে সংকল্পের সমন্বিত সহগ ব্যবহার করুনR2
  • সংকল্পের গুণাগুণটি ব্যাখ্যা করা কঠিন। এমনকি ক্ষেত্রের লোকদেরও \ পাদটীকা like এর মতো একটি পাদটীকা টিপ দরকার determination এই মানটি ভবিষ্যতের ফলাফলগুলি মডেল দ্বারা কতটা ভাল ভবিষ্যদ্বাণী করা যেতে পারে তা দেখায়। সর্বনিম্ন হিসাবে 0 এবং সর্বোচ্চ হিসাবে 1 নিতে পারে}R2
  • দৃ model় সংকল্পের গুণটি আপনার মডেলটি কতটা ভালভাবে একটি ঘটনা ব্যাখ্যা করে তা বলার ক্ষেত্রে খুব সুনির্দিষ্ট। যদি , নির্বিশেষেR2=0.2 মূল্যবোধ, আপনার মডেল খারাপ। আমি বিশ্বাস করি একটি ভাল মডেলের জন্য কাট অফ পয়েন্টটি ০..6 থেকে শুরু হয় এবং আপনার যদি ০. 0.-০.৮ এর কাছাকাছি কিছু থাকে তবে আপনার মডেলটি খুব ভাল।yx
  • পুনরুদ্ধার করতে, বলেছে যে, আপনার মডেলটি দিয়ে আপনি আসল ডেটাতে যা চলছে তার 70% ব্যাখ্যা করতে পারবেন। বাকি, 30%, এমন একটি জিনিস যা আপনি জানেন না এবং আপনি ব্যাখ্যা করতে পারবেন না। এটি সম্ভবত কারণ বিভ্রান্তিকর কারণ রয়েছে বা আপনি মডেলটি তৈরিতে কিছু ভুল করেছেন।R2=0.7
  • কম্পিউটার বিজ্ঞানে প্রায় সবাই rmse ব্যবহার করে। সামাজিক বিজ্ঞান ব্যবহারপ্রায়শই আর 2R2
  • আপনার যদি আপনার মডেলের পরামিতিগুলি ন্যায়সঙ্গত করার প্রয়োজন না হয় তবে কেবল rmse ব্যবহার করুন। যাইহোক, আপনার মডেলটি তৈরি করার সময় আপনার পরামিতিগুলি লাগাতে, অপসারণ বা পরিবর্তন করতে হবে, আপনাকে ব্যবহার করা দরকারএই প্যারামিটারগুলি ডেটাটিকে সর্বোত্তমভাবে ব্যাখ্যা করতে পারে তা দেখানোর জন্য আপনাকে আর 2করতে হবে।R2
  • আপনি যদি ব্যবহার করবেন করেন তবে কোডটি আর ভাষায় ব্যবহার করুন। এটিতে গ্রন্থাগার রয়েছে এবং আপনি সমস্ত ফলাফল পাওয়ার জন্য এটি কেবল ডেটা দেন।R2

একজন উচ্চাকাঙ্ক্ষী কম্পিউটার বিজ্ঞানী, পরিসংখ্যান সম্পর্কে লিখতে রোমাঞ্চকর ছিল। আপনার সত্যই।


8
This value shows how well future outcomes can be predicted by the model- এটি অত্যন্ত বিভ্রান্তিকর এবং কেবল সাধারণ ভুলের দিকে ঝুঁকছে । কোনও গ্যারান্টি নেই যে প্রদত্ত মডেলটিতে দৃ determination়তার একটি উচ্চ সহগ ভবিষ্যতের ফলাফলগুলি কতটা ভালভাবে ভবিষ্যদ্বাণী করা হবে তার সাথে সম্পর্কিত।
নবী 6000091

5
আমি মনে করি " যদি আপনার মডেলটি খারাপ হয়R2=0.2 ", " আপনার মডেলটি খুব ভালR2=0.70.8 " এর মত বিবৃতিগুলি স্থূল সাধারণীকরণ। যদি সত্যিকারের বিশ্বের সমস্যার জন্য কিছু থাকে তবে 0.8 এর খুব জোরালো সমস্যাগুলিকে R2
দৃ strongly়ভাবে

3
যদি Y 2 মানগুলি নির্বিশেষে = 0.2 হয় তবে আপনার মডেলটি খারাপ। আমি বিশ্বাস করি একটি ভাল মডেলের জন্য কাট অফ পয়েন্টটি ০..6 থেকে শুরু হয় এবং আপনার যদি ০. 0.-০.৮ এর কাছাকাছি কিছু থাকে তবে আপনার মডেলটি খুব ভাল। এটি আপনি যে ক্ষেত্রের সাথে কাজ করছেন তার উপর এটি নির্ভর করে Ima আপনি 0.2 এর আর 2 দিয়ে বিশ্বের সবচেয়ে ধনী ব্যক্তি হয়ে উঠবেন । R2R2
জান হ্যাকেনবার্গ

আমি জান হ্যাকেনবার্গ এবং নবী 60000 এর সাথে একমত। আপনার উত্তরের অংশগুলি সংজ্ঞায়িতভাবে ভুল এবং আমি বুঝতে পারি না কেন এটি স্বীকৃত উত্তর এবং লোকেদের উত্সাহ দেওয়া হচ্ছে। আসলে এর অর্থ সম্ভবত এই যে মানুষ কীভাবে ব্যাখ্যা করতে পারে তা না জেনে তাদের মেট্রিক ব্যবহার করছে ..
কর্ড কালডেমায়ার

9

আপনি যে ত্রুটিযুক্ত পরিমাপটি দিচ্ছেন তা বিবেচনাধীন নয়, একটি পরিশিষ্টে আপনার সম্পূর্ণ ফলাফল ভেক্টর দেওয়ার বিষয়টি বিবেচনা করুন। আপনার পদ্ধতির তুলনায় তুলনা করা পছন্দ করে তবে অন্য একটি ত্রুটি পরিমাপ পছন্দ করে এমন লোকেরা আপনার টেবিল থেকে এই জাতীয় মান অর্জন করতে পারে।

:R2

  • পদ্ধতিগত ত্রুটিগুলি প্রতিফলিত করে না। কল্পনা করুন আপনি বৃত্তাকার বস্তুর রেডির পরিবর্তে ব্যাস পরিমাপ করেন। আপনার 100% এর প্রত্যাশিত ওভারস্টিমেশন রয়েছে তবে এটি এখনও আর 2 এ পৌঁছতে পারেR2 1 এর কাছাকাছি পারে।

  • পূর্ববর্তী মন্তব্যের সাথে দ্বিমত পোষণ করুন যে R2 বোঝা মুশকিল। মান যত বেশি হবে তত বেশি সুনির্দিষ্ট আপনার মডেল, তবে এটি সিস্টেমেটিকাল ত্রুটিগুলি অন্তর্ভুক্ত করতে পারে।

  • সূত্রটি বোঝার জন্য সহজেই প্রকাশ করা যেতে পারে যেখানে আপনি বর্গক্ষেত্রের অবশিষ্টাংশের যোগফলের অনুপাত তৈরি করেন এবং গড় দ্বারা ভাগ করুন:

R2=1SSEmean=1(yiyi¯)2(yiy¯)2

  • Radj.2

RMSE

  • RMSERMSER2

  • rel.RMSErel.RMSE

অন্যান্য লোকেরা যেমন উল্লেখ করেছে, পছন্দটি আপনার ক্ষেত্র এবং শিল্পের অবস্থার উপর নির্ভরশীল। খুব তুলনা করার জন্য কি কোনও বহুল গ্রহণযোগ্য পদ্ধতি রয়েছে? তাদের মতো একই পরিমাপটি ব্যবহার করুন এবং আপনি আলোচনায় সহজেই আপনার পদ্ধতিগুলির সুবিধাগুলি সরাসরি সংযোগ করতে সক্ষম হন।


7

R2

আমি উভয় মেট্রিকের মধ্যে পার্থক্য বোঝার জন্য খুব সাধারণ গাইড হিসাবে নিম্নলিখিতটি ব্যবহার করব:

RMSE আপনি কিভাবে বন্ধ (অথবা পর্যন্ত) আপনার পূর্বাভাস মান প্রকৃত তথ্য আপনার মডেলকে করার চেষ্টা করছেন থেকে এসেছ একটা ধারনা দেয়। এটি বিভিন্ন অ্যাপ্লিকেশনগুলিতে দরকারী যেখানে আপনি আপনার মডেলের পূর্বাভাসের যথার্থতা এবং নির্ভুলতা বুঝতে চান (যেমন, মডেলিং গাছের উচ্চতা)।

পেশাদাররা

  1. নির্ভরযোগ্য ভেরিয়েবলকে মডেল করা হওয়ার কারণে রিপোর্ট করা মানগুলি একই ইউনিটে হওয়ায় এটি বুঝতে এবং যোগাযোগ করা অপেক্ষাকৃত সহজ।

কনস

  1. এটি বৃহত ত্রুটিগুলির প্রতি সংবেদনশীল (বৃহত্তর পূর্বাভাস ত্রুটির তুলনায় আরও ছোট ভবিষ্যদ্বাণী ত্রুটির চেয়ে বেশি শাস্তি দেয়)।

R2

পেশাদাররা

  1. আপনার নির্বাচিত ভেরিয়েবলগুলি ডেটার সাথে কতটা ফিট করে তার সামগ্রিক ধারণা দেয়।

কনস

  1. আর2আর2বা সম্ভাব্য বিকল্প হিসাবে আকাইকের তথ্যের মানদণ্ড )।

অবশ্যই, উপরেরটি নমুনা আকার এবং স্যাম্পলিং ডিজাইনের সাপেক্ষে থাকবে এবং একটি সাধারণ বোঝা যা পারস্পরিক সম্পর্ককে কার্যকারণ বলে বোঝায় না।


1

এমএই, মেনস পরম ত্রুটিও রয়েছে। আরএমএসই থেকে পৃথক, এটি বৃহত ত্রুটির ক্ষেত্রে অত্যধিক সংবেদনশীল নয়। আমি যা পড়েছি তা থেকে কিছু ক্ষেত্র আরএমএসই পছন্দ করে, অন্যরা এমএইই করে। আমি উভয় ব্যবহার করতে পছন্দ করি।


0

প্রকৃতপক্ষে, পরিসংখ্যান বিজ্ঞানীদের জন্য মডেলের সেরা ফিটটি জানতে হবে, তারপরে আরএমএসই তার দৃ research় গবেষণার লোকদের জন্য খুব গুরুত্বপূর্ণ if যদি আরএমএসই শূন্যের খুব কাছাকাছি থাকে, তবে মডেলটি সবচেয়ে উপযুক্ত।

সংকল্পের সহগ অন্যান্য বিজ্ঞানীদের যেমন কৃষি এবং অন্যান্য ক্ষেত্রগুলির পক্ষে ভাল good এটি 0 এবং 1 এর মধ্যে একটি মান it যদি এটি 1 হয় তবে মানগুলির 100% পর্যবেক্ষণ করা ডেটা সেটের সাথে মেলে। যদি এটি 0 হয়, তবে ডেটা পুরোপুরি ভিন্ন ভিন্ন। ডঃ এস.কে.খাদর বাবু, ভিআইটি বিশ্ববিদ্যালয়, ভেলোর, তামিলনাড়ু, ভারত।


0

যদি ভেক্টরগুলির একটির প্রতিটি উপাদানকে কিছু সংখ্যক যোগ করা হয় তবে আরএমএসই পরিবর্তন হয়। একই বা উভয় ভেক্টরের সমস্ত উপাদান একটি সংখ্যার দ্বারা গুণিত হয়। আর কোড অনুসরণ করে;

#RMSE vs pearson's correlation
one<-rnorm(100)
two<-one+rnorm(100)

rumis<-(two - one)^2
(RMSE<-sqrt(mean(rumis)))
cor(one,two)

oneA<-one+100

rumis<-(two - oneA)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneA,two)

oneB<-one*10
twoB<-two*10

rumis<-(twoB - oneB)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneB,twoB)
cor(oneB,twoB)^2

0

উভয়ই একই মডেলের পছন্দ হিসাবে নেতৃত্ব হিসাবে শেষ পর্যন্ত পার্থক্যটি কেবলমাত্র মানসম্পন্ন, কারণ আরএমএসই গুনের সংখ্যা বা আর স্কোয়ারে পর্যবেক্ষণের সংখ্যা হয়, এবং পরবর্তীটির ডিনমিনেটর সমস্ত মডেল জুড়ে ধ্রুবক থাকে (কেবলমাত্র একটি ব্যবস্থার বিপরীতে প্লট করুন) 10 টি বিভিন্ন মডেলের জন্য অন্যান্য)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.