আমি এই নিয়মটি পছন্দ করি:
আপনার যদি চোখকে গাইড করার জন্য লাইনটির প্রয়োজন হয় (যেমন একটি প্রবণতা দেখানোর জন্য যে লাইনটি স্পষ্টভাবে দৃশ্যমান হবে না), আপনার লাইনটি লাগানো উচিত নয় ।
মানুষ নিদর্শনগুলি স্বীকৃতি দেওয়ার ক্ষেত্রে অত্যন্ত ভাল (আমরা বরং বিদ্যমান প্রবণতা মিস করার চেয়ে বিদ্যমান প্রবণতাগুলি দেখার পক্ষে) of যদি আমরা লাইন ছাড়াই ট্রেন্ডটি পেতে সক্ষম না হয়ে থাকি তবে আমরা পুরোপুরি নিশ্চিত হতে পারি যে ডেটা সেটে কোনও প্রবণতা নির্ধারিতভাবে প্রদর্শিত হতে পারে না।
দ্বিতীয় গ্রাফের বিষয়ে কথা বলছি, আপনার পরিমাপের পয়েন্টগুলির অনিশ্চয়তার একমাত্র ইঙ্গিতটি হ'ল 700 ডিগ্রি সেন্টিগ্রেড এ সি এর দুটি লাল বর্গক্ষেত্র। এই দুটি ছড়িয়ে যাওয়ার অর্থ হ'ল আমি উদাহরণ স্বীকার করব না
- সি এর জন্য আদৌ একটি প্রবণতা রয়েছে: হে 1.2
- 2.0 এবং 3.6 এর মধ্যে পার্থক্য রয়েছে
- এবং নিশ্চিতভাবে বাঁকানো মডেলগুলি ডেটাকে উপভোগ করছে।
খুব ভাল কারণ দেওয়া ছাড়া। সেটা অবশ্য আবার মডেল হয়ে উঠবে।
সম্পাদনা করুন: ইভানের মন্তব্যের জবাব দিন:
আমি রসায়নবিদ এবং আমি বলব যে ত্রুটি ছাড়া কোনও পরিমাপ নেই - যা গ্রহণযোগ্য তা পরীক্ষামূলক এবং যন্ত্রের উপর নির্ভর করবে।
এই উত্তরটি পরীক্ষামূলক ত্রুটি দেখানোর বিরুদ্ধে নয় তবে এটি এটিকে দেখানো এবং আমলে নেওয়ার জন্য all
আমার যুক্তির পিছনে ধারণাটি হ'ল গ্রাফটি ঠিক একটি পুনরাবৃত্তি পরিমাপ দেখায়, সুতরাং যখন আলোচনার সময় কোনও মডেল কতটা ফিট হতে হবে (যেমন অনুভূমিক রেখা, সরলরেখা, চতুর্ভুজ, ...) এটি আমাদের পরিমাপের ধারণা দিতে পারে ত্রুটি. আপনার ক্ষেত্রে, এর অর্থ হল যে আপনি কোনও হার্ড মডেল (উদাহরণস্বরূপ থার্মোডাইনামিক বা গতিগত সমীকরণ) থাকলেও এটি চতুর্ভুজযুক্ত হওয়া উচিত - এমনকি আপনার পর্যাপ্ত ডেটা নেই, আপনি অর্থবোধক চতুষ্পদ (স্প্লাইন) ফিট করতে পারবেন না would ।
এটি উদাহরণস্বরূপ:
df <-data.frame (T = c ( 700, 700, 800, 900, 700, 800, 900, 700, 800, 900),
C.to.O = factor (c ( 1.2, 1.2, 1.2, 1.2, 2 , 2 , 2 , 3.6, 3.6, 3.6)),
tar = c (21.5, 18.5, 19.5, 19, 15.5, 15 , 6 , 16.5, 9, 9))
এখানে প্রতিটি র সি এর 95% আস্থার ব্যবধানের সাথে এক রৈখিক একসাথে ফিট রয়েছে: হে অনুপাত:
ggplot (df, aes (x = T, y = tar, col = C.to.O)) + geom_point () +
stat_smooth (method = "lm") +
facet_wrap (~C.to.O)
মনে রাখবেন যে উচ্চতর সি এর জন্য: ও অনুপাতের আত্মবিশ্বাসের ব্যবধানটি 0 এর নীচে থাকে below এর অর্থ লিনিয়ার মডেলের অন্তর্নিহিত অনুমানগুলি ভুল। তবে, আপনি উপসংহারে পৌঁছাতে পারেন যে উচ্চতর সি: হে সামগ্রীর জন্য লিনিয়ার মডেলগুলি ইতিমধ্যে অত্যধিক উপযোগী।
সুতরাং, পিছনে পদক্ষেপ এবং শুধুমাত্র একটি ধ্রুবক মান ফিট করা (অর্থাত্ কোনও টি নির্ভরতা নেই):
ggplot (df, aes (x = T, y = tar, col = C.to.O)) + geom_point () +
stat_smooth (method = "lm", formula = y ~ 1) +
facet_wrap (~C.to.O)
পরিপূরকটি হ'ল সি: ও এর উপর নির্ভরতা না রাখার মডেল:
ggplot (df, aes (x = T, y = tar)) + geom_point (aes (col = C.to.O)) +
stat_smooth (method = "lm", formula = y ~ x)
তবুও, আত্মবিশ্বাসের ব্যবধানটি একটি অনুভূমিক বা এমনকি সামান্য আরোহণের রেখাগুলিকে coverেকে দেবে।
আপনি যেতে পারেন এবং উদাহরণস্বরূপ তিনটি সি: ও অনুপাতের জন্য আলাদা অফসেটের অনুমতি দিচ্ছেন তবে সমান equalালু ব্যবহার করে।
তবে ইতিমধ্যে আরও কয়েকটি পরিমাপ পরিস্থিতিটিকে মারাত্মকভাবে উন্নতি করবে - সি এর জন্য আস্থা অন্তর কতটা সংকীর্ণ তা নোট করুন: হে = 1: 1, যেখানে আপনার কেবলমাত্র 3 এর পরিবর্তে 4 পরিমাপ রয়েছে।
উপসংহার: আপনি যদি আমার পয়েন্টগুলির সাথে তুলনা করেন তবে আমি কোন সিদ্ধান্তে সন্দেহবাদী হব, সেগুলি কয়েকটি উপলব্ধ পয়েন্টগুলিতে খুব বেশিভাবে পড়ছিল!