একচেটিয়া প্রতিরোধের জন্য ফলিত মানগুলির প্লট বনাম অবশিষ্টগুলিতে তির্যক সরল রেখাগুলি


11

আমি আমার ডেটার জন্য অবশিষ্টগুলিতে অদ্ভুত নিদর্শনগুলি পর্যবেক্ষণ করছি: এখানে চিত্র বর্ণনা লিখুন

[সম্পাদনা] দুটি ভেরিয়েবলের আংশিক রিগ্রেশন প্লট এখানে রয়েছে:

http://i.imgur.com/Lh36l.png

http://i.imgur.com/akMjB.png

[EDIT2] পিপি প্লট যুক্ত হয়েছে http://i.imgur.com/pCKFA.png

বিতরণটি ঠিকঠাক করছে বলে মনে হচ্ছে (নীচে দেখুন) তবে আমার কোনও চিহ্ন নেই যেখানে এই সরল রেখাটি আসতে পারে। কোন ধারনা? এখানে চিত্র বর্ণনা লিখুন

[আপডেট ৩১.০ UP]

দেখা যাচ্ছে যে আপনি একেবারে সঠিক ছিলেন, আমার এমন কেস ছিল যেখানে রিটুইট গণনাটি প্রকৃতপক্ষে 0 ছিল এবং এই ~ 15 টি মামলার ফলে সেই অদ্ভুত অবশিষ্টাংশের নমুনা দেখা দিয়েছে।

অবশিষ্টাংশগুলি এখন আরও ভাল দেখাচ্ছে: http://i.imgur.com/XGas9.png

আমি একটি লোয়েস লাইনের সাথে আংশিক নিয়ন্ত্রণগুলিও অন্তর্ভুক্ত করেছি। http://i.imgur.com/Jcr2M.png http://i.imgur.com/eb376.png


আপনি কি মূল ডেটাতে প্লট করা লাগানো লাইন যুক্ত করতে পারবেন?
M 27nsT

এছাড়াও, পরিসংখ্যানের উপশিরোনামগুলি "সম্প্রদায়: এনিমে" এবং "সম্প্রদায়: জ্যোতিষ" বলে, যা বোঝায় যে এই প্লটগুলি বিভিন্ন ডেটা সেট থেকে এসেছে ...
MånsT

আমার নির্ভরশীল ভেরিয়েবলগুলি শ্রেণিবদ্ধ বা 'পর্যাপ্ত ধারাবাহিক না হলে' আমার অবশিষ্টাংশগুলিতে এই ধরণের নিদর্শনগুলি দেখে মনে আছে remember
রাজা

আমি সঠিক পিপি চক্রান্ত এবং দুই চতুর্থ আংশিক প্লট জুড়েছেন
plotti

উত্তর:


23

দেখে মনে হচ্ছে এটির কিছুতে আপনার নির্ভরশীল পরিবর্তনশীল ধ্রুবক বা ভবিষ্যদ্বাণীকারীর উপর একেবারে লিনিয়ার নির্ভরশীল। এক্স এবং ওয়াই (Y নির্ভরশীল) এর দুটি পারস্পরিক সম্পর্কযুক্ত ভেরিয়েবল রয়েছে। স্ক্যাটারপ্লট বাম দিকে রয়েছে।

এখানে চিত্র বর্ণনা লিখুন

উদাহরণস্বরূপ, প্রথম ("ধ্রুবক") সম্ভাবনাটিতে ফিরে আসি। সমস্ত ওয়াই মানগুলি সর্বনিম্ন -0.5 থেকে একক মান -1 (কেন্দ্রে চিত্র দেখুন) থেকে পুনর্নির্মাণ করুন। এক্স এবং ওয়ানের প্লট রেসিডুয়াল স্ক্রেটারে রেজিস্ট্রেশন করুন, এটি কেন্দ্রীয় চিত্রটি ঘোরান যাতে ভবিষ্যদ্বাণী করা রেখাটি এখন অনুভূমিক হয়ে যায়। এটি কি আপনার ছবির সাথে সাদৃশ্যপূর্ণ?


6
এটি সর্বোত্তমভাবে ফরেনসিক পরিসংখ্যান! একটি বড় +1।
মাইকেল আর চেরনিক

দেখা যাচ্ছে যে আপনি একেবারে সঠিক ছিলেন, আমার এমন কেস ছিল যেখানে রিটুইট গণনাটি প্রকৃতপক্ষে 0 ছিল এবং এই ~ 15 টি মামলার ফলে সেই অদ্ভুত অবশিষ্টাংশের নমুনা দেখা দিয়েছে। i.imgur.com/XGas9.png
প্লাটি

4

আপনি হিস্টোগ্রামে প্যাটার্নটি দেখতে না পেয়ে অবাক হওয়ার কিছু নেই, বিজোড় প্যাটার্নটি হিস্টগ্রামের পরিসীমাটির বেশ খানিকটা বিস্তৃত হয় এবং প্রতিটি বাক্সে কয়েকটি তথ্য পয়েন্ট উপস্থাপন করে। এগুলির মধ্যে কোন ডেটা পয়েন্ট করে সেগুলি সত্যই খুঁজে বার করতে হবে। আপনি পূর্বাভাসিত মান এবং অবশিষ্টাংশগুলি তাদের পক্ষে যথেষ্ট সহজ খুঁজে পেতে ব্যবহার করতে পারেন। একবার আপনি মানগুলি খুঁজে পেলে সেগুলি কেন বিশেষ হতে পারে তা তদন্ত শুরু করে।

এটি বলার পরে, এই নির্দিষ্ট প্যাটার্নটি কেবল বিশেষ কারণ এটি দীর্ঘ। আপনি যদি আপনার অবশিষ্টাংশের প্লট এবং আপনার কোয়ান্টাইল প্লটটি মনোযোগ সহকারে দেখেন তবে আপনি এটি পুনরাবৃত্তি করতে পারবেন তবে এটি আরও ছোট ক্রম। সম্ভবত এটি সত্যিই কেবল একটি অস্বস্তিকর। অথবা সম্ভবত এটি পুনরাবৃত্তি করে এমন একটি প্যাটার্ন। তবে, আপনি এটি কাঁচা তথ্যতে কোথায় রয়েছে তা খুঁজে বের করতে এবং এটি একেবারে বোঝার কোনও আশা রাখার জন্য এটি পরীক্ষা করতে হবে।

আপনাকে কিছুটা সহায়তা দেওয়ার জন্য, কোয়ান্টাইল-কোয়ান্টাইল প্লটটি আপনাকে অনুরূপ অবশিষ্টাংশের একগুচ্ছ রাখার পরামর্শ দেয়। এটি সম্ভবত কোডিং ত্রুটি হতে পারে। আমি আর এর সাথে আর কিছু তৈরি করতে পারি ...

x <- c(rnorm(50), rep(-0.2, 10), rep(0, 4))
qqnorm(x);qqline(x)

লাইনের সমতল দুটি সমতল দাগ নোট করুন। তবে এটি এর চেয়ে জটিল বলে মনে হচ্ছে কারণ অদৃশ্য অবশিষ্টাংশগুলি ভবিষ্যদ্বাণীকারীদের একটি পরিসীমা জুড়ে আসছে are


3

দেখে মনে হচ্ছে আপনি ব্যবহার করছেন R। যদি তা হয় তবে নোট করুন যে আপনি একটি স্ক্যাটারপ্লোটের পয়েন্টগুলি সনাক্ত করতে পারবেন ? চিহ্নিত করুন । আমি মনে করি এখানে বেশ কয়েকটি জিনিস চলছে। প্রথমত, LN_RT_vol_in ~ LN_AT_vol_in(হাইলাইটেড একটি) প্রায় (.2, 1.5) এর প্লটের উপর আপনার খুব প্রভাবশালী বিন্দু রয়েছে । এটি প্রায় -3.7 এর মানকৃত অবশিষ্টাংশ হতে পারে। এই পয়েন্টটির প্রভাবটি হ'ল রিগ্রেশন লাইনকে সমতল করা হবে, এটিকে তীব্রভাবে উপরের রেখার চেয়ে বেশি অনুভূমিক দিকে কাত করে আপনি অন্যথায় অর্জন করতে পারেন। এর একটি প্রভাব হ'ল আপনার সমস্ত অবশিষ্টাংশগুলি ঘড়ির কাঁটার বিপরীতে ঘোরানো হবে যেখানে তারা অন্যথায় residual ~ predictedপ্লটের অভ্যন্তরে অবস্থান করত (কমপক্ষে ov কোভারিয়েটের বিবেচনায় এবং অন্যটিকে উপেক্ষা করার সময়)।

তা সত্ত্বেও, আপনি দেখেন যে অবশেষগুলির সরাসরি স্পষ্ট রেখাটি এখনও সেখানে থাকবে কারণ এটি আপনার মূল ডেটার ত্রিমাত্রিক মেঘের কোথাও রয়েছে। প্রান্তিক প্লটের যে কোনও একটিতে তারা খুঁজে পেতে পারে। আপনি সাহায্যের জন্য সনাক্তকরণ () ফাংশনটি ব্যবহার করতে পারেন এবং আপনি ডানামিক 3D স্ক্রেটারপ্লট তৈরি করতে rgl প্যাকেজটিও ব্যবহার করতে পারেন যা আপনি নিজের মাউসের সাহায্যে অবাধে ঘোরতে পারেন। তবে নোট করুন যে সরলরেখার অবশিষ্টাংশগুলি তাদের পূর্বাভাসিত মানের 0 এর নীচে, এবং 0 টির অবশিষ্টাংশ রয়েছে (যেমন, তারা লাগানো রিগ্রেশন লাইনের নীচে); এটি আপনাকে কোথায় দেখার জন্য একটি বড় ইঙ্গিত দেয়। আপনার চক্রান্ত আবার দেখুনLN_RT_vol_in ~ LN_AT_vol_in, আমি মনে করি আমি তাদের দেখতে পাচ্ছি। Region অঞ্চলের পয়েন্টের মেঘের নীচের প্রান্তে প্রায় (-.01, -1.00) থেকে ত্রিভুজ নীচে এবং বাম দিকে পয়েন্টগুলির মোটামুটি সরল গোষ্ঠী রয়েছে। আমার সন্দেহ হয় যে এগুলি প্রশ্নোয় পয়েন্ট are

অন্য কথায়, অবশিষ্টাংশগুলি সেভাবে দেখায় কারণ তারা ইতিমধ্যে ডেটা স্পেসের মধ্যে কোথাও সেভাবে। সংক্ষেপে, এটিই @ এনটিএনএফএনএস পরামর্শ দিচ্ছে, তবে আমি মনে করি না যে এটি কোনও আসল মাত্রায় যথেষ্ট ধ্রুবক - এটি আপনার মূল অক্ষের একটি কোণে একটি মাত্রায় একটি ধ্রুবক। আমি @ মিশেল চেরনিকের সাথে আরও সম্মত হই যে অবশিষ্টাংশের প্লটে এই আপাত সরলতা সম্ভবত নির্দোষ, তবে আপনার ডেটাটি খুব স্বাভাবিক নয়। তবে এগুলি কিছুটা নরমাল-ইশ এবং আপনার কাছে মনে হয় যে ডেটা একটি শালীন নম্বর রয়েছে, তাই সিএলটি আপনাকে youেকে দিতে পারে, তবে আপনি কেবল ক্ষেত্রে বুটস্ট্র্যাপ করতে চাইতে পারেন। অবশেষে, আমি উদ্বেগ করব যে 'আউটলেট' আপনার ফলাফলগুলি চালাচ্ছে; একটি শক্তিশালী পদ্ধতির সম্ভবত যোগ্যতা অর্জন করা হয়।


1
এটি কি আপনার বক্তব্যটির it's a constant in a dimension at an angle to your original axesসাথে আমার তুলনাযোগ্য is exactly linearly dependent on the predictor(s), বা আপনি অন্যরকম কিছু বোঝাতে চাইছেন?
ttnphns

@ttnphns, আমি আপনার উত্তরের সেই অংশটি মিস করেছি যখন আমি এটি স্কিম করেছিলাম; আমি "ধ্রুবক" দেখেছি এবং আপনার চক্রান্তের পয়েন্টগুলি দেখেছি এবং এটিই আমি কেড়ে নিয়েছি। হ্যাঁ, "এটি একটি মাত্রার মধ্যে একটি ধ্রুবক ..." লজিকালি সমার্থক ডাব্লু / "হ'ল লাইনারি নির্ভরশীল ..."। আমি এখন বুঝতে পেরেছি যে আমার মূল পয়েন্টটি মূলত আপনার (+1) সমান, যদিও আমি মনে করি আমার অন্যান্য পয়েন্টগুলির মধ্যে কিছু (সম্ভবত তথ্য যা অপরাধী, আর কৌশলগুলি, দৃ appro় পদ্ধতির, ইত্যাদি) এখনও আলোচনায় কিছুটা অবদান রাখে।
গুং - মনিকা পুনরায়

অবশ্যই, আপনার উত্তর আমার জন্য অনেক অবদান রেখেছে।
ttnphns

1

আমি অগত্যা বলব না যে হিস্টগ্রাম ঠিক আছে। কোনও হিস্টোগ্রামে সর্বোত্তমভাবে ফিট করার জন্য সাধারণভাবে হাইপোগোস করা বিভ্রান্তিকর হতে পারে এবং আপনার হিস্টোগর্ম বিন প্রস্থের নির্বাচনের ক্ষেত্রে সংবেদনশীল হতে পারে। স্বাভাবিক সম্ভাবনার প্লটটি স্বাভাবিক থেকে একটি বড় প্রস্থান নির্দেশ করে এবং এমনকি হিস্টোগ্রামের দিকে তাকালে আমার চোখে মনে হয় সামান্য স্কিউনেস ([0, + 0.5] বিনের তুলনায় [0, + 0.5] বিন) এবং মারাত্মক কুর্তোসিস (অন্তরগুলির [-4, -3.5] এবং [2.5, 3] এর ফ্রিকোয়েন্সি খুব বেশি)

আপনি যে প্যাটার্নটি দেখছেন সে সম্পর্কে এটি স্ক্যাটারপ্লোটের মাধ্যমে নির্বাচিত অন্বেষণ থেকে আসতে পারে। দেখে মনে হচ্ছে আপনি যদি আরও কিছু শিকার করেন তবে আপনি যেটিকে বেছে নিয়েছিলেন তার সমানতালে আরও দুটি বা তিনটি লাইন খুঁজে পেতে পারেন। আমি মনে করি আপনি এটিতে খুব বেশি পড়ছেন। কিন্তু অস্বাভাবিকতা একটি সত্য উদ্বেগ। আপনার প্রায় এক -4 এর অবশিষ্টাংশ সহ একটি বিশাল বিশাল খেলোয়াড় রয়েছে। এই অবশিষ্টাংশগুলি কি স্বল্প স্কোয়ার থেকে আসে? আমি সম্মত হই যে ডেটার একটি বিক্ষিপ্ত প্লটের উপর লাগানো লাইনের দিকে তাকানো আলোকিত হতে পারে।


আমি দুই চতুর্থ আংশিক প্লট জুড়েছেন এই আরো হালকা চালা
plotti

1
আমি সর্বাধিক বুনিয়াদি জিনিসটি দেখতে চাই, উপাত্তের একটি বিক্ষিপ্ত প্লটের মাধ্যমে লাগানো লাগানো লাইন।
মাইকেল আর চেরনিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.