র‌্যাঙ্কড ডেটা (স্পিয়ারম্যান পারস্পরিক সম্পর্ক) এর জন্য কোনও রিগ্রেশন লাইনের প্লট করা কি ঠিক আছে?


12

আমার কাছে ডেটা রয়েছে যার জন্য আমি স্পিয়ারম্যান পারস্পরিক সম্পর্কের গণনা করেছি এবং এটি কোনও প্রকাশনার জন্য ভিজ্যুয়ালাইজ করতে চাই। নির্ভরশীল ভেরিয়েবলটি স্থান পেয়েছে, ইন্ডিপেন্ডেট ভেরিয়েবলটি নয়। আমি যা দেখতে চাই তা প্রকৃত opeালের তুলনায় সাধারণ প্রবণতা, তাই আমি স্বাধীনকে স্থান দিয়েছি এবং স্পিয়ারম্যান পারস্পরিক সম্পর্ক / রিগ্রেশন প্রয়োগ করেছি। তবে যখন আমি আমার ডেটা প্লট করেছি এবং এটি আমার পাণ্ডুলিপিতে inোকাতে চলেছি তখন আমি এই বিবৃতিতে হোঁচট খেয়েছি ( এই ওয়েবসাইটে ):

আপনি স্পিয়ারম্যান র‌্যাঙ্ক পারস্পরিক সম্পর্ক স্থাপন করার সময় বর্ণনা বা ভবিষ্যদ্বাণীগুলির জন্য আপনি প্রায় কোনও রিগ্রেশন লাইন ব্যবহার করবেন না , সুতরাং কোনও রিগ্রেশন লাইনের সমতুল্য গণনা করবেন না

এবং পরে

আপনি লিনিয়ার রিগ্রেশন বা পারস্পরিক সম্পর্কের জন্য স্পিয়ারম্যান র‌্যাঙ্কের সম্পর্ক সম্পর্কিত তথ্য গ্রাফ করতে পারেন can গ্রাফটিতে কোনও রিগ্রেশন রেখা রাখবেন না ; আপনি যখন র‌্যাঙ্ক পারস্পরিক সম্পর্ক নিয়ে বিশ্লেষণ করেছেন তখন কোনও গ্রাফটিতে লিনিয়ার রিগ্রেশন লাইন স্থাপন করা বিভ্রান্তিকর হবে।

বিষয়টি হ'ল, যখন আমি স্বতন্ত্রকে র‌্যাঙ্ক না করি এবং পিয়ারসন পারস্পরিক সম্পর্কের গণনা করি না তখন রিগ্রেশন লাইনগুলি আলাদা হয় না । প্রবণতাটি একই, তবে জার্নালগুলিতে রঙিন গ্রাফিক্সের অত্যধিক ফিজের কারণে আমি একরঙা উপস্থাপনা নিয়ে গিয়েছিলাম এবং প্রকৃত ডেটা পয়েন্টগুলি এত বেশি ওভারল্যাপ করে চলেছে যে এটি সনাক্তযোগ্য নয়।

আমি অবশ্যই এটিকে ঘিরে আমার পক্ষে দু'টি আলাদা প্লট তৈরি করতে পারি: একটি ডেটা পয়েন্টের জন্য (র‌্যাঙ্কড) এবং একটি রিগ্রেশন লাইনের জন্য (আনারঙ্কড), তবে যদি এটির সন্ধান হয় যে উত্সটি উদ্ধৃত করা হয়েছে তা ভুল বা সমস্যা issue আমার ক্ষেত্রে যে সমস্যাযুক্ত তা নয়, এটি আমার জীবনকে আরও সহজ করে তুলবে। (আমি এই প্রশ্নটিও দেখেছি , তবে এটি আমার কোনও উপকারে আসেনি))

অতিরিক্ত তথ্যের জন্য সম্পাদনা করুন:

এক্স-অক্ষের উপর স্বাধীন ভেরিয়েবল বৈশিষ্ট্য সংখ্যা এবং y- অক্ষের উপর নির্ভরশীল পরিবর্তনশীল তাদের কর্মক্ষমতা তুলনায় শ্রেণিবদ্ধকরণ অ্যালগরিদম যদি র‌্যাঙ্ক উপস্থাপন করে। এখন আমার কাছে কিছু অ্যালগরিদম রয়েছে যা তুলনামূলকভাবে গড়, তবে আমি আমার চক্রান্তের সাথে যা বলতে চাই তা হ'ল: "শ্রেণিবদ্ধের ক আরও বৈশিষ্ট্য উপস্থিত থাকাকালীন, শ্রেণিবদ্ধী বি আরও ভাল যখন কম বৈশিষ্ট্য উপস্থিত থাকে"

আমার প্লটগুলি অন্তর্ভুক্ত করতে 2 সম্পাদনা করুন:

বিভিন্ন সংখ্যক বৈশিষ্ট্যগুলির তুলনায় অ্যালগরিদমের র‌্যাঙ্কগুলি ষড়যন্ত্র করেছিল এখানে চিত্র বর্ণনা লিখুন

র‌্যাংকযুক্ত অ্যালগরিদমগুলি বৈশিষ্ট্যগুলির স্থিত সংখ্যার তুলনায় প্লট করেছে এখানে চিত্র বর্ণনা লিখুন

সুতরাং, শিরোনাম থেকে প্রশ্নের পুনরাবৃত্তি:

স্পিয়ারম্যান পারস্পরিক সম্পর্ক / রিগ্রেশন এর রেঙ্কড ডেটার জন্য কোনও রিগ্রেশন লাইনের প্লট করা কি ঠিক আছে?


র‌্যাঙ্কে কতটি বিভাগ রয়েছে? আপনি কি আনুপাতিকতা অনুমান পরীক্ষা করেছেন? অনেক গবেষক রয়েছেন যারা ক্রমাগত অর্ডিনাল ডেটা (যেমন র‌্যাঙ্কিং) চিকিত্সা করে পুরোপুরি ঠিক আছেন। কখনও কখনও যদি প্রচুর বিভাগ থাকে তবে তা বোঝা যায়।
রবিন.ড্যাটাড্রাইভারগুলি 9:15

1
সাতটি র‌্যাঙ্ক রয়েছে, তারা ফ্রিডম্যান পরীক্ষার জন্য ব্যবহৃত হয়
সেন্ট্রি

উত্তর:


10

আপনার নোট অনুসারে একটি র‌্যাঙ্ক-পারস্পরিক সম্পর্ক ব্যবহার করা যেতে পারে; যেমন আপনি সাধারণত এটির জন্য একটি লাইন প্লট করবেন না।

এমন পরিস্থিতি রয়েছে যেখানে কেন্ডাল বা স্পিয়ারম্যান (বা অন্য কোনও) হোক না কেন, সংখ্যা-y বনাম সংখ্যাসূচক এক্স এর সাথে লাইনগুলি ফিট করার জন্য র‌্যাঙ্ক-সম্পর্কিত ব্যবহারগুলি যথাযথ উপলব্ধি করে। আলোচনা (এবং বিশেষ করে, গত চক্রান্ত) দেখুন এখানে

যদিও এটি আপনার পরিস্থিতি নয়। আপনার ক্ষেত্রে, আমি কেবল আসল তথ্যগুলির একটি স্ক্র্যাপপ্লট উপস্থাপন করতে আগ্রহী, সম্ভবত একটি মসৃণ সম্পর্কের (উদাহরণস্বরূপ লস দ্বারা)।

আপনি সম্পর্কটি একঘেয়ে হতে পারে বলে আশা করেন; আপনি সম্ভবত একঘেয়ে সম্পর্কের অনুমান এবং পরিকল্পনা করার চেষ্টা করতে পারেন। [এখানে একটি আর-ফাংশন আলোচনা করা হয়েছে যা আইসোটোনিক রিগ্রেশনকে ফিট করতে পারে - উদাহরণটিতে আইসোটোনিক নয় সর্বমোটিক, ফাংশনটি আইসোটোনিক ফিট করতে পারে]]

আমি যে ধরণের জিনিস বোঝাতে চাইছি তার উদাহরণ এখানে:

এখানে চিত্র বর্ণনা লিখুন

প্লটটি x এবং y এর মধ্যে একঘেয়ে সম্পর্ক দেখায়; লাল বক্ররেখা একটি লোস মসৃণ (এই ক্ষেত্রে আর দ্বারা উত্পাদিত scatter.smooth), যা মনটোনিকও ঘটে (একচেটিয়া হওয়ার গ্যারান্টিযুক্ত মসৃণ ফিটগুলি প্রাপ্ত করার উপায় রয়েছে, তবে এই ক্ষেত্রে ডিফল্ট লোস মসৃণ একঘেয়ে ছিল, সুতরাং চিন্তার দরকার বোধ করিনি।

এখানে চিত্র বর্ণনা লিখুন
র‌্যাটের প্লট (y) বনাম র‌্যাঙ্ক (এক্স), একঘেয়ে সম্পর্কের ইঙ্গিত দেয়। সবুজ রেখাটি র‌্যাঙ্কের (x) এর বিপরীতে লোয়েস বক্ররেখা মানগুলির র‌্যাঙ্কগুলি দেখায়।

y^

যদি আপনি র‌্যাঙ্ক (Y) বনাম এক্স এর বাইরে কিছু প্রদর্শন না করে থাকেন তবে আমার মনে হয় আমি প্লটে লাইন ব্যবহার করা এড়াতে চাই; আমি যতদূর দেখতে পাচ্ছি তারা পারস্পরিক সম্পর্ক সহগের চেয়ে অনেক বেশি মূল্য প্রকাশ করে না। এবং ইতিমধ্যে বলেছে যে আপনি কেবল প্রবণতায় আগ্রহী।

[আমি জানি না যে র‌্যাঙ্ক-y বনাম র‌্যাঙ্কড-এক্স প্লটে রিগ্রেশন লাইনের প্লট করা ভুল , অসুবিধা হবে তার ব্যাখ্যাটি]


ধন্যবাদ, আপনার উত্তর ভাল এবং ভাল ব্যাখ্যা করা হয়েছে। তবে এটি আমাকে উপলব্ধি করেছে যে আমি গুরুত্বপূর্ণ তথ্য বাদ দিতে পারি। আমার দেওয়া অতিরিক্ত তথ্যের সাথে কি এটি এখনও বৈধ? আমি যখন আমার কাজের পিসিতে আছি তখন গ্রাফগুলি পরে অনুসরণ করে।
সেন্ট্রি

আমার আপডেটটি একবার দেখুন এবং দেখুন যে আপনি এর কোনওটির কোনও মূল্য আছে কিনা তা দেখুন।
গ্লেন_বি -রিনস্টেট মনিকা

হ্যাঁ, এটি মূল্যবান তবে সাধারণ অর্থে আরও বেশি। আমিও একমত যে "ভুল" প্লটটি ব্যাখ্যা করতে অসুবিধা থেকেই আসে। আমি আশঙ্কা করি যে লোকেরা সর্বদা ধরে নেবে যে আমি বৈশিষ্ট্যটি থেকে র‌্যাঙ্কটি পূর্বাভাস দিতে চাই , এমনকি যদি আমি উল্লেখ করি যে আমি কেবল প্রবণতাটি প্রদর্শন করতে চাই ।
সেন্ট্রি

আপনার প্লটগুলির দিকে তাকিয়ে --- আপনি র‌্যাঙ্কগুলি দেখান, তবে কোন র‌্যাঙ্কের ভিত্তিতে আপনার কার্য সম্পাদনের মূল ব্যবস্থা রয়েছে?
গ্লেন_বি -রিনস্টেট মনিকা

হ্যাঁ, আমি করি, তবে সেগুলি এখানে ব্যবহার করা যাবে না, বিশ্বাস করুন। আমার অধ্যয়নের কেন্দ্রবিন্দু ফ্রেডম্যান টেস্ট ব্যবহার করে অ্যালগরিদমগুলির সাথে তুলনা করা is অত্যন্ত ভিন্ন ভিন্ন পারফরম্যান্সের ব্যাপ্তি সহ একাধিক ডেটা সেট রয়েছে, সুতরাং কেবলমাত্র তাদের মধ্যে তুলনাটি এখানে আকর্ষণীয়।
11:44

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.