অর্ডিনাল এবং অবিচ্ছিন্ন এলোমেলো ভেরিয়েবলের মধ্যে অ্যাসোসিয়েশনের শক্তির অ-প্যারাম্যাট্রিক পরিমাপ


12

আমি যেমন সমস্যাটি পেয়েছি তেমন এখানে ফেলে দিচ্ছি।

আমার দুটি এলোমেলো ভেরিয়েবল রয়েছে। যার একটি অবিচ্ছিন্ন (ওয়াই) এবং অন্যটি যা পৃথক এবং অর্ডিনাল (এক্স) হিসাবে যোগাযোগ করা হবে । আমি ক্যোয়ারীর সাথে একসাথে প্রাপ্ত প্লটটির নীচে রেখেছি।

এখানে চিত্র বর্ণনা লিখুন

যে ব্যক্তি আমাকে ডেটা প্রেরণ করে সে এক্স এবং ওয়াইয়ের মধ্যে সংযোগের শক্তি পরিমাপ করতে চায় I'm আমি এমন ধারণাগুলি সন্ধান করছি যা কোন প্রক্রিয়াটি ডেটা উত্পন্ন করে তা নিয়ে অনুমানের সাথে বোঝা ভরে না আসে। লক্ষ্য করুন এই একটি অ স্থিতিমাপ উপায় খুঁজে বের সম্পর্কে না পরীক্ষা সম্পর্কের শক্তি (বুটস্ট্র্যাপ হিসেবে) কিন্তু একটি অ স্থিতিমাপ পথ খুঁজে নেওয়ার বিষয়ে পরিমাপ করুন।

অন্যদিকে, দক্ষতা কোনও সমস্যা নয় কারণ প্রচুর ডেটা পয়েন্ট রয়েছে।


1
এক্স (পৃথক ভেরিয়েবল) অর্ডিনাল বা না?
পিটার ফ্লুম - মনিকা পুনরায়

@ পিটারফ্লম: ধন্যবাদ হ্যাঁ. আমি এই প্রশ্নের যোগ।
ব্যবহারকারী 60

"ননপ্রেমেট্রিক" দ্বারা এখানে আপনি কি বোঝাতে চেয়েছেন যে গড় বা ভেরিয়েন্সের কোনও গণনা অনুমোদিত নয়?
ttnphns

উত্তর:


8

সংজ্ঞা অনুসারে, অর্ডিনাল স্কেল হ'ল গেজ যেখানে খাঁজের মধ্যে সত্যিকারের দূরত্ব 1 2 3 4অজানা। এটি এমন যে আপনি মাদক / অ্যালকোহলের আওতায় একজন শাসককে দেখছেন। সত্য দূরত্ব যে কোনও হতে পারে। এটা হতে পারে 1 2 3 4বা 1 2 3 4বা যাই হোক না কেন। আমরা কোনও পরিসংখ্যানকে গণনা করতে পারি না - যেমন একটি পারস্পরিক সম্পর্ক - যতক্ষণ না দূরত্বের বিষয়ে সিদ্ধান্ত নেয়, সেগুলি ঠিক করুন।

একটি যুক্তি নিম্নরূপ হতে পারে। যেহেতু আমাদের পরিমাপের স্কেল, গেজটি একটি অজানা একঘেয়েভাবে উপায়ে বিকৃত হয়, তাই আমরা ডেটা মানগুলিতে বিশ্বাস করতে পারি না। কেবলমাত্র তাদের মাত্রার ক্রম বিশ্বাসযোগ্য। মস্তিষ্কের আরও জোতা ছাড়াই আদেশটিকে মান হিসাবে ঘোষণা করুন। সুতরাং, আমরা পর্যবেক্ষণ বিতরণটি অভিন্ন বিতরণ, স্থানগুলি দ্বারা প্রতিস্থাপন করি । এর পরে, অ্যাসোসিয়েশন সহগের গণনা করতে পারেন, বলুন, পিয়ারসন । এটি স্পিয়ারম্যান , আমরা জানি। পিয়ারসন রৈখিক সংস্থার শক্তি পরিমাপ করে। ভেরিয়েবলগুলি নির্ধারণ করা একঘেয়ে সম্পর্কের সেই অংশটিকে লিনিয়ারাইজ করার কৌশল যা প্রাথমিকভাবে অভিন্ন না হওয়া বিতরণকে দায়ী করা হয়। সুতরাং, স্পিয়ারম্যানrrhorrhoপ্রান্তিক বিতরণকে ইউনিফর্ম করার ক্রিয়াকলাপে রৈখিকতায় রূপান্তরিত করা যায় এমন সম্পর্কের ক্ষেত্রে এমন একঘেয়েমিটির পরিমাপ। ওপি প্রশ্নে, দুটি ভেরিয়েবলের মধ্যে কেবল একটিই অর্ডিনাল (এবং দ্বিতীয়টি অবিচ্ছিন্ন)। সুতরাং, সাধারণত উভয় ভেরিয়েবলকে র‌্যাঙ্ক করার দরকার নেই । শুধু পূরণবাচক এক এবং তারপর কম্পিউট স্থান থাকতে পারে ।r

অন্য পদ্ধতির , র‌্যাঙ্কিংয়ের বিকল্প (ইউনিফর্মিং), সাধারণ ভেরিয়েবলের সর্বোত্তম স্কেলিং হতে পারে । অনুকূল স্কেলিং হল একটি সাধারণ পুনঃনির্দেশক পদ্ধতি যা লক্ষ্যমাত্রার স্কেলগুলিতে এ জাতীয় দূরত্বগুলি খুঁজে পাওয়ার লক্ষ্যে - যেমন এর একঘেয়েমিক রূপান্তরটি সন্ধান করুন - যাতে ভেরিয়েবলগুলির মধ্যে লিনিয়ার সম্ভব হয় সর্বোচ্চতর হয়। র‌্যাঙ্কিং পদ্ধতির উপর ভিত্তি করে "সত্য স্কেলটি অভিন্ন বন্টনের সাথে সম্পর্কিত ডেটার সাথে মিল রাখে", অনুকূল স্কেলিং পদ্ধতির ভিত্তিতে ভিত্তি করে "সত্য স্কেল সর্বোচ্চ লিনিয়ার সাথে সম্পর্কিত ডেটার সাথে মিলে যায়rrr"। সর্বোত্তম স্কেলিংটি বিভাগীয় রিগ্রেশন (ক্যাট্রেগ) এ করা যেতে পারে। তবে, শ্রেণীবদ্ধ প্রতিরোধের প্রয়োজন অন্য ইনপুট ভেরিয়েবলটি বিচ্ছিন্ন হওয়া প্রয়োজন (অগত্যা নিয়মিত নয়) এবং তাই যদি এটির অনন্য মূল্যবোধ অব্যাহত থাকে তবে এটি আপনাকে নির্বিচারে বিনাশ করতে হবে you ।

পাশাপাশি অন্যান্য পন্থা আছে। তবে যে কোনও উপায়ে, আমরা একরকম অর্ডিনাল স্কেলকে "তাই হিসাবে ..." (কিছু অনুমান বা কিছু লক্ষ্য) রূপান্তরিত করি, কারণ অর্ডিনাল স্কেল আমাদের কাছে অজানা উপায়ে বিকৃত করা হয়। মূলত অন্য সিদ্ধান্তটি প্রথমে "বিচক্ষণ" হওয়া এবং সিদ্ধান্ত নেওয়া হবে যে এটি হয় বিকৃত নয় (যেমন এটি অন্তর অন্তর), বা একটি পরিচিত উপায়ে বিকৃত নয় (নাম নয়), বা নামমাত্র is

কিছু অসমমিতিক পদ্ধতির মধ্যে অন্যের (অন্তর / ধারাবাহিক) একের মাধ্যমে অরডিনাল ভেরিয়েবলের নিয়মিত সংযোজন অন্তর্ভুক্ত থাকতে পারে। বা অর্ডিনাল দ্বারা সেই পরবর্তীটির লিনিয়ার রিগ্রেশন, সেই মডেল সহ যেখানে ভবিষ্যদ্বাণীকে বহুপদী কনট্রাস্ট হিসাবে গ্রহণ করা হয় (এটি হিসাবে প্রবেশ করা হয় b1X + b2X^2 + b3X^3,...)। এই পদ্ধতির দুর্বলতা হ'ল এগুলি অসমমিত: একটি পরিবর্তনশীল নির্ভরশীল, অন্যটি স্বাধীন।


ধন্যবাদ; খুব ভাল ধারণা, কেবলমাত্র একটি ভেরিয়েবলের র‌্যাঙ্কগুলি গণনা করতে।
ব্যবহারকারী 60

6

স্পিয়ারম্যানের র‌্যাঙ্ক-অর্ডার পারস্পরিক সম্পর্ক সহগ ( একঘেয়ে অ্যাসোসিয়েশনের একটি ননপ্রেমেট্রিক মাপ ) যথেষ্ট নয় বলে কোনও কারণ আছে কি ? একঘেয়েমি খুব "সামনের বোঝা"? এটি আপনার ভেরিয়েবলের জন্য স্বতন্ত্রভাবে উত্পাদিত র‌্যাঙ্কগুলিতে ( এবং ) পার্থক্যের ( ) : x i y idi=xiyixiyi

rS=16i=1ndi2n(n21)

Monotonicity যদি হয় খুব অনুমান কঠোর, আমি যেমন Reshef (2011, 2013), যা এমনকি ধরে নিই না দ্বারা প্রস্তাবিত যে হিসাবে সর্বোচ্চ তথ্যের উপর ভিত্তি করে ভাবছি যদি পন্থা, ক্রিয়ামূলক মধ্যে সম্পর্ক এবং কি আপনি হয় লাইন বরাবর আরো হতে পারে খুঁজছি?ওয়াইXY


তথ্যসূত্র

রিশেফ, ডি।, রিশেফ, ওয়াই।, ফিনুকান, এইচ।, গ্রসম্যান, এস।, ম্যাকভিন, জি।, টার্নবোগ, পি।, ল্যান্ডার, ই।, মিতজেনমেকার, এম, এবং সাবেতি, পি। (2011)। বৃহত ডেটা সেটে উপন্যাস সংঘগুলি সনাক্ত করা। বিজ্ঞান , 334 (6062): 1518-1515।

রিশেফ, ডি।, রিশেফ, ওয়াই।, মিতজেনমেকার, এম, এবং সাবেতি, পি। (2013)। তুলনা সহ সর্বাধিক তথ্য সহগের সামঞ্জস্যতা বিশ্লেষণআরএক্সিভ , 14 আগস্ট।


উভয় খুব ভাল ধারণা মত চেহারা। বস্তুত, দুটি আপনি এমনকি উত্থাপন করা পরিপূর্ণ পরস্পর। আমি প্রশ্নটি আরও কিছুক্ষণ পরে ছেড়ে দেব।
ব্যবহারকারী 60
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.