ওজনযুক্ত সম্পর্ক হিসাবে এই জাতীয় জিনিস?


14

আমার কাছে সর্বাধিক জনপ্রিয় সংগীত শিল্পীদের সম্পর্কে আকর্ষণীয় তথ্য রয়েছে যা প্রায় 200 কংগ্রেসনাল জেলাতে লোকেশন দ্বারা বিভক্ত। আমি দেখতে চাই যে কোনও ব্যক্তিকে তার সংগীত পছন্দগুলি নিয়ে পোল করা এবং তিনি "ডেমোক্র্যাটের মতো শুনেন" বা "রিপাবলিকানের মতো শুনেন কিনা" তা নির্ধারণ করতে পারে কিনা। (স্বাভাবিকভাবেই এটি হালকা হৃদয়যুক্ত, তবে ডেটাতে সত্যিকারের এনট্রপি রয়েছে!)

বিগত তিনটি নির্বাচনী চক্রে প্রতিটি জেলায় রিপাবলিকান এবং ডেমোক্র্যাটদের জন্য গড়ে শতকরা ভোটের সাথে আমার প্রায় 100 শিল্পীর ডেটা রয়েছে। সুতরাং ডেমোক্র্যাটদের ভোট ভাগের একটি ফাংশন হিসাবে কোনটি সবচেয়ে বেশি বিতর্কিতভাবে শ্রবণ করা হয়েছে তা দেখার জন্য আমি প্রতিটি শিল্পীর সাথে একটি সম্পর্ক রেখেছি। এই পারস্পরিক সম্পর্কগুলি কোনও প্রদত্ত শিল্পীর জন্য প্রায় -0.3 থেকে 0.3 পর্যন্ত চলতে থাকে, মাঝখানে প্রচুর পরিমাণে বা ভবিষ্যদ্বাণীমূলক শক্তি থাকে না।

আমার দুটি প্রশ্ন রয়েছে: প্রথমত, জেলাতে প্রতি স্রোতের সামগ্রিক সংখ্যা ব্যাপকভাবে পরিবর্তিত হয়। এই মুহুর্তে, আমি ডেমোক্র্যাটদের জন্য দেওয়া ভোটের শতাংশের বিপরীতে, বেয়েন্স বলি, জেলা হিসাবে অন্তর্ভুক্ত সমস্ত জেলা স্ট্রিমের শতাংশের সাথে সংযোগ দিচ্ছি। তবে একটি জেলার মোট স্ট্রিমগুলি কয়েক মিলিয়নতে থাকতে পারে, এবং অন্যটি কম 100,000 এর মধ্যে রয়েছে s এর জন্য অ্যাকাউন্ট নিযুক্ত করার জন্য কি আমার কোনওভাবে সম্পর্কের ভার নিতে হবে?

দ্বিতীয়ত, আমি আগ্রহী যে কীভাবে এই সম্পর্কগুলি ব্যবহারকারীর রাজনীতি হিসাবে একটি সংমিশ্রিত অনুমানের সাথে সংযুক্ত করতে পারি। ধরা যাক আমি ২০ টি শিল্পীকে সর্বোচ্চ নিখুঁত সম্পর্কিত সম্পর্কিত মান (ধনাত্মক এবং নেতিবাচক), প্রতিটি দিকে দশ করে নিয়েছি এবং কোনও শিল্পীকে তিনি বা তিনি প্রতিটি শিল্পীকে কতটা পছন্দ করেন তা সম্পর্কে জরিপ করি। সুতরাং আমি প্রতিটি শিল্পীর উপরে বা নীচে ভোট পেয়েছি এবং সমস্ত 20 টি মানের জন্য রাজনীতির সাথে সম্পর্কিত। এই পারস্পরিক সম্পর্কগুলিকে একক অনুমানের সাথে সংযুক্ত করার জন্য কি কোনও স্ট্যান্ডার্ড উপায় আছে? (আমি এনওয়াইটাইমসের বিখ্যাত উপভাষা কুইজের মতো কিছু ভাবছি , যেখানে এটি উত্তরের মানচিত্রে ২৫ টি প্রশ্নের আঞ্চলিক সম্ভাবনাগুলিকে একত্রিত করেছে। তবে এই ক্ষেত্রে, ডেমোক্র্যাটিক বা রিপাবলিকানদের সংগীতের স্বাদ কীভাবে হয় তার জন্য আমার কেবল একটি মান প্রয়োজন।

ধন্যবাদ!

উত্তর:


25

ওয়েট পিয়ারসন পারস্পরিক সম্পর্কের সূত্রটি ওয়েবে , স্ট্যাকওভারফ্লো এবং উইকিপিডিয়ায় সহজেই পাওয়া যায় এবং এটি বেশ কয়েকটি আর প্যাকেজ যেমন সাইক , ওজন এবং পাইথনের স্ট্যাটাসমোডেলস প্যাকেজে কার্যকর করা হয়। এটি নিয়মিত পারস্পরিক সম্পর্কের মতো গণনা করা হয় তবে ওজনযুক্ত উপায় ব্যবহার করে ,

মিএক্স=ΣআমিWআমিএক্সআমিΣআমিWআমি,    মিওয়াই=ΣআমিWআমিYআমিΣআমিWআমি

ওজনযুক্ত প্রকরণ ,

গুলিএক্স=ΣআমিWআমি(এক্সআমি-মিএক্স)2ΣআমিWআমি,    গুলিওয়াই=ΣআমিWআমি(Yআমি-মিওয়াই)2ΣআমিWআমি

ওজনিত সমবায়

sXY=iwi(ximX)(yimY)iwi

এই সমস্ত কিছু থাকার পরে আপনি সহজেই ওজনযুক্ত পার্থক্য গণনা করতে পারেন

ρXY=sXYsXsY

আপনার দ্বিতীয় প্রশ্নটি সম্পর্কে, যেমনটি আমি এটি বুঝতে পারি, আপনার কাছে বিশদ শিল্পী এবং ব্যবহারকারীদের বাইনারি উত্তরগুলির জন্য তার রাজনৈতিক পছন্দ এবং তার পছন্দ সম্পর্কে পারস্পরিক সম্পর্ক সম্পর্কিত তথ্য থাকবে এবং আপনি এটির একরকম সামগ্রিক পরিমাপ পেতে চান।

আসুন গড় পার্থক্য সঙ্গে শুরু করা যাক। সম্ভাব্যতা গড়ের জন্য একাধিক পদ্ধতি রয়েছে তবে এটির সাথে সম্পর্কিত গড় হারে এতগুলি পন্থা বলে মনে হয় না। একটা জিনিষ কাজ এমন হতে পারে ব্যবহার করা ফিশার এর -transformationz যেমন MathOverflow বর্ণিত , অর্থাত্

ρ¯=tanh1(j=1Ktanh(ρj)K)

মূলত গ্রহণ tangents পারস্পরিক সম্পর্ক কোফিসিয়েন্টস এর "চ্যাপ্টা" চরম মান (নীচে দেখুন) যাতে তারা চূড়ান্ত হিসাব উপর নিম্ন প্রভাব এবং তাদের বিতরণ স্বাভাবিক কাছাকাছি করে তোলে। এই প্রক্রিয়াটি বুশম্যান এবং ওয়াং (1995) এবং কোরি, ডুনলাপ এবং বার্ক (1998) দ্বারাও বর্ণিত হয়েছিল।

এখানে চিত্র বর্ণনা লিখুন

r=cor(X,Y)r=cor(X,Y)=cor(X,Y)

rjjxijiএক্সআমি=1এক্সআমি=-1

R¯আমি=TANH-1(Σ=1কেTANH(Rএক্সআমি)কে)

-11

কিন্তু ...

আপনি কি ভাবেন না যে এই সমস্ত কিছুই মূলত একাধিক রিগ্রেশন সমস্যা এমন কিছুর জন্য ওভারকিল? পরিবর্তে সমস্ত ওজন এবং গড় আপনি কেবল ওজনযুক্ত একাধিক রিগ্রেশন (লিনিয়ার বা লজিস্টিক নির্ভর করে যদি আপনি বাইনারি পছন্দ বা ডিগ্রি অফ অগ্রাধিকার পূর্বে ভবিষ্যদ্বাণী করেন তবে উভয় দিকের ক্ষেত্রে যেখানে ওজন সাবমেলের আকারের উপর নির্ভরশীল) ব্যবহার করতে পারেন। আপনি ভবিষ্যদ্বাণী হিসাবে প্রতিটি শিল্পীর জন্য বাদ্যযন্ত্র পছন্দ ব্যবহার করবেন। শেষ পর্যন্ত আপনি ভবিষ্যদ্বাণী করতে ব্যবহারকারীর পছন্দ ব্যবহার করবেন। এই পদ্ধতিটি সহজ এবং পরিসংখ্যানগতভাবে মার্জিত। এটি আপেক্ষিক প্রযোজ্যএকজনবি


বুশম্যান, বিজে, এবং ওয়াং, এমসি (1995)। জনসংখ্যার পারস্পরিক সম্পর্কের সহগের জন্য একটি অনুমান এবং একটি আস্থা অন্তর পেতে নমুনা পারস্পরিক সম্পর্কের সহগ এবং ভোটের সংমিশ্রণের জন্য একটি পদ্ধতি। মনস্তাত্ত্বিক বুলেটিন, 117 (3), 530।

কোরি, ডিএম, ডুনলাপ, ডাব্লুপি, এবং বার্ক, এমজে (1998)। গড় আপেক্ষিক সম্পর্ক: সম্মিলিত পিয়ারসন আরএস এবং ফিশারের জেড ট্রান্সফর্মেশনগুলিতে প্রত্যাশিত মান এবং বায়াস, জার্নাল অফ জেনারেল সাইকোলজি, 125 (3), 245-261।


ধন্যবাদ! এটি দুর্দান্তভাবে সহায়তা করে। আজকের পরে এটি উপলব্ধ হলে অনুগ্রহ প্রদান করবে award
ক্রিস উইলসন

@ টিম যেখানে ওজনযুক্ত সমবায়ু গণনা করা হয় সেখানে এক্সআমি এবং Yআমিবিভিন্ন নির্ভরযোগ্যতা ওজন আছে?
কাগারশ্যাচ

1
@ কাগারাটসচ আমি কখনও এই জাতীয় সূত্রটি দেখিনি। এটি জিজ্ঞাসা করার জন্য একটি দুর্দান্ত প্রশ্ন হিসাবে যোগ্যতা অর্জন করে।
টিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.