3 ভেরিয়েবলের জন্য পিয়ারসন পারস্পরিক সম্পর্কের সাদৃশ্য


17

আমি তিনটি ভেরিয়েবলের "পারস্পরিক সম্পর্ক" কিছু কিনা সে সম্পর্কে আগ্রহী এবং যদি হয় তবে এটি কী হবে?

পিয়ারসন পণ্যের মুহুর্তের পারস্পরিক সম্পর্ক সহগ

{ ( এক্স - μ এক্স ) ( ওয়াই - μ ওয়াই ) }ভি আর ( এক্স ) ভি আর ( ওয়াই )

E{(XμX)(YμY)}Var(X)Var(Y)

এখন 3 ভেরিয়েবলের জন্য প্রশ্ন: হয়

{ ( এক্স - μ এক্স ) ( ওয়াই - μ ওয়াই ) ( জেড - μ জেড ) }ভি আর ( এক্স ) ভি আর ( ওয়াই ) ভি আর ( জেড )

E{(XμX)(YμY)(ZμZ)}Var(X)Var(Y)Var(Z)

কিছু?

আর-তে এটি ব্যাখ্যামূলক কিছু বলে মনে হচ্ছে:

> a <- rnorm(100); b <- rnorm(100); c <- rnorm(100)
> mean((a-mean(a)) * (b-mean(b)) * (c-mean(c))) / (sd(a) * sd(b) * sd(c))
[1] -0.3476942

আমরা সাধারণত একটি স্থায়ী তৃতীয় ভেরিয়েবলের মান প্রদান করে 2 ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক দেখি। কেউ কি স্পষ্ট করতে পারে?


2
1) আপনার দ্বিখণ্ডিত পিয়ারসন সূত্রে, যদি "E" (আপনার কোডের অর্থ) তখন n দ্বারা বিভাজনটি বোঝায় st বিচ্যুতিগুলি অবশ্যই n (n-1 নয়) এর উপর ভিত্তি করে থাকতে হবে । 2) তিনটি ভেরিয়েবল একই ভেরিয়েবল হতে দিন।
এক্ষেত্রে

একটি তুচ্ছ স্বাভাবিক বিতরণের জন্য এটি শূন্য, পারস্পরিক সম্পর্ক কী তা নির্বিশেষে।
রে কোপম্যান

1
আমি সত্যিই মনে করি শিরোনামটি "3 ভেরিয়েবলের জন্য পিয়ারসন পারস্পরিক সম্পর্কের উপমা" বা অনুরূপে পরিবর্তিত হয়ে উপকৃত হবে - এটি এখানে লিঙ্কগুলি বরং আরও তথ্যবহুল করে তুলবে
সিলভারফিশ

1
@ সিলভারফিশ আমি সম্মত! আমি শিরোনাম আপডেট করেছি, ধন্যবাদ।
পাসক্যালভিকুটেন

উত্তর:


12

এটা তোলে হয় প্রকৃতপক্ষে কিছু। এটির সন্ধানের জন্য, আমাদের পরস্পরের সম্পর্ক সম্পর্কে আমরা কী জানি তা যাচাই করতে হবে।

  1. একটি ভেক্টর-মূল্যবান এলোপাতাড়ি ভেরিয়েবলের পারস্পরিক সম্পর্ক ম্যাট্রিক্স ভ্যারিয়েন্স-সহভেদাংক ম্যাট্রিক্স, অথবা কেবল এর মান সংস্করণের "ভ্যারিয়েন্স," হয় । অর্থাৎ প্রতিটি তার recentered, rescaled সংস্করণ দ্বারা প্রতিস্থাপিত হয়।এক্স = ( এক্স 1 , এক্স 2 , , এক্স পি ) X=(X1,X2,,Xp)এক্স Xএক্স iXi

  2. কোভ্যারিয়েন্স এবং তাদের কেন্দ্রিক সংস্করণ পণ্যের প্রত্যাশা নেই। অর্থাৎ লেখা এবং , আমরাএক্স আই Xiএক্স এক্স জে Xjএক্স আই = এক্স আই - [ এক্স আই ] Xi=XiE[Xi]এক্স = এক্স জে - [ এক্স জে ]Xj=XjE[Xj]

    কোভ ( এক্স আই , এক্স জে ) = [ এক্স আই এক্স ]

    Cov(Xi,Xj)=E[XiXj].
  3. of এর বৈকল্পিকতা , যা আমি লিখব , এটি কোনও একক সংখ্যা নয়। এটি values XXVar(X)Var(X)Var(X)ij=Cov(Xi,Xj).

    Var(X)ij=Cov(Xi,Xj).
  4. উদ্দেশ্যে করা সাধারণীকরণের জন্য সমবায় চিন্তাভাবনা করার উপায়টিকে এটি একটি টেনসর হিসাবে বিবেচনা করা । এর মানে হল যে এটা পরিমাণে একটি সম্পূর্ণ সংগ্রহ এর , দ্বারা সূচীবদ্ধ এবং ছোটো থেকে মাধ্যমে , যার মান একটি বিশেষ সহজ আন্দাজের পথ যখন পরিবর্তন একটি রৈখিক রূপান্তর ক্ষয়ের। বিশেষত, যাক দ্বারা নির্ধারিত অন্য ভেক্টর-মূল্যবান র্যান্ডম ভেরিয়েবল হোকvijvijiijj11ppXXY=(Y1,Y2,,Yq)Y=(Y1,Y2,,Yq)

    Yi=pj=1ajiXj.

    Yi=j=1pajiXj.

    ধ্রুবক ( এবং হয় ইনডেক্স - একটি শক্তি নয়) গঠন একটি অ্যারের , এবং । প্রত্যাশার রৈখিকতা বোঝায়ajiajiiijjjjq×pq×pA=(aji)A=(aji)j=1,,pj=1,,pi=1,,qi=1,,q

    Var(Y)ij=akialjVar(X)kl.

    Var(Y)ij=akialjVar(X)kl.

    ম্যাট্রিক্স স্বরলিপিতে,

    Var(Y)=AVar(X)A.

    Var(Y)=AVar(X)A.
  5. পোলারাইজেশন সনাক্তকরণের কারণে সমস্ত উপাদানগুলি প্রকৃতপক্ষে অদ্বিতীয়Var(X)Var(X)

    4Cov(Xi,Xj)=Var(Xi+Xj)Var(XiXj).

    4Cov(Xi,Xj)=Var(Xi+Xj)Var(XiXj).

    এটি আমাদের জানায় যে আপনি যদি ইউনিভারিটেড এলোমেলো ভেরিয়েবলগুলির রূপগুলি বুঝতে পারেন তবে আপনি ইতিমধ্যে দ্বিবির্ভর ভেরিয়েবলগুলির সমবায় বুঝতে পারেন: এগুলি বৈকল্পিকগুলির "কেবল" রৈখিক সংমিশ্রণ।


প্রশ্নের : ভেরিয়েবলগুলি হিসাবে মানক করা হয়েছে । আমরা বুঝতে পারি যে এটি কোনও পরিবর্তনশীল, মানকযুক্ত বা না কি তার অর্থ কী তা বিবেচনা করে এটি কী প্রতিনিধিত্ব করে । আমরা প্রতিটি এর কেন্দ্রিক সংস্করণ দ্বারা প্রতিস্থাপন করতাম , এবং তিনটি সূচকযুক্ত পরিমাণের আকার ,XiXi(1)(1)XiXi(2)(2)

μ3(X)ijk=E[XiXjXk].

μ3(X)ijk=E[XiXjXk].

এগুলি ডিগ্রির কেন্দ্রীয় (মাল্টিভারিয়েট) মুহুর্তগুলি33 । হিসাবে , তারা একটি সেন্সর গঠন করে: যখন , তখন(4)(4)Y=AXY=AX

μ3(Y)ijk=l,m,naliamjankμ3(X)lmn.

μ3(Y)ijk=l,m,naliamjankμ3(X)lmn.

এই ট্রিপল যোগফলের সূচকগুলি থেকে মধ্য দিয়ে পূর্ণসংখ্যার সমস্ত সংমিশ্রণের পরিসীমা ।11pp

পোলারাইজেশন আইডেন্টিটির এনালগ

24μ3(X)ijk=μ3(Xi+Xj+Xk)μ3(XiXj+Xk)μ3(Xi+XjXk)+μ3(XiXjXk).

24μ3(X)ijk=μ3(Xi+Xj+Xk)μ3(XiXj+Xk)μ3(Xi+XjXk)+μ3(XiXjXk).

ডানদিকে, ( ) কেন্দ্রীয় তৃতীয় মুহূর্তকে বোঝায়: কেন্দ্রিক ভেরিয়েবলের কিউবের প্রত্যাশিত মান। যখন ভেরিয়েবলগুলি মানক করা হয়, এই মুহুর্তটিকে সাধারণত স্কিউনেস বলা হয় । তদনুসারে, আমরা বলে মনে করতে পারি হচ্ছে বহুচলকীয় বক্রতা এর । এটি থ্রি র‌্যাঙ্কের একটি টেনসর (এটি তিনটি সূচক সহ) যার মানগুলি বিভিন্ন অঙ্কের এবং পার্থক্যের রৈখিক সংমিশ্রণ । যদি আমরা ব্যাখ্যার সন্ধান করি, তবে আমরা এই উপাদানগুলি ডাইমেনশনে মাপার হিসাবে ভেবে দেখব যে পরিমাণে স্কিউনেস এক মাত্রায় পরিমাপ করছে। অনেক ক্ষেত্রে,μ3μ3μ3(X)μ3(X)XXXiXipp

  • প্রথম মুহূর্তগুলি একটি বিতরণের অবস্থান পরিমাপ করে ;

  • দ্বিতীয় মুহূর্ত (ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্স) এর বিস্তার পরিমাপ করে ;

  • প্রমিত দ্বিতীয় মুহুর্তগুলি (পারস্পরিক সম্পর্ক) নির্দেশ করে যে কীভাবে প্রসারণটি ডাইমেনশনাল স্পেসে পরিবর্তিত হয় ; এবংpp

  • মানকৃত তৃতীয় এবং চতুর্থ মুহূর্তগুলি এর বিস্তারের তুলনায় কোনও বিতরণের আকার মাপতে নেওয়া হয় ।

বহুমাত্রিক "আকৃতি" বলতে কী বোঝাতে পারে তার বিশদটি পর্যবেক্ষণ করে দেখা গেছে যে আমরা মূলদিকে অবস্থিত একটি মানক সংস্করণে যে কোনও মাল্টিভারিয়েট বিতরণ হ্রাস করতে এবং সমস্ত দিকগুলিতে সমানভাবে ছড়িয়ে পড়া হ্রাস করার প্রক্রিয়া হিসাবে পিসিএ বুঝতে পারি। পিসিএ সম্পাদিত হওয়ার পরে, তারপরে, বিতরণের বহুমাত্রিক আকারের সহজ সূচক সরবরাহ করবে। এই ধারণাগুলি এলোমেলো ভেরিয়েবল হিসাবে ডেটাতেও সমানভাবে প্রয়োগ করে, কারণ ডেটা সর্বদা তাদের অভিজ্ঞতাগত বিতরণের ক্ষেত্রে বিশ্লেষণ করা যায়।μ3μ3


উল্লেখ

অ্যালান স্টুয়ার্ট এবং জে। কিথ অর্ড, কেন্ডালের অ্যাডভান্সড থিওরি অফ স্ট্যাটিস্টিক্স পঞ্চম সংস্করণ, খণ্ড ১: বিতরণ তত্ত্ব ; তৃতীয় অধ্যায়, মুহুর্ত এবং কমুলেন্টস । অক্সফোর্ড বিশ্ববিদ্যালয় প্রেস (1987)।


পরিশিষ্ট: মেরুকরণ সনাক্তকরণের প্রমাণ

যাক বীজগাণিতিক ভেরিয়েবল হও। তাদের সমস্ত যুক্ত এবং বিয়োগের জন্য ways উপায় রয়েছে । আমরা যখন এই প্রতিটি অঙ্ক-ও-পার্থক্য শক্তিতে উত্থাপন করি, তখন সেই ফলাফলগুলির জন্য উপযুক্ত চিহ্ন বাছাই করে সেগুলি যুক্ত করব, আমরা একাধিক ।x1,,xnx1,,xn2n2nnnnthnthx1x2xnx1x2xn

আরও আনুষ্ঠানিকভাবে, কে সমস্ত টিপলসের সেট হতে দিন , যাতে যে কোনও উপাদান a একটি ভেক্টর যার সমস্ত । দাবিটি হ'লS={1,1}nS={1,1}nnn±1±1sSsSs=(s1,s2,,sn)s=(s1,s2,,sn)±1±1

2nn!x1x2xn=sSs1s2sn(s1x1+s2x2++snxn)n.

2nn!x1x2xn=sSs1s2sn(s1x1+s2x2++snxn)n.(1)

নিশ্চয় মাল্টিনমিয়াল উপপাদ্য বলে যে, monomial সহগ (যেখানে নন-নেগেটিভ থেকে summing পূর্ণসংখ্যা ডান হাত উপর কোন মেয়াদের সম্প্রসারণ মধ্যে) পাশ হয়xi11xi22xinnxi11xi22xinnijijnn

(ni1,i2,,in)si11si22sinn.

(ni1,i2,,in)si11si22sinn.

সংক্ষেপে , জড়িত কোফিসিয়েন্টস জোড়া যেখানে প্রতিটি জোড়া এক ক্ষেত্রে জড়িত প্রদর্শিত , সহগ সমানুপাতিক সঙ্গে বার , সমান থেকে , এবং প্রতিটি জুটির বার , সমানুপাতিক সমানুপাতিক সহ কেস জড়িত । যখনই টি বিজোড় হয় তারা এগুলি বাতিল করে । একই যুক্তি প্রযোজ্য । অতএব,(1)(1)xi11xi11s1=1s1=1s1s1si11si1111s1=1s1=111(1)i1(1)i1(1)i1+1(1)i1+1i1+1i1+1i2,,ini2,,inশুধুমাত্র monomials যে অশূন্য কোফিসিয়েন্টস সঙ্গে ঘটতে অদ্ভুত ক্ষমতা থাকতে হবে সবxixi এই জাতীয় একমাত্র হল । এটি সহগযোগফলের সমস্ত terms পদগুলিতে। ফলস্বরূপ এর সহগ, কিউইডিx1x2xnx1x2xn(n1,1,,1)=n!(n1,1,,1)=n!2n2n2nn!2nn!

আমাদের সাথে যুক্ত প্রতিটি জুটির অর্ধেক অংশ নেওয়া দরকার : এটি হচ্ছে, আমরা এর ডান হাতটি সাথে পদগুলিতে সীমাবদ্ধ করতে পারি এবং বাম হাতের গুণফলকে to এ অর্ধেক করতে পারি। এটি এবং : মামলার জন্য এই উত্তরে উদ্ধৃত পোলারাইজেশন সনাক্তকরণের দুটি সংস্করণ স্পষ্টভাবে দেয় এবং ।x1x1(1)(1)s1=1s1=12n1n!2n1n!n=2n=2n=3n=32212!=42212!=42313!=242313!=24

অবশ্যই বীজগণিতের ভেরিয়েবলগুলির জন্য পোলারাইজেশন পরিচয়টি তাৎক্ষণিকভাবে এলোমেলো ভেরিয়েবলের জন্য বোঝায়: প্রতিটি এলোমেলো পরিবর্তনশীল । উভয় পক্ষের প্রত্যাশা নিন। ফলাফল প্রত্যাশার লাইনারিটি অনুসরণ করে।xixiXi


এতক্ষণে বুঝিয়ে দেওয়ার কাজটি ভাল হয়েছে! মাল্টিভিয়ারেট স্কিউনেস ধরণের ধরণের ধারণাটি তৈরি করে। আপনি সম্ভবত একটি উদাহরণ যুক্ত করতে পারেন যা এই বহুবিধ স্কিউনেসের গুরুত্ব দেখায়? হয় একটি পরিসংখ্যানগত মডেলগুলির একটি সমস্যা হিসাবে বা সম্ভবত আরও আকর্ষণীয়, কোন বাস্তব জীবনের ক্ষেত্রে মাল্টিভারিয়েট স্কিউনেস হতে পারে :)?
পাসক্যালভিকুটেন

3

হুম। যদি আমরা দৌড় ...

a <- rnorm(100);
b <- rnorm(100);
c <- rnorm(100)
mean((a-mean(a))*(b-mean(b))*(c-mean(c)))/
  (sd(a) * sd(b) * sd(c))

এটি 0-এ কেন্দ্রে মনে হয় (আমি একটি সত্যিকারের সিমুলেশন করিনি), তবে @ পিটিএনএফএনএস হিসাবে এটি চালাচ্ছে (সমস্ত ভেরিয়েবল একই)

a <- rnorm(100)
mean((a-mean(a))*(a-mean(a))*(a-mean(a)))/
  (sd(a) * sd(a) * sd(a))

0 এ কেন্দ্রেও বোধ হয়, যা অবশ্যই আমাকে বিস্মিত করে তোলে এটি কী ব্যবহার করতে পারে।


2
আজেবাজে কথাটি স্পষ্টতই আসে যে sdবা বৈকল্পিকতা স্কোয়ারিংয়ের ফাংশন, যেমনটি প্রচলিত আছে। তবে 3 টি ভেরিয়েবলের সাথে
সংখ্যায় ঘনক্ষেত্র

2
এটাই কি এর মূল (পাং উদ্দেশ্য)? অংক এবং ডিনোমিনেটরের একই মাত্রা এবং ইউনিট রয়েছে, যা বাতিল হয়, যাতে একা পরিমাপটি দুর্বলভাবে তৈরি হয় না।
নিক কক্স

3
@ নিক ঠিক আছে। এটি কেবল মাল্টিভারিয়েট কেন্দ্রীয় তৃতীয় মুহুর্তগুলির মধ্যে একটি। এটি তৃতীয় মুহুর্তের পুরো সেটটি প্রদান করে এমন একটি র‌্যাঙ্ক-থ্রি টেনসারের একটি উপাদান (যা মাল্টিভারিয়েট কোমুল্যান্ট জেনারেটিং ফাংশনের অর্ডার -3 উপাদানটির সাথে ঘনিষ্ঠভাবে জড়িত)। অন্যান্য উপাদানগুলির সাথে একযোগে এটি বিতরণে অসমमितা (উচ্চ-মাত্রিক "স্কিউনেস") বর্ণনা করার ক্ষেত্রে কিছুটা কার্যকর হতে পারে। এটি যে কোনও "পরস্পর সম্পর্ক" বলবে তা নয়, যদিও: প্রায় সংজ্ঞা অনুসারে, একটি পারস্পরিক সম্পর্কটি মানক ভেরিয়েবলের দ্বিতীয়-ক্রমের সম্পত্তি।
হোয়াট

1

আপনি তিনটি বা তার বেশি ভেরিয়েবল মধ্যে "পারস্পরিক সম্পর্ক" নিরূপণ করা প্রয়োজন হয়, আপনি পিয়ারসন ব্যবহার করতে পারে না, এই ক্ষেত্রে যেমন একটি চেহারা আছে ভেরিয়েবল বিভিন্ন আদেশের জন্য ভিন্ন হবে এখানে । আপনি যদি লিনিয়ার নির্ভরতার মধ্যে আকর্ষণীয় হন, বা 3 ডি লাইনের সাথে সেগুলি কতটা ভালভাবে ফিট করে, আপনি পিসিএ ব্যবহার করতে পারেন, প্রথম পিসির জন্য ব্যাখ্যািত বৈকল্পিকতা অর্জন করতে পারেন, আপনার ডেটাকে অনুমতি দিতে এবং সম্ভাবনাটি খুঁজে পেতে পারেন যে এ মানটি এলোমেলো কারণে হতে পারে। আমি এখানে অনুরূপ কিছু আলোচনা করেছি (নীচে প্রযুক্তিগত বিবরণ দেখুন)।

মতলব কোড

% Simulate our experimental data
x=normrnd(0,1,100,1);
y=2*x.*normrnd(1,0.1,100,1);
z=(-3*x+1.5*y).*normrnd(1,2,100,1);
% perform pca
[loadings, scores,variance]=pca([x,y,z]);
% Observed Explained Variance for first principal component
OEV1=variance(1)/sum(variance)
% perform permutations
permOEV1=[];
for iPermutation=1:1000
    permX=datasample(x,numel(x),'replace',false);
    permY=datasample(y,numel(y),'replace',false);
    permZ=datasample(z,numel(z),'replace',false);
    [loadings, scores,variance]=pca([permX,permY,permZ]);
    permOEV1(end+1)=variance(1)/sum(variance);
end

% Calculate p-value
p_value=sum(permOEV1>=OEV1)/(numel(permOEV1)+1)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.