কীভাবে দক্ষতার সাথে এলোমেলো ইতিবাচক-সেমাইডাইফিনেট পারস্পরিক সম্পর্ক ম্যাট্রিক্স তৈরি করতে হয়?


38

আমি দক্ষতার সাথে ইতিবাচক-সেমিডেফাইনেট (পিএসডি) পারস্পরিক সম্পর্ক ম্যাট্রিক্স উত্পন্ন করতে সক্ষম হতে চাই। আমি উত্পন্ন হওয়ার জন্য ম্যাট্রিক্সের আকার বাড়ায় আমার পদ্ধতিটি নাটকীয়ভাবে ধীর হয়ে যায়।

  1. আপনি কি কোনও কার্যকর সমাধানের পরামর্শ দিতে পারেন? আপনি যদি মতলবের কোনও উদাহরণ সম্পর্কে অবগত হন তবে আমি খুব কৃতজ্ঞ হব।
  2. একটি পিএসএস পারস্পরিক সম্পর্ক ম্যাট্রিক্স উত্পন্ন করার সময় আপনি কীভাবে উত্পন্ন হওয়ার জন্য ম্যাট্রিকগুলি বর্ণনা করার জন্য পরামিতিগুলি চয়ন করবেন? একটি গড় পারস্পরিক সম্পর্ক, সম্পর্কিত সম্পর্কিত মানক বিচ্যুতি, ইগেনভ্যালু?

উত্তর:


16

আপনি এটি পিছনে করতে পারেন: প্রতিটি ম্যাট্রিক্স (সমস্ত প্রতিসাম্য পিএসডি ম্যাট্রিক্সের সেট) হিসাবে পচে যেতে পারে পি × পিCR++pp×p

C=OTDO যেখানে একটি অর্থনরমাল ম্যাট্রিক্সO

পেতে , প্রথম একটি র্যান্ডম ভিত্তিতে উৎপন্ন (যেখানে র্যান্ডম ভেক্টর, সাধারণত হয় )। সেখান থেকে, গ্রাম-শ্মিট অরথোগোনালাইজেশন প্রক্রিয়াটি ব্যবহার করুন( বনাম 1 , , বনাম পি ) বনাম আমি ( - 1 , 1 ) ( তোমার দর্শন লগ করা 1 , , U পি ) = হেO(v1,...,vp)vi(1,1)(u1,....,up)=O

R এর বেশ কয়েকটি প্যাকেজ রয়েছে যা র্যান্ডম ভিত্তিতে দক্ষতার সাথে জিএস অরথোগোনালাইজেশন করতে পারে, এটি এমনকি বড় মাত্রার জন্যও রয়েছে, উদাহরণস্বরূপ 'দূর' প্যাকেজ। যদিও আপনি উইকিতে জিএস অ্যালগরিদম খুঁজে পাবেন, চাকাটি পুনরায় উদ্ভাবন না করা এবং মাতলাব বাস্তবায়নের জন্য না যাওয়াই ভাল (একটি অবশ্যই উপস্থিত রয়েছে, আমি কেবল কোনও প্রস্তাব দিতে পারি না)।

পরিশেষে, হ'ল একটি তির্যক ম্যাট্রিক্স যার উপাদানগুলি সমস্ত ধনাত্মক (এটি আবার উত্পন্ন করা সহজ: এলোমেলো সংখ্যা উত্পন্ন করুন, তাদের বর্গাকার করুন, তাদেরকে বাছাই করুন এবং ম্যাট্রিক্স দ্বারা একটি পরিচয় এর ত্রিভুজটিতে স্থাপন করুন )।পি পি পিDppp


3
(1) নোট করুন যে ফলাফলের পারস্পরিক সম্পর্ক ম্যাট্রিক্স হবে না (যেমন ওপি দ্বারা অনুরোধ করা হয়েছে), কারণ এটির তির্যকটি থাকবে না। অবশ্যই এটি to এ সেট করার মাধ্যমে তির্যকটি থাকা অবস্থায় পুনরুদ্ধার করা যেতে পারে , যেখানে মতো একই তির্যক সহ একটি তির্যক ম্যাট্রিক্স । (২) যদি আমার ভুল না হয়ে থাকে তবে এর ফলে সমস্ত অফ-ডায়াগোনাল উপাদান আশেপাশে কেন্দ্রীভূত ম্যাট্রিক্সের ফলস্বরূপ ফলস্বরূপ দেখা যায় , সুতরাং অপেক্ষাকৃত কোনও নমনীয়তা নেই যা ওপি খুঁজছিল (ওপিতে গড় পারস্পরিক সম্পর্ক স্থাপন করতে সক্ষম হতে চেয়েছিল) , পারস্পরিক সম্পর্কের মানক বিচ্যুতি, " )Cসি 0E1/2CE1/2EC0
অ্যামিবা বলেছেন পুনর্নির্মাণ মনিকা

@ অ্যামিবা: আমি (২) সম্বোধন করব, যেহেতু আপনি উল্লেখ করেছেন, (১) এর সমাধানটি নগণ্য v একটি পিএসডি ম্যাট্রিক্সের 'আকৃতি' (তির্যক উপাদানগুলির মধ্যে এবং ত্রিভুজের মধ্যে সম্পর্ক) এর এক নম্বর বৈশিষ্ট্য (এবং সুতরাং একটি সমবায় এবং একটি পরস্পর সম্পর্ক ম্যাট্রিক্স) এর শর্ত সংখ্যা। এবং, উপরে বর্ণিত পদ্ধতিটি এটিতে সম্পূর্ণ নিয়ন্ত্রণের অনুমতি দেয়। '0-এর কাছাকাছি অফ তির্যক উপাদানগুলির ঘনত্ব' পিএসএস ম্যাট্রিক্স উত্পন্ন করতে ব্যবহৃত পদ্ধতির বৈশিষ্ট্য নয় বরং ম্যাট্রিক্স পিএসডি এবং বড় যে সত্য তা নিশ্চিত করার জন্য প্রয়োজনীয় প্রতিবন্ধকতার একটি পরিণতি । p
ব্যবহারকারী 60

আপনি কি বলছেন যে সমস্ত বড় পিএসএস ম্যাট্রিক্সে অফ ডায়াগোনাল উপাদানগুলি শূন্যের কাছাকাছি থাকে? আমি দ্বিমত পোষণ করি, এমনটা হয় না। কিছু উদাহরণের জন্য আমার উত্তরটি এখানে দেখুন: র্যান্ডম পারস্পরিক সম্পর্কের ম্যাট্রিক্স কীভাবে উত্পন্ন করা যায় যা প্রায় সাধারণভাবে প্রদত্ত স্ট্যান্ডার্ড বিচ্যুতি সহ অফ-ডায়াগোনাল এন্ট্রি বিতরণ করে? তবে একজন সরাসরি দেখতে পাচ্ছেন যে এটি কেস নয়, কারণ একটি বর্গক্ষেত্রের ম্যাট্রিক্সগুলি সমস্ত ত্রিভুজের উপর রয়েছে এবং একটি নির্দিষ্ট মান everywhere সর্বত্র অফ-ডায়াগোনালটি পিএসডি এবং নির্বিচারে বড় হতে পারে (তবে অবশ্যই নীচে )। ρ 1ρρ1
অ্যামিবা বলছেন পুনর্নির্মাণ মনিকা

@ অ্যামিবা: তখন আমি এই ধারণাটি ভুল করেছিলাম যে প্রয়োজন অনুসারে বৃহত্তর পারস্পরিক সম্পর্ক ম্যাট্রিকের অফ ডায়াগোনাল যখন তাদের উভয় ধনাত্মক এবং নেতিবাচক হওয়ার অনুমতি দেওয়া হয় তখন 0 এর কাছাকাছি থাকে। আলোকিত উদাহরণের জন্য ধন্যবাদ।
ব্যবহারকারী 60

1
আমি এলোমেলো পারস্পরিক সম্পর্ক মেট্রিক্স উত্পন্ন করার জন্য একটি খুব সুন্দর কাগজ পড়েছি এবং আমার নিজের উত্তর এখানে সরবরাহ করেছেন (পাশাপাশি সেই সংযুক্ত থ্রেডের আরও একটি উত্তর)) আমি মনে করি আপনি এটি আকর্ষণীয় মনে হতে পারে।
অ্যামিবা বলেছেন

27

ল্যাভানডোস্কি, কুরোভিকা এবং জো (এলকেজে), ২০০৯ দ্বারা দ্রাক্ষালতা এবং বর্ধিত পেঁয়াজ পদ্ধতির উপর ভিত্তি করে একটি কাগজ উত্সাহিত এলোমেলো পারস্পরিক সম্পর্ক ম্যাট্রিক্স, এলোমেলো পারস্পরিক সম্পর্ক ম্যাট্রিক্স উত্পন্ন করার দুটি দক্ষ পদ্ধতির একীভূত চিকিত্সা এবং প্রদর্শনী সরবরাহ করে provides উভয় পদ্ধতিই নীচে সংজ্ঞায়িত নির্দিষ্ট সুনির্দিষ্ট অর্থে ইউনিফর্ম বিতরণ থেকে ম্যাট্রিক্স তৈরি করতে দেয় , কার্যকর করা সহজ, দ্রুত এবং মজাদার নাম থাকার একটি অতিরিক্ত সুবিধা রয়েছে।

ডায়গোনালের উপরের সাথে আকারের একটি বাস্তব প্রতিসাম্য ম্যাট্রিক্সের অনন্য অফ-ডায়াগোনাল উপাদান রয়েছে এবং তাই পয়েন্ট হিসাবে প্যারাম্যাট্রাইজ করা যেতে পারে । এই স্পেসের প্রতিটি পয়েন্ট একটি প্রতিসম ম্যাট্রিক্সের সাথে মিলে যায় তবে এগুলির সবগুলিই ইতিবাচক-নির্দিষ্ট নয় (যেহেতু পারস্পরিক সম্পর্ক ম্যাট্রিক্স থাকতে হবে)। সম্পর্কযুক্ত ম্যাট্রিকগুলি অতএব actually (আসলে একটি সংযুক্ত উত্তল উপসেট) এর উপসেট গঠন করে এবং উভয় পদ্ধতিই এই উপসেটের উপর একটি অভিন্ন বিতরণ থেকে পয়েন্ট উত্পন্ন করতে পারে।d ( d - 1 ) / 2 R d ( d - 1 ) / 2 R d ( d - 1 ) / 2d×dd(d1)/2Rd(d1)/2Rd(d1)/2

আমি প্রতিটি পদ্ধতির নিজস্ব ম্যাটল্যাব বাস্তবায়ন সরবরাহ করব এবং তাদেরকে দিয়ে চিত্রিত করব ।d=100


পেঁয়াজ পদ্ধতি

পেঁয়াজ পদ্ধতিটি অন্য একটি কাগজ থেকে এসেছে (এল কেজেতে রেফ # 3) এবং এর নামটির মালিকানা এই সত্যটির সাথে আছে যে সম্পর্কের ম্যাট্রিকগুলি ম্যাট্রিক্স দিয়ে শুরু হয় এবং এটি কলাম এবং এক সারি কলাম দ্বারা কলাম বৃদ্ধি করে। ফলাফল বিতরণ অভিন্ন। আমি পদ্ধতির পিছনে গণিতটি সত্যই বুঝতে পারি না (এবং যাইহোক দ্বিতীয় পদ্ধতিটি পছন্দ করি), তবে ফলাফল এখানে:1×1

পেঁয়াজ পদ্ধতি

এখানে এবং প্রতিটি সাবপ্লোটের শিরোনামের নীচে সবচেয়ে ছোট এবং বৃহত্তম ইগেনভ্যালু এবং নির্ধারক (সমস্ত ইগেনভ্যালুগুলির পণ্য) দেখায়। কোডটি এখানে:

%// ONION METHOD to generate random correlation matrices distributed randomly
function S = onion(d)
    S = 1;
    for k = 2:d
        y = betarnd((k-1)/2, (d-k)/2); %// sampling from beta distribution
        r = sqrt(y);
        theta = randn(k-1,1);
        theta = theta/norm(theta);
        w = r*theta;
        [U,E] = eig(S);
        R = U*E.^(1/2)*U';             %// R is a square root of S
        q = R*w;
        S = [S q; q' 1];               %// increasing the matrix size
    end
end

বর্ধিত পেঁয়াজ পদ্ধতি

LKJ এই পদ্ধতি একটু সংশোধন, যাতে নমুনা পারস্পরিক সম্পর্ক ম্যাট্রিক্স পাবে করার জন্য একটি বিতরণ সমানুপাতিক থেকে । বৃহত্তর , বৃহত্তর নির্ধারক হতে হবে, যার অর্থ উত্পন্ন পারস্পরিক সম্পর্ক ম্যাট্রিক্স আরো এবং আরো কাছে করবে পরিচয় ম্যাট্রিক্স। মান ইউনিফর্ম বিতরণের সাথে সমান। উপর ম্যাট্রিক্স নীচের চিত্রে সঙ্গে তৈরি হয় । [ ডি টিC[detC]η1ηη=1η=1,10,100,1000,10000,100000

বর্ধিত পেঁয়াজ পদ্ধতি

কিছু কারণে ভ্যানিলা পেঁয়াজ পদ্ধতি হিসেবে মাত্রার একই আদেশের নির্ধারক পেতে জন্য, আমি রাখতে হবে এবং (যেমন LKJ দাবিকৃত)। ভুল কোথায় হয়েছে তা নিশ্চিত নয়।η=0η=1

%// EXTENDED ONION METHOD to generate random correlation matrices
%// distributed ~ det(S)^eta [or maybe det(S)^(eta-1), not sure]
function S = extendedOnion(d, eta)
    beta = eta + (d-2)/2;
    u = betarnd(beta, beta);
    r12 = 2*u - 1;
    S = [1 r12; r12 1];  

    for k = 3:d
        beta = beta - 1/2;
        y = betarnd((k-1)/2, beta);
        r = sqrt(y);
        theta = randn(k-1,1);
        theta = theta/norm(theta);
        w = r*theta;
        [U,E] = eig(S);
        R = U*E.^(1/2)*U';
        q = R*w;
        S = [S q; q' 1];
    end
end

দ্রাক্ষালতা পদ্ধতি

ভাইন পদ্ধতিটি প্রথমে জো দ্বারা প্রস্তাবিত (এলকেজে তে জে) এবং এলকেজে দ্বারা উন্নত। আমি এটি আরও পছন্দ করি, কারণ এটি ধারণাগতভাবে সহজ এবং সংশোধন করাও সহজ। ধারণাটি হ'ল আংশিক সম্পর্ক স্থাপন (সেগুলি স্বতন্ত্র এবং থেকে কোনও সীমাবদ্ধতা ছাড়াই কোনও মান থাকতে পারে ) এবং তারপরে পুনরাবৃত্ত সূত্রের মাধ্যমে কাঁচা পারস্পরিক সম্পর্কের মধ্যে রূপান্তর করতে হবে। একটি নির্দিষ্ট ক্রমে গণনাটি সংগঠিত করা সুবিধাজনক এবং এই গ্রাফটি "দ্রাক্ষালতা" হিসাবে পরিচিত। গুরুত্বপূর্ণভাবে, যদি নির্দিষ্ট বিটা বিতরণ (ম্যাট্রিক্সের বিভিন্ন কোষের জন্য পৃথক) থেকে আংশিক সম্পর্কের নমুনা দেওয়া হয়, তবে ফলস্বরূপ ম্যাট্রিক্স সমানভাবে বিতরণ করা হবে। এখানে আবার, এলকেজে আনুপাতিক থেকে নমুনা করার জন্য একটি অতিরিক্ত প্যারামিটার introduce প্রবর্তন করেd(d1)/2[1,1]η[detC]η1 । ফলাফলটি বর্ধিত পেঁয়াজের সাথে অভিন্ন:

দ্রাক্ষালতা পদ্ধতি

%// VINE METHOD to generate random correlation matrices
%// distributed ~ det(S)^eta [or maybe det(S)^(eta-1), not sure]
function S = vine(d, eta)
    beta = eta + (d-1)/2;   
    P = zeros(d);           %// storing partial correlations
    S = eye(d);

    for k = 1:d-1
        beta = beta - 1/2;
        for i = k+1:d
            P(k,i) = betarnd(beta,beta); %// sampling from beta
            P(k,i) = (P(k,i)-0.5)*2;     %// linearly shifting to [-1, 1]
            p = P(k,i);
            for l = (k-1):-1:1 %// converting partial correlation to raw correlation
                p = p * sqrt((1-P(l,i)^2)*(1-P(l,k)^2)) + P(l,i)*P(l,k);
            end
            S(k,i) = p;
            S(i,k) = p;
        end
    end
end

আংশিক সম্পর্কের ম্যানুয়াল নমুনা সহ ভাইন পদ্ধতি

উপরের যে কোনওটি দেখতে পাচ্ছেন, অভিন্ন বিতরণের ফলাফল প্রায়-তির্যক পারস্পরিক সম্পর্কের ম্যাট্রিক্সে আসে। তবে শক্তিশালী পারস্পরিক সম্পর্কের জন্য দ্রাক্ষালতার পদ্ধতিটি সহজেই সংশোধন করা যায় (এটি এলকেজে পেপারে বর্ণিত নয়, তবে সোজাসাপ্টা): এটির জন্য ঘন ঘন বিতরণ থেকে আংশিক সম্পর্কের নমুনা করা উচিত । নীচে আমি তাদের বিটা বিতরণ থেকে নমুনা (থেকে rescaled থেকে ) সঙ্গে । বিটা বিতরণের প্যারামিটার যত ছোট হবে ততই এটি প্রান্তগুলির কাছাকাছি কেন্দ্রীভূত হয়।±1[0,1][1,1]α=β=50,20,10,5,2,1

ম্যানুয়াল নমুনা সহ ভাইন পদ্ধতি

মনে রাখবেন যে এই ক্ষেত্রে বিতরণটি পারমিটেশন ইনগ্রেন্ট হিসাবে গ্যারান্টিযুক্ত নয়, সুতরাং আমি অতিরিক্তভাবে এলোমেলোভাবে প্রজন্মের পরে সারি এবং কলামগুলিকে অনুমতি দিই।

%// VINE METHOD to generate random correlation matrices
%// with all partial correlations distributed ~ beta(betaparam,betaparam)
%// rescaled to [-1, 1]
function S = vineBeta(d, betaparam)
    P = zeros(d);           %// storing partial correlations
    S = eye(d);

    for k = 1:d-1
        for i = k+1:d
            P(k,i) = betarnd(betaparam,betaparam); %// sampling from beta
            P(k,i) = (P(k,i)-0.5)*2;     %// linearly shifting to [-1, 1]
            p = P(k,i);
            for l = (k-1):-1:1 %// converting partial correlation to raw correlation
                p = p * sqrt((1-P(l,i)^2)*(1-P(l,k)^2)) + P(l,i)*P(l,k);
            end
            S(k,i) = p;
            S(i,k) = p;
        end
    end

    %// permuting the variables to make the distribution permutation-invariant
    permutation = randperm(d);
    S = S(permutation, permutation);
end

অফ-ডায়াগোনাল উপাদানগুলির হিস্টোগ্রামগুলি কীভাবে উপরের ম্যাট্রিকগুলিতে সন্ধান করে (একচেটিয়াভাবে বিতরণের প্রকরণটি বাড়ায়):

অফ-তির্যক উপাদান


আপডেট: র্যান্ডম ফ্যাক্টর ব্যবহার করে

কিছু শক্তিশালী পারস্পরিক সম্পর্কের সাথে র্যান্ডম পারস্পরিক সম্পর্কের ম্যাট্রিক্স উত্পন্ন করার একটি খুব সহজ পদ্ধতি উত্তরটি @ শ্যাববিচেফ দ্বারা ব্যবহৃত হয়েছিল, এবং আমি এটি এখানেও বর্ণনা করতে চাই। ধারণাটি এলোমেলোভাবে বেশ কয়েকটি ( ) ফ্যাক্টর লোডিং th ( আকারের এলোমেলো ম্যাট্রিক্স ) উত্পন্ন করে কোভরিয়েন্স ম্যাট্রিক্স (অবশ্যই এটি পুরো পদমর্যাদায় থাকবে না) ) এবং এতে positive পূর্ণ পদ তৈরি করতে ইতিবাচক উপাদানগুলির সাথে একটি এলোমেলো তির্যক ম্যাট্রিক্স । দিয়ে ফলস্বরূপ কোভরিয়েন্স ম্যাট্রিক্সকে একটি সম্পর্কযুক্ত ম্যাট্রিক্সে পরিণত করতে স্বাভাবিক করা যায়ডব্লিউ× ডব্লিউ ডব্লিউডি বি = ওয়াট ডব্লিউ + + ডি সি = - 1 / 2 বি - 1 / 2বি= 100 , 50 , 20 , 10 , 5 , 1k<dWk×dWWDB=WW+DC=E1/2BE1/2যেখানে এর সমান তির্যক সহ একটি তির্যক ম্যাট্রিক্স । এটি খুব সহজ এবং কৌশলটি করে। এখানে for এর জন্য কিছু উদাহরণ সহকর্মী ম্যাট্রিক রয়েছে :EBk=100,50,20,10,5,1

এলোমেলো কারণের থেকে এলোমেলো পারস্পরিক সম্পর্ক ম্যাট্রিক্স

এবং কোড:

%// FACTOR method
function S = factor(d,k)
    W = randn(d,k);
    S = W*W' + diag(rand(1,d));
    S = diag(1./sqrt(diag(S))) * S * diag(1./sqrt(diag(S)));
end

চিত্রগুলি তৈরি করতে এখানে মোড়ানো কোডটি ব্যবহৃত হচ্ছে:

d = 100; %// size of the correlation matrix

figure('Position', [100 100 1100 600])
for repetition = 1:6
    S = onion(d);

    %// etas = [1 10 100 1000 1e+4 1e+5];
    %// S = extendedOnion(d, etas(repetition));

    %// S = vine(d, etas(repetition));

    %// betaparams = [50 20 10 5 2 1];
    %// S = vineBeta(d, betaparams(repetition));

    subplot(2,3,repetition)

    %// use this to plot colormaps of S
    imagesc(S, [-1 1])
    axis square
    title(['Eigs: ' num2str(min(eig(S)),2) '...' num2str(max(eig(S)),2) ', det=' num2str(det(S),2)])

    %// use this to plot histograms of the off-diagonal elements
    %// offd = S(logical(ones(size(S))-eye(size(S))));
    %// hist(offd)
    %// xlim([-1 1])
end

2
এটি একটি দুর্দান্ত রুনডাউন, আমি খুশী হয়ে আমি কিছু বললাম!
শ্যাডটলকার

আমি যখন দ্রাক্ষালতা ভিত্তিক পারস্পরিক সম্পর্ক মেট্রিক্সের আর-তে অনুবাদ করেছি এবং এটি পরীক্ষা করেছি, তখন 1 কলামে সম্পর্কের ঘনত্ব পরবর্তী কলামগুলির সাথে সর্বদা পৃথক ছিল। এটি হতে পারে যে আমি কোনও কিছু ভুলভাবে অনুবাদ করেছি, তবে সম্ভবত এই নোটটি কাউকে সহায়তা করে।
চার্লি

3
আর ব্যবহারকারীদের জন্য, প্যাকেজ ক্লাস্টার জেনারেশন (ডাব্লু কুই এবং এইচ। জো দ্বারা লিখিত) rcorrmatrix ফাংশনটি দ্রাক্ষালতা পদ্ধতি প্রয়োগ করে।
আরএনএম

15

একটি এমনকি সহজ বৈশিষ্ট্য হ'ল বাস্তব ম্যাট্রিক্স , হ'ল ধনাত্মক সেমিডেফিনাইট। কেন এটি হয় তা দেখতে, কেবলমাত্র সমস্ত ভেক্টর জন্য প্রমাণ করতে হবে (অবশ্যই সঠিক আকারের)। এটি তুচ্ছ:যা nonnegative হয়। মতলব মধ্যে, সহজভাবে চেষ্টা করুনAATAyT(ATA)y0yyT(ATA)y=(Ay)TAy=||Ay||

A = randn(m,n);   %here n is the desired size of the final matrix, and m > n
X = A' * A;

অ্যাপ্লিকেশনটির উপর নির্ভর করে, এটি আপনাকে আপনার পছন্দ মতো ইগনাল্যুগুলি বিতরণ করতে পারে না; কোয়াকের উত্তর সে ক্ষেত্রে আরও ভাল। এর eigenvalues Xএই কোড স্নিপেট দ্বারা উত্পাদিত Marchenko-Pastur বন্টন অনুসরণ করা উচিত।

স্টকের পারস্পরিক সম্পর্ক মেট্রিকগুলি অনুকরণের জন্য, বলুন, আপনি কিছুটা ভিন্ন পদ্ধতির চাইতে পারেন:

k = 7;      % # of latent dimensions;
n = 100;    % # of stocks;
A = 0.01 * randn(k,n);  % 'hedgeable risk'
D = diag(0.001 * randn(n,1));   % 'idiosyncratic risk'
X = A'*A + D;
ascii_hist(eig(X));    % this is my own function, you do a hist(eig(X));
-Inf <= x <  -0.001 : **************** (17)
-0.001 <= x <   0.001 : ************************************************** (53)
 0.001 <= x <   0.002 : ******************** (21)
 0.002 <= x <   0.004 : ** (2)
 0.004 <= x <   0.005 :  (0)
 0.005 <= x <   0.007 : * (1)
 0.007 <= x <   0.008 : * (1)
 0.008 <= x <   0.009 : *** (3)
 0.009 <= x <   0.011 : * (1)
 0.011 <= x <     Inf : * (1)

1
আপনি কি কোনও সুযোগেই আপনার ascii_hist ক্রিয়াকলাপটি ভাগ করতে ইচ্ছুক?
btown

@ নীচে মার্জিনটি এটি ধারণ করতে খুব কম!
shabbychef

1
আইতে একটি টাইপ রয়েছে - এটি তার চূড়ান্ত স্কোয়ার মিস করছে! yT(ATA)y=(Ay)TAy=||Ay||
সিলভারফিশ 21

8

কোয়াকের উত্তরের ভিন্নতা হিসাবে: আপনার পছন্দের ডিস্ট্রিবিউশন থেকে এলোমেলো ননিয়েজিটিভ ইগেনভ্যালুগুলি সহ একটি তির্যক ম্যাট্রিক্স rate তৈরি করুন এবং তারপরে একটি মিলের রূপান্তর করুন সহ একটি হার-বিতরণিত সিউডোরানডম অর্থোগোনাল ম্যাট্রিক্স = কিউ ডি কিউ টি কিউDA=QDQTQ


এম: চমৎকার রেফারেন্স: এটি সবচেয়ে কার্যকর সমাধান হিসাবে প্রদর্শিত হয় (asyptotically)।
হোবার

3
@ হুবার: হেই, আমি এটি গোলব এবং ভ্যান লোন (অবশ্যই) থেকে তুলেছি; আমি স্ট্রেস-টেস্টিং ইজেনভ্যালু / একক মান মানের রুটিনগুলির জন্য পরীক্ষার ম্যাট্রিকগুলি তৈরি করতে সহায়তা করার জন্য এটি সর্বদা ব্যবহার করি। কাগজ থেকে দেখা যায়, এটি মূলত কিউআর-ডেকোপোজিংয়ের সমান যা কোয়াওয়াকের পরামর্শ মতো একটি এলোমেলো ম্যাট্রিক্সের সমতুল্য, বাদে এটি আরও দক্ষতার সাথে করা হয়। বিটিডাব্লু হিগামের টেক্সট ম্যাট্রিক্স টুলবক্সে এটির একটি ম্যাটল্যাব বাস্তবায়ন রয়েছে।
জেএম

এম।:> ম্যাটল্যাব বাস্তবায়নের জন্য ধন্যবাদ। আপনি কি কোনও সুযোগে আর-তে একটি হর সিডো-এলোমেলো ম্যাট্রিক্স জেনারেটর সম্পর্কে জানবেন?
ব্যবহারকারী 60

@ কেওয়াক: ধারণা নেই, তবে যদি এখনও বাস্তবায়ন না হয় তবে ম্যাটল্যাব কোডটি আর-তে অনুবাদ করা খুব বেশি কঠিন হওয়া উচিত নয় (যদি সত্যিই তেমন কিছু না থাকে তবে আমি একটি চাবুক মেরে চেষ্টা করতে পারি); একমাত্র পূর্বশর্ত হল সিউডোর্যান্ডম সাধারণ পরিবর্তনের জন্য একটি শালীন জেনারেটর, যা আমি নিশ্চিত যে আর আছে R
জেএম

এম।:> হ্যাঁ আমি সম্ভবত এটি আমার নিজের অনুবাদ করব। লিঙ্কগুলির জন্য ধন্যবাদ, সেরা।
ব্যবহারকারী 60

4

আপনি ম্যাট্রিকগুলির জন্য কোনও বিতরণ নির্দিষ্ট করেন নি। দুটি সাধারণ বিষয় হ'ল উইশার্ট এবং বিপরীত উইশার্ট বিতরণ। বার্টলেট পচানি একটি র্যান্ডম বিশ্বকাপ ম্যাট্রিক্স (যা দক্ষতার একটি র্যান্ডম বিপরীত বিশ্বকাপ ম্যাট্রিক্স প্রাপ্ত সমাধান করা যেতে পারে) এর Cholesky factorisation দেয়।

আসলে, কোলেস্কি স্পেস অন্যান্য ধরণের এলোমেলো পিএসডি ম্যাট্রিক্স উত্পন্ন করার একটি সুবিধাজনক উপায়, কারণ আপনাকে কেবল এটি নিশ্চিত করতে হবে যে তির্যকটি অ-নেতিবাচক।


> এলোমেলো নয়: একই হুইশার্ড থেকে উত্পন্ন দুটি ম্যাট্রিক একে অপরের থেকে স্বতন্ত্র হবে না। আপনি যদি প্রতিটি প্রজন্মের হুইশার্ট পরিবর্তন করার পরিকল্পনা করেন, তবে আপনি কীভাবে প্রথমে সেই হুইশার্ট তৈরি করার পরিকল্পনা করবেন?
ব্যবহারকারী 60

@ কেওয়াক: আমি আপনার প্রশ্নটি বুঝতে পারি না: বারলেটলেট পচন একই উইশার্ট বিতরণ থেকে স্বাধীন অঙ্কন করবে।
সাইমন বাইর্ন

> আমাকে এটিকে পুনঃপ্রকাশ করতে দিন, আপনি আপনার হুইশার্ট বিতরণের স্কেল ম্যাট্রিক্সটি কোথা থেকে পাবেন?
ব্যবহারকারী 60

1
@ কেওয়াওয়াক: এটি বিতরণের একটি প্যারামিটার এবং তাই ঠিক করা হয়েছে। আপনি আপনার বিতরণের পছন্দসই বৈশিষ্ট্যের উপর ভিত্তি করে শুরুতে এটি নির্বাচন করুন (যেমন গড়)।
সাইমন বাইরেন

3

সহজ পদ্ধতিটি হ'ল উপরেরটি, যা এলোমেলো ডেটাসেটের সিমুলেশন এবং গ্রামিয়ানের গণনা । সাবধানতার একটি শব্দ: ফলস্বরূপ ম্যাট্রিক্সটি অভিন্নভাবে এলোমেলো হবে না, এর পচন হিসাবে, ঘূর্ণন থাকবে যা হার পরিমাপ অনুযায়ী বিতরণ করা হবে না। আপনি যদি পিএসডি ম্যাট্রিকগুলি "সমানভাবে বিতরণ" করতে চান তবে আপনি এখানে বর্ণিত যে কোনও পন্থা ব্যবহার করতে পারেন ।UTSU


যদি এন্ট্রিগুলি ইউনিফর্মের পরিবর্তে সাধারণ বিতরণ থেকে উত্পন্ন হয়, তবে আপনি যে পচনটি উল্লেখ করেছেন তা অবশ্যই এসও (এন) ইনগ্রান্ট হতে হবে (এবং তাই হর পরিমাপের সাথে সামঞ্জস্যপূর্ণ)।
হোবার

মজাদার. আপনি কি এর জন্য একটি রেফারেন্স সরবরাহ করতে পারেন?
gappy

1
> এই পদ্ধতির সমস্যাটি হ'ল আপনি বৃহত্তম থেকে বৃহত্তম ইগেনুয়ালু অনুপাত নিয়ন্ত্রণ করতে পারবেন না (এবং আমি মনে করি যে এলোমেলোভাবে উত্পন্ন ডেটাসেটের আকারটি অনন্তের দিকে চলে যায়, এই অনুপাতটি 1 এ রূপান্তরিত হবে)।
ব্যবহারকারী 60

1

আপনি যদি নিজের উত্পন্ন প্রতিসামগ্রী পিএসডি ম্যাট্রিক্সের উপর আরও নিয়ন্ত্রণ রাখতে চান, উদাহরণস্বরূপ একটি সিন্থেটিক বৈধতা ডেটাसेट তৈরি করুন, আপনার কাছে বেশ কয়েকটি পরামিতি উপলব্ধ। একটি প্রতিসম পিএসডি ম্যাট্রিক্স স্বাধীনতার সম্পর্কিত সমস্ত ডিগ্রি সহ এন-ডাইমেনশনাল স্পেসের একটি হাইপার-এলিপিসের সাথে মিলে যায়:

  1. ঘুর্ণন।
  2. অক্ষের দৈর্ঘ্য।

সুতরাং, একটি 2-মাত্রিক ম্যাট্রিক্সের জন্য (অর্থাত্ 2 ডি উপবৃত্ত) আপনার কাছে 1 ঘূর্ণন + 2 অক্ষ = 3 পরামিতি থাকবে।

যদি আবর্তনগুলি অর্থোগোনাল ম্যাট্রিক্সকে মনে করে, তবে এটির সঠিক ট্রেন, যেহেতু নির্মাণটি আবার is , with হ'ল উত্পাদিত Sym.PSD ম্যাট্রিক্স, আবর্তন ম্যাট্রিক্স (যা অর্থোথোনাল ), এবং তির্যক ম্যাট্রিক্স, যার তির্যক উপাদানগুলি উপবৃত্তের অক্ষের দৈর্ঘ্যকে নিয়ন্ত্রণ করবে। Σ ডিΣ=ODOTΣOD

নীচের মতলব কোডটি বর্ধমান কোণ সহ 2 উপর ভিত্তি করে 16 2 মাত্রিক গাউসিয়ান-বিতরণ করা ডেটাসেটগুলি প্লট করে । পরামিতিগুলির এলোমেলো প্রজন্মের কোডটি মন্তব্যে রয়েছে।Σ

figure;
mu = [0,0];
for i=1:16
    subplot(4,4,i)
    theta = (i/16)*2*pi;   % theta = rand*2*pi;
    U=[cos(theta), -sin(theta); sin(theta) cos(theta)];
    % The diagonal's elements control the lengths of the axes
    D = [10, 0; 0, 1]; % D = diag(rand(2,1));    
    sigma = U*D*U';
    data = mvnrnd(mu,sigma,1000);
    plot(data(:,1),data(:,2),'+'); axis([-6 6 -6 6]); hold on;
end

আরো মাত্রা জন্য, তির্যক ম্যাট্রিক্স সোজা সম্মুখগামী হয় (উপরে), এবং ঘূর্ণন ম্যাট্রিক্সের গুণ থেকে আহরণ করা উচিত নয়।U


0

আমি পরীক্ষার জন্য একটি সস্তা এবং প্রফুল্ল পদ্ধতির ব্যবহার করেছি এম এন (0,1) এন-ভেক্টর ভি [কে] তৈরি করা এবং তারপরে P = d * I + Sum Sum V [k] * V [k] '} একটি এনএক্সএন পিএসডি ম্যাট্রিক্স হিসাবে। এম <এন এর সাথে এটি ডি = 0 এর জন্য একক হবে এবং ছোট ডি এর জন্য উচ্চ শর্তের সংখ্যা থাকবে।


2
> এই পদ্ধতির সমস্যাটি হ'ল আপনি বৃহত্তম থেকে বৃহত্তম ইগেনুয়ালু অনুপাত নিয়ন্ত্রণ করতে পারবেন না (এবং আমি মনে করি যে এলোমেলোভাবে উত্পন্ন ডেটাসেটের আকারটি অনন্তের দিকে চলে যায়, এই অনুপাতটি 1 এ রূপান্তরিত হবে)।
ব্যবহারকারী 60

> এছাড়াও, পদ্ধতিটি খুব দক্ষ নয় (একটি গণনার দিক থেকে)
ব্যবহারকারী 603

1
আপনার "এলোমেলো ম্যাট্রিক্স" হ'ল একটি বিশেষভাবে কাঠামোযুক্ত যাকে "ডায়াগোনাল প্লাস র‌্যাঙ্ক -1 ম্যাট্রিক্স" (ডিআর 1 ম্যাট্রিক্স) বলা হয়, তাই আসলে কোনও ভাল প্রতিনিধি এলোমেলো ম্যাট্রিক্স নয়।
জেএম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.