বহুগুণে পরিসংখ্যানগুলির গ্রাফিকাল স্বজ্ঞাততা


12

উপর এই পোস্টটি , আপনি বিবৃতি পড়তে পারেন:

মডেল সাধারণত পয়েন্ট দ্বারা প্রতিনিধিত্ব করা হয় θ একটি নির্দিষ্ট মাত্রিক নানাবিধ উপর।

উপর ডিফারেনশিয়াল জ্যামিতি ও পরিসংখ্যান মাইকেল কে মারে এবং জন ডব্লিউ রাইস দ্বারা এই ধারণার পাঠযোগ্য এমনকি গাণিতিক এক্সপ্রেশন উপেক্ষা গদ্য ব্যাখ্যা করা আছে। দুর্ভাগ্যক্রমে, খুব কম চিত্র আছে। ম্যাথওভারফ্লোতে একই পোস্টে যায় ।

আমি বিষয়টির আরও আনুষ্ঠানিক বোঝার দিকে একটি মানচিত্র বা প্রেরণা হিসাবে পরিবেশন করার জন্য ভিজ্যুয়াল উপস্থাপনার জন্য সহায়তা চাইতে চাই।

বহুগুণে পয়েন্টগুলি কী? এই অনলাইন অনুসন্ধানের এই উদ্ধৃতিটি আপাতদৃষ্টিতে ইঙ্গিত দেয় যে এটি হয় ডেটা পয়েন্ট বা বিতরণ পরামিতি হতে পারে:

ম্যানিফোল্ডস এবং তথ্য জ্যামিতির উপর পরিসংখ্যান দুটি ভিন্ন উপায় যেখানে ডিফারেন্সিয়াল জ্যামিতি পরিসংখ্যানকে পূরণ করে। বহুগুণের পরিসংখ্যানগুলিতে, এটি এমন ডেটা যা বহুগুণে থাকে, তথ্য জ্যামিতিতে ডেটা Rn তবে আগ্রহের সম্ভাব্যতা ঘনত্বের কার্যকারিতাগুলির প্যারামিটারাইজড পরিবারকে বহুগুণ হিসাবে বিবেচনা করা হয়। এ জাতীয় বহুগুণ পরিসংখ্যানগত বহুগুণ হিসাবে পরিচিত।


আমি এখানে স্পর্শকাতর স্থানের ব্যাখ্যাটি দ্বারা অনুপ্রাণিত এই চিত্রটি এঁকেছি :

এখানে চিত্র বর্ণনা লিখুন

[ সম্পাদনা সম্পর্কে নিচের মন্তব্য প্রতিফলিত :C ] একটি নানাবিধ, অন , স্পর্শক স্থান একটি বিন্দু আদৌ সম্ভব ডেরাইভেটিভস ( "বেগ") এর সেট পি এম প্রতি সম্ভব বক্ররেখা সঙ্গে যুক্ত ( ψ : আরএম ) পি এর মধ্য দিয়ে বহুগুণে চলমান এটি প্রতিটি বক্ররেখ থেকে পি , অর্থাৎ সি ( টি ) আর এর মধ্য দিয়ে মানচিত্রের সেট হিসাবে দেখা যেতে পারে , যা সংশ্লেষ হিসাবে সংজ্ঞায়িত করা হয়েছে ( (M)pM(ψ:RM)p.p,C(t)R,, সঙ্গেψএকটি বক্ররেখা বাচক (নানাবিধ পৃষ্ঠতলের বাস্তব লাইন থেকে ফাংশন এম ) বিন্দু মাধ্যমে চলমানপি,এবং উপরোক্ত চিত্রে লাল ফোটানো; এবং,একটি পরীক্ষা ফাংশন উপস্থাপন। "Iso-" সাদা কনট্যুর লাইন বাস্তব লাইনে একই পয়েন্ট করতে মানচিত্রের, এবং বিন্দু ঘিরেপি(fψ)(t)ψMp,f,fp

সমতা (বা পরিসংখ্যানগুলিতে প্রয়োগ করা সমতুল্যগুলির মধ্যে একটি) এখানে আলোচনা করা হয়েছে , এবং নিম্নলিখিত উদ্ধৃতিটির সাথে সম্পর্কিত হবে :

একটি সূচকীয় পরিবারের জন্য প্যারামিটার স্থান একটি থাকে মাত্রিক খোলা সংকলন, তাহলে এটি সম্পূর্ণ র্যাঙ্ক বলা হয়।s

একটি সূচকীয় পরিবার নয় পূর্ণ র্যাঙ্ক সাধারণত একটি বাঁকা সূচকীয় পরিবার বলা হয়, যেমন সাধারণত প্যারামিটার স্থান একটি বক্ররেখা হয় মাত্রা কম গুলি Rss.

এটি প্লটটির ব্যাখ্যাটি নীচে তৈরি করে দেখায়: বিতরণযোগ্য পরামিতিগুলি (ক্ষতিকারক বিতরণের পরিবারের ক্ষেত্রে এই ক্ষেত্রে) বহুগুণে থাকে। ডাটা পয়েন্ট ফাংশন মাধ্যমে নানাবিধ উপর একটি লাইন ম্যাপ হবে ψ : আরএম একটি র্যাঙ্ক ঘাটতি অ রৈখিক অপ্টিমাইজেশান সমস্যা ক্ষেত্রে। এটি পদার্থবিদ্যায় বেগের গণনার সমান্তরাল হবে: "আইসো-এফ" লাইনের গ্রেডিয়েন্ট বরাবর এফ ফাংশনের ডেরাইভেটিভ খুঁজছেন (কমলাতে দিকনির্দেশক ডেরাইভেটিভ): ( ψ ) ( টি ) ফাংশন : এমRψ:RMf(fψ)(t). একটি distributional প্যারামিটারের নির্বাচন নিখুঁত হিসাবে বক্ররেখা ভূমিকায় অভিনয় করবে ψ এর কনট্যুর লাইন বরাবর ভ্রমণ নানাবিধ উপর।f:MRψf


ব্যাকগ্রাউন্ড যুক্ত স্টাফ:

দ্রষ্টব্য আমি বিশ্বাস করি যে এই ধারণাগুলি তাত্ক্ষণিকভাবে এমএলগুলিতে অ-রৈখিক মাত্রিক হ্রাস সম্পর্কিত নয় । এগুলি তথ্যের জ্যামিতির সাথে আরও দেখা যায় । এখানে একটি উদ্ধৃতি:

Rnn


সঙ্গে পরিসংখ্যান থেকে নিম্নলিখিত তথ্য Manifolds উপর মডেলিং আকৃতি deformations অ্যাপ্লিকেশন দ্বারা ওরণ Freifeld :

এখানে চিত্র বর্ণনা লিখুন

MTpMpMTpMMTpMpMTpMMpMএটির একদিকে সম্পূর্ণ মিথ্যা lies টিপিএম এর উপাদানগুলিকে ট্যানজেন্ট ভেক্টর বলা হয়।

[...] বহুগুণে, পরিসংখ্যানের মডেলগুলি প্রায়শই স্পর্শকাতর জায়গায় প্রকাশিত হয়।

[...]

M

DL={p1,,pNL}M

DS={q1,,qNS}M

আসুন এবং দুই, সম্ভবত অজানা, পয়েন্ট প্রতিনিধিত্ব । ধারণা করা হয় যে দুটি ডেটাসেট নিম্নলিখিত পরিসংখ্যানীয় বিধিগুলি পূরণ করে:µLµSM

{logμL(p1),,logμL(pNL)}TμLM,logμL(pi)i.i.dN(0,ΣL) {logμS(q1),,logμS(qNS)}TμSM,logμS(qi)i.i.dN(0,ΣS)

[...]

অন্য কথায়, যখন (থেকে স্পর্শক স্থান (স্পর্শক ভেক্টর হিসেবে) প্রকাশ করা হয় এ) , এটি একটি শূন্য গড় গসিয়ান সঙ্গে সহভেদাংক থেকে IID নমুনার একটি সেট হিসেবে দেখা যেতে পারে । , যখন স্পর্শকাতর জায়গায় প্রকাশ করা হয় তখন এটি সহ শূন্য-গড় গাউসিয়ান নমুনার একটি সেট হিসাবে দেখা যেতে পারে । এটি ইউক্লিডিয়ান কেসকে সাধারণীকরণ করে। এম μ এল Σ এল ডি এস μ এস Σ এসDLMμLΣLDSμSΣS

একই রেফারেন্সে, আমি এই গ্রাফিকাল ধারণাটি সম্পর্কে অনলাইনে সবচেয়ে কাছের (এবং ব্যবহারিকভাবে কেবল) উদাহরণ পাই যা সম্পর্কে জিজ্ঞাসা করছি:

এখানে চিত্র বর্ণনা লিখুন

এটি কি সূচিত করবে যে স্পর্শকাতর ভেক্টর হিসাবে প্রকাশিত বহুগুণের উপরিভাগে ডেটা রয়েছে এবং কার্টেসিয়ান বিমানটিতে পরামিতিগুলি ম্যাপ করা হবে?


1
আপনি এখানে কি করার চেষ্টা করছেন? বহুগুণ আঁক? তাদের বেশিরভাগ আঁকতে খুব বিরক্তিকর। উদাহরণস্বরূপ, গাউসিয়ান বিতরণ চেষ্টা করুন।
আকসকল

আমি প্যারামিটার স্পেসগুলি ভেক্টর স্পেস হিসাবে সাধারণত মনে করি, যেমন । আমি যদি প্যারামেট্রিক "ম্যানিফোল্ডস" মনে করি, তবে প্রথমে যে বিষয়টি মনে আসে তা হ'ল "সীমাবদ্ধ সিস্টেমগুলি" যেমন । অন্যথায়, স্থানটি কেন "সম্পূর্ণ" নয়? ("ম্যানিফোল্ড" এমন উপসেটটি কী সংজ্ঞায়িত করছে?)θRnf(θ)=0
জিওম্যাট

2
আশা করি, @ হুবার পাশাপাশি আসবেন এবং আড্ডায় তিনি যে মন্তব্য করেছিলেন তা বিস্তারিতভাবে বর্ণনা করবেন।
গুং - মনিকা পুনরায়

1
আপনার সম্পাদিত প্রশ্নের সংক্ষিপ্ত উত্তরটি "না"। স্পর্শকাতর স্থানটি বহুগুণে সমস্ত মসৃণ পাথের গতিবেগ বর্ণনা করে। পরিসংখ্যানগুলির মধ্যে এর প্রধান ভূমিকা সম্ভাবনা সর্বাধিকীকরণে, যেখানে বহুগুণ একটি চূড়ান্ত প্যারামিটারাইজড পরিবারকে বর্ণনা করে। "ম্যানিফোল্ড লার্নিং" -র ক্ষেত্রে একাধিক ডেটা স্থানীয় অনুমান হিসাবে ব্যবহৃত হয় - এটি লিনিয়ার রিগ্রেশন "কলাম স্পেস" এর একটি বাঁকা সংস্করণ। সেখানে, স্পর্শকাতর স্থানটি পরিবেষ্টিত ইউক্লিডিয়ান স্থানের মধ্যে এমবেড করা হয়েছে। স্থানীয়ভাবে, এটি ডেটার "দিকনির্দেশ" বর্ণনা করে এবং এর সাধারণ বান্ডিলটি "ত্রুটি" দিকনির্দেশ দেয়।
হোবার

1
হ্যাঁ: কোটেনজেন্ট স্থান এ প্রায় ফাংশন জীবাণুর derivations হিসাবে সংজ্ঞায়িত করা যায় । এ স্পর্শক স্পেস (সুতরাং!) কেবল তার দ্বৈত। এবং টপোলজি অর্জন করে - এটি স্থানাংক চার্টের সাহায্যে দুটি স্পর্শকাতর স্থান এবং "কাছাকাছি" থাকার একটি ধারণা স্বীকার করে । এটি স্পর্শকাতর স্থান এর সংজ্ঞা (এবং ভিজ্যুয়ালাইজেশনের সমস্যা) হ্রাস করে । এটি উদ্ভূত সমস্ত ভেক্টরগুলির সেট । স্পিভাক, ম্যানিফোল্ডস-ক্যালকুলাসেTpMpppTMTMTpMTqMMTxRnx, এই ধরণের একটি পরিষ্কার, প্রাথমিক সংজ্ঞা সরবরাহ করে।
হোবার

উত্তর:


3

সম্ভাব্যতা বিতরণের একটি পরিবার বন্টনের প্যারামিটারের সাথে সামঞ্জস্যপূর্ণ অন্তর্ভুক্ত সহ একাধিক পয়েন্ট হিসাবে বিশ্লেষণ করা যেতে পারে । একটি ভুল মেট্রিকের সাথে উপস্থাপনা এড়ানোর ধারণাটি রয়েছে: ইউনিভারিটি গাউসিয়ানস ম্যাথকল below ম্যাথবিবি ইউক্লিডিয়ান বহুগুণে পয়েন্ট হিসাবে প্লট করা যেতে পারে নীচের প্লটের ডানদিকে on গড় সঙ্গে -axis এবং এসডি অক্ষ (ভ্যারিয়েন্স ষড়যন্ত্র ক্ষেত্রে ইতিবাচক অর্ধেক):(Θ)N(μ,σ2),R2xy

এখানে চিত্র বর্ণনা লিখুন

যাইহোক, পরিচয় ম্যাট্রিক্স (ইউক্লিডিয়ান দূরত্ব) পৃথক s এর মধ্যে (ডিস্ক) মিলের ডিগ্রি পরিমাপ করতে ব্যর্থ হবে : ডোমেনের একটি ব্যবধানের পরে উপরের প্লটের বামদিকে স্বাভাবিক বক্ররেখায়, ওভারল্যাপবিহীন অঞ্চলটি (গা dark় নীল মধ্যে) কম বৈকল্পিকের সাথে গাউসিয়ান বক্ররেখার জন্য বৃহত্তর, এমনকি গড়টি স্থির রাখা থাকলেও। আসলে, একমাত্র রিমানিয়ান মেট্রিক যা পরিসংখ্যানগত বহুগুণের জন্য "জ্ঞান করে তোলে" তা হ'ল ফিশার ইনফরমেশন মেট্রিকpdf

ইন ফিশার তথ্য দূরত্ব: একটি জ্যামিতিক পড়া , কোস্টা এসআই, সান্তোসের এসএ এবং Strapasson জে মধ্যে মিল সদ্ব্যবহার গসিয়ান পরিবেশনে ফিশার তথ্য ম্যাট্রিক্স এবং মেট্রিক Beltrami-Pointcaré ডিস্ক মডেল একটি বদ্ধ সূত্র আহরণ করা।

হাইপারবোলয়েড "উত্তর" শঙ্কু একটি ইউক্লিডিয়ান বহুগুণে পরিণত হয়, যেখানে প্রতিটি বিন্দু একটি গড় এবং মান বিচ্যুতি (প্যারামিটার স্পেস) এর সাথে সামঞ্জস্য করে এবং এর মধ্যে সংক্ষিপ্ততম দূরত্ব যেমন এবং নীচের চিত্রের মধ্যে একটি জিওডাসিক বক্ররেখা, প্রস্তাবিত (চার্ট মানচিত্র) নিরক্ষীয় বিমানের উপরে হাইপারপ্যারাবোলিক সরল রেখা হিসাবে এবং মেট্রিক টেনসরের মাধ্যমে মধ্যে দূরত্ব পরিমাপ সক্ষম করে - ফিশার তথ্য মেট্রিক :P ' গুলি , পি প্রশ্ন , পৃ ' গুলি μ νx2+y2x2=1pdfs,PQ,pdfsgμν(Θ)eμeν

D(P(x;θ1),Q(x;θ2))=minθ(t)|θ(0)=θ1,θ(1)=θ201(dθdt)I(θ)dθdtdt

সঙ্গে

I(θ)=1σ2[1002]

এখানে চিত্র বর্ণনা লিখুন

Kullback-Leibler বিকিরণ ঘনিষ্ঠভাবে জ্যামিতি উদাসীন এবং মেট্রিক যুক্ত যদ্যপি সম্পর্কিত হয়।

এবং এটি আকর্ষণীয় বিষয় যে ফিশার তথ্য ম্যাট্রিক্সকে শ্যানন এনট্রপির হেসিয়ান হিসাবে ব্যাখ্যা করা যেতে পারে :

gij(θ)=E[2logp(x;θ)θiθj]=2H(p)θiθj

সঙ্গে

H(p)=p(x;θ)logp(x;θ)dx.

এই উদাহরণটি আরও সাধারণ স্টেরিওগ্রাফিক আর্থ মানচিত্রের মত ধারণার অনুরূপ ।

এমএল বহুমাত্রিক এম্বেডিং বা বহুগুণ শিখন এখানে সম্বোধন করা হয়নি।


1

জ্যামিতির সাথে সম্ভাব্যতাগুলি যুক্ত করার একাধিক উপায় রয়েছে। আমি নিশ্চিত আপনি উপবৃত্ত বিতরণ শুনেছেন (যেমন গাউসিয়ান)। শব্দটি নিজেই জ্যামিতি লিঙ্ককে বোঝায় এবং আপনি যখন এর covariance ম্যাট্রিক্স আঁকেন তখন তা সুস্পষ্ট । বহুগুণে এটি স্থানাঙ্ক সিস্টেমে কেবলমাত্র প্রতিটি প্যারামিটারের মান রাখছে। উদাহরণস্বরূপ, গাউসিয়ান ম্যানিফোল্ড দুটি মাত্রায় হবে: । আর এ আপনার মান থাকতে পারে তবে কেবল ইতিবাচক রূপগুলি । সুতরাং গাউসিয়ান বহুগুণ পুরো স্পেসের অর্ধেক হবে । আকর্ষণীয় নয় μ আর σ 2 > 0 আর 2μ,σ2μRσ2>0R2


আমার ধারণা, আমি ভেবেছিলাম যে "বহুগুণ" এর এমবেডিং স্পেসের চেয়ে কম মাত্রা হওয়ার কথা ? তাহলে অর্ধস্পেসার গণনা হবে না?
জিওম্যাটট 22

গাউসির সাথে এটি এমনকি বহুগুণ নয়, ঠিক। আপনার সীমাবদ্ধতা দরকার, তাই এটি
কোনওরকম

আমি তোমার উত্তরের প্রভাব বুঝতে ... আপনি কি বলতে চান না "চেষ্টা করছি একটি জ্যামিতি লিংক"? এছাড়াও, আমি স্রেফ ম্যাথওভারফ্লোতে এই সম্পর্কিত পোস্টটি পেয়েছি
আন্তনি পরল্লদা

3
এটি একটি উপযুক্ত মেট্রিক সঙ্গে আরো আকর্ষণীয় হয়ে ... ফিশার-রাও এক মত, এবং তারপর পোয়াঁকারে হাইপারবোলিক অর্ধ জায়গা হয়ে en.wikipedia.org/wiki/Poincar%C3%A9_half-plane_model
মাইক

2
সবার কাছে: (1) প্যারামেট্রিক পরিবারগুলি বর্ণনা করে এমন ম্যানিফোল্ডগুলি আন্তঃজাতীয় বহুগুণ: এগুলি কোনও ভেক্টর স্পেসে এম্বেড করার দরকার নেই। (২) এগুলি কেবলমাত্র পার্থক্যযুক্ত বহুগুনের চেয়ে বেশি: ফিশার তথ্য তাদেরকে রিমানিয়ান মেট্রিক - একটি স্থানীয় দূরত্ব দিয়ে দেয় - যা তাদের জ্যামিতিকভাবে অধ্যয়ন করতে সক্ষম করে। এটি "সম্পূর্ণ স্পেসের অর্ধেক " কে একটি বাঁকানো পৃষ্ঠে পরিণত করে। R2
হোবার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.