শিক্ষার্থীর টি-বিতরণের জন্য প্যারামিটারগুলি নির্ধারণ করা


23

শিক্ষার্থীদের টি-বিতরণের পরামিতিগুলির সর্বাধিক সম্ভাবনার অনুমানকারীগুলি কী কী? এগুলি কি বন্ধ আকারে বিদ্যমান? একটি দ্রুত গুগল অনুসন্ধান আমাকে কোনও ফলাফল দেয়নি।

আজ আমি অবিচ্ছিন্ন ক্ষেত্রে আগ্রহী, তবে সম্ভবত আমাকে একাধিক মাত্রায় মডেলটি প্রসারিত করতে হবে।

সম্পাদনা: আমি অবস্থান এবং স্কেল পরামিতিগুলিতে বেশিরভাগ ক্ষেত্রে আগ্রহী। আপাতত আমি ধরে নিতে পারি যে স্বাধীনতার প্যারামিটারের ডিগ্রিগুলি স্থির হয়ে গেছে এবং পরে সর্বোত্তম মানটি খুঁজে পেতে সম্ভবত কিছু সংখ্যক স্কিম ব্যবহার করুন।


আমার জানা মতে এগুলি বন্ধ আকারে নেই। একটি গ্রেডিয়েন্ট অ্যাসেন্ট টাইপ পদ্ধতির প্রয়োজন হতে পারে।
প্যাট

যদিও স্টুডেন্ট টি ডিস্ট্রিবিউশনের একক প্যারামিটার থাকলেও আপনি বহুবচনটিতে "পরামিতি" উল্লেখ করেন। আপনি সম্ভবত অবস্থান এবং / বা স্কেল পরামিতি অন্তর্ভুক্ত করছেন?
whuber

@ শুভেচ্ছাই, মন্তব্যের জন্য ধন্যবাদ, আমি স্বাধীনতার ডিগ্রির চেয়ে বেশি অবস্থান এবং স্কেল প্যারামিটারে আগ্রহী।
গ্রাজেনিও

সঙ্গে ডেটা, অবস্থান পরামিতি জন্য সম্ভাবনা সমীকরণ algebraically ডিগ্রী একটি বহুপদী সমতূল্য । আপনি কি "বদ্ধ আকারে" প্রদত্ত এমন বহুবর্ষের শূন্যকে বিবেচনা করেন? 2 এন - 1এন2এন-1
whuber

@ হুবুহু, ছোট এন এর জন্য বিশেষ কোনও মামলা রয়েছে, যেমন এন = 3?
গ্রাজনিও

উত্তর:


27

টির জন্য বদ্ধ ফর্মটি বিদ্যমান নেই, তবে EM অ্যালগরিদমের মাধ্যমে খুব স্বজ্ঞাত এবং স্থিতিশীল পন্থা। শিক্ষার্থীরা এখন স্বাভাবিকের স্কেল মিশ্রণ, আপনি নিজের মডেলটি লিখতে পারেন

Yআমি=μ+ +আমি

যেখানে এবং w iG a ( νআমি|σ,Wআমি~এন(0,σ2Wআমি-1)। এর অর্থ এই যে শর্তসাপেক্ষে উপরWআমিMLE শুধু ভরযুক্ত গড় এবং মানক চ্যুতির হয়। এটি "এম" পদক্ষেপWআমি~জিএকটি(ν2,ν2)Wআমি

σ 2=ΣআমিWআমি(Yআমি - μ )2

μ^=ΣআমিWআমিYআমিΣআমিWআমি
σ^2=ΣআমিWআমি(Yআমি-μ^)2এন

এখন "ই" ধাপে প্রতিস্থাপিত তার প্রত্যাশা সঙ্গে সমস্ত ডেটা দেওয়া। এটি হিসাবে দেওয়া হয়:Wআমি

W^আমি=(ν+ +1)σ2νσ2+ +(Yআমি-μ)2

সুতরাং আপনি কেবলমাত্র প্রতিটি প্যারামিটার অনুমানের সাথে প্রতিটি সমীকরণের "ডানদিকে" প্রতিস্থাপন করে উপরের দুটি পদক্ষেপটি পুনরাবৃত্তি করুন।

এটি খুব সহজেই টি বিতরণের দৃust়তা বৈশিষ্ট্যগুলি দেখায় যেহেতু বড় অবশিষ্টাংশের সাথে পর্যবেক্ষণগুলি অবস্থানের জন্য গণনায় কম ওজন গ্রহণ করে এবং σ 2 এর গণনায় সীমিত প্রভাব ফেলে । "বেষ্টিত প্রভাব" দ্বারা আমি বলতে চাচ্ছি যে জন্য অনুমান অবদান σ 2 ith পর্যবেক্ষণ একটি প্রদত্ত থ্রেশহোল্ড অতিক্রম করতে পারে না থেকে থাকে (এটি ( ν + + 1 ) σ 2 ই.এম. অ্যালগোরিদমের মধ্যে)। এছাড়াও ν একটি "বলিষ্ঠতার" প্যারামিটারটি যে বৃদ্ধি (কমছে) ν এবং আরো (কম) অভিন্ন ওজন পরিণাম ডেকে আনবে অত: পর আরও বেশি (কম) outliers সংবেদনশীলতা।μσ2σ2(ν+ +1)σ2νν

একটি বিষয় লক্ষণীয় হ'ল লগ সম্ভাবনা ফাংশনটিতে একাধিক স্থির অবস্থান থাকতে পারে, সুতরাং ইএম অ্যালগরিদম গ্লোবাল মোডের পরিবর্তে স্থানীয় মোডে রূপান্তর করতে পারে। লোকাল মোডগুলি সম্ভবত যখন কোনও প্লেয়ারটির খুব কাছাকাছি অবস্থানের প্যারামিটার শুরু করা হয় তখন তারা খুঁজে পেতে পারে। সুতরাং এটি থেকে এড়ানোর জন্য মধ্যম থেকে শুরু করা ভাল উপায়।


1
সেটা খুবই ভালো. আমি ছাত্রদের মাপের জন্য কিছুটা সময় EM ব্যবহার করার উপযুক্ততার ধারণাটি নিয়েছিলাম কারণ এটি গাউসিয়ানদের মিশ্রণের মতো দেখাচ্ছে। আপনার দেওয়া আপডেট সমীকরণগুলির জন্য আপনার কাছে কোনও উদ্ধৃতি / রেফারেন্স রয়েছে? এটি হ'ল এই পোস্টের দুর্দান্ততা আরও বাড়িয়ে তুলবে।
প্যাট

প্রকৃতপক্ষে, আমি মনে করি যে আমি ছাত্র খুঁজে পেয়েছি তার একটি মিশ্রণ মডেল (যা আমি তাই স্টাফের জন্য ব্যবহার করতে যাচ্ছি): কঠোর নিবন্ধের জন্য শক্ত কাঠামো হিসাবে শিক্ষার্থীর টি-বিতরণের মিশ্রণ। ডিমেট্রিয়াস জেরোগিয়ানিস, ক্রিস্টোফরোস নিকু, অ্যারিস্টিডিস লিকাস। চিত্র এবং ভিশন কম্পিউটিং 27 (2009) 1285–1294।
পট

এই প্রশ্নের আমার উত্তরের লিঙ্কটিতে সম্ভাব্যতার ফাংশনগুলি - কোয়ান্টাইল, শিক্ষার্থী, লজিস্টিক এবং সাধারণ প্রতিরোধের বোঝা ও বোঝার জন্য খুব সাধারণ EM কাঠামো রয়েছে। আপনার সুনির্দিষ্ট কেসটি হল "রিগ্রেশন" যা কোভারিয়েট ছাড়াই - কেবলমাত্র বাধা দেওয়া - সুতরাং এই কাঠামোর সাথে সুন্দরভাবে ফিট করে। এছাড়াও, এখানে অনেকগুলি পেনাল্টি শর্তাদি রয়েছে যা আপনি এই কাঠামোটিতে অন্তর্ভুক্ত করতে পারেন।
সম্ভাব্যতা ব্লগ

ν

আমি মনে করি @ প্যাট এর চেয়ে এই রেফারেন্সটি ভাল। 'ইএম এবং এটির এক্সটেনশান, ইসিএম এবং ইসিএম ব্যবহার করে এই বিভাজনের এমএল স্টেস্টেশন।' স্থানীয়-সর্বোত্তম সমস্যার কারণে ইএম অ্যালগরিদম চালানোর সময় আপনাকে প্রাথমিক প্যারামিটার মান বাছাইয়ের বিষয়ে খুব সতর্ক থাকতে হবে। অন্য কথায়, আপনাকে আপনার ডেটা সম্পর্কে কিছু জানতে হবে। সাধারণত, আমি আমার গবেষণায় টি বিতরণের ব্যবহার এড়াতে চাই।

4

নিম্নলিখিত পোস্টে আপনার পোস্ট করা ঠিক ঠিক সেই সমস্যাটির সমাধান করেছে।

লিউ সি এবং রুবিন ডিবি 1995. "ইএম এবং এর এক্সটেনশনগুলি, ইসিএম এবং ইসিএমই ব্যবহার করে টি বিতরণের এমএল অনুমান।" পরিসংখ্যান সিনিকা 5: 19-39।

এটি স্বাধীনতার ডিগ্রির সাথে বা তার জ্ঞান ছাড়াই একটি সাধারণ মাল্টিভারিয়েট টি-বিতরণ প্যারামিটার অনুমান সরবরাহ করে provides পদ্ধতিটি বিভাগ 4 এ পাওয়া যাবে এবং এটি 1-মাত্রার জন্য সম্ভাব্যতা সম্পর্কিত খুব অনুরূপ।


7
দেখে মনে হচ্ছে আপনি যে কাগজটি উল্লেখ করেছেন তাতে প্রশ্নের একটি দরকারী উত্তর রয়েছে তবে উত্তরগুলি যখন একক হয়ে থাকে এবং বাইরের সংস্থানগুলির প্রয়োজন হয় না তখন উত্তরগুলি আরও ভাল হয় (উদাহরণস্বরূপ, এটি সম্ভব হয় যে ওপি বা পাঠকদের এই কাগজে অ্যাক্সেস নেই) )। আপনার উত্তরটিকে আরও এককভাবে তৈরি করতে আপনি কি সামান্য কিছু বের করতে পারেন?
প্যাট্রিক কৌলোম্ব

3

Γ(ν+ +12)νπΓ(ν2)(1+ +টি2ν)-ν+ +12=Γ(ν+ +12)νπΓ(ν2)মেপুঃ{[Ln(1+ +টি2ν)][-ν+ +12]}
νএনএনν

1
এমনকি গাউসিয়ান সেটিংয়ে লগের সম্ভাবনাটি এর পরামিতিগুলিতে ননলাইনার হয় :-)।
whuber

আমি অবস্থান এবং স্কেল প্যারামিটারে স্বাধীনতার ডিগ্রির চেয়ে বেশি আগ্রহী। প্রশ্নের সম্পাদনা দেখুন, এবং সুনির্দিষ্ট না হওয়ার জন্য দুঃখিত।
গ্রাজেনিও

2

আমি সম্প্রতি শিক্ষার্থীদের টি বিতরণের স্কেলের জন্য একটি বদ্ধ-ফর্ম অনুমানক আবিষ্কার করেছি। আমার জ্ঞানের সর্বাধিক, এটি একটি নতুন অবদান, তবে আমি সম্পর্কিত কোনও ফলাফলের পরামর্শ দেওয়ার মত মন্তব্যে স্বাগত জানাব। কাগজটি "কাপলড এক্সফোনেনশিয়াল" বিতরণের পরিবারের প্রসঙ্গে পদ্ধতিটি বর্ণনা করে। শিক্ষার্থীর টি দম্পতিযুক্ত গাউসিয়ান হিসাবে অভিহিত হয়, যেখানে মিলনের শব্দটি স্বাধীনতার ডিগ্রির পারস্পরিক কাজ। বদ্ধ-রূপ পরিসংখ্যানগুলি নমুনার জ্যামিতিক গড়। মিলন বা স্বাধীনতার ডিগ্রির একটি মান ধরে নিয়ে, স্কেলটির একটি অনুমান সংযুক্তকরণ এবং সুরেলা সংখ্যার সাথে জড়িত কোনও ফাংশন দ্বারা নমুনাগুলির জ্যামিতিক গড়কে গুণ করে নির্ধারণ করা হয়।

https://arxiv.org/abs/1804.03989 জ্যামিতিক গড়কে গৌসীয় বিতরণ, কেন্রিক পি। নেলসন, মার্ক এ কন, সাবির আর উমারভের স্কেলের পরিসংখ্যান হিসাবে পরিসংখ্যান হিসাবে ব্যবহার করুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.