সূচকীয় মডেল অনুমান


10

মডেল হ'ল একটি মডেল যা নীচের সমীকরণ দ্বারা বর্ণিত:

yi^=β0eβ1x1i++βkxki

এই জাতীয় মডেলটি অনুমান করার জন্য সবচেয়ে সাধারণ পদ্ধতির মধ্যে রয়েছে লিনিয়ারাইজেশন, যা উভয় পক্ষের লগারিদম গণনা করে সহজেই করা যায়। অন্যান্য পন্থা কি? আমি বিশেষত আগ্রহীদের সাথে যারা কিছু পর্যবেক্ষণে পরিচালনা করতে পারে ।yi=0

31.01.2011 আপডেট করুন
আমি এই মডেলটি শূন্য উত্পাদন করতে পারে না তা সম্পর্কে আমি সচেতন। আমি কীভাবে মডেলিং করছি এবং আমি কেন এই মডেলটি বেছে নেব সে সম্পর্কে আমি কিছুটা ব্যাখ্যা করব। ধরা যাক যে কোনও ক্লায়েন্ট কোনও দোকানে কত টাকা খরচ করে তা আমরা ভবিষ্যদ্বাণী করতে চাই। অবশ্যই অনেক ক্লায়েন্ট সন্ধান করছেন এবং তারা কিছু কেনেন না, কেন এটি 0 রয়েছে I আমি লিনিয়ার মডেলটি ব্যবহার করতে চাইনি কারণ এটি প্রচুর negativeণাত্মক মান তৈরি করে, যা কোনও ধারণা রাখে না। অন্য কারণটি হ'ল এই মডেলটি লিনিয়ারের চেয়ে অনেক ভাল কাজ করে। আমি এই পরামিতিগুলি অনুমান করতে জেনেটিক অ্যালগরিদম ব্যবহার করেছি যাতে এটি 'বৈজ্ঞানিক' পদ্ধতির ছিল না। এখন আমি আরও বৈজ্ঞানিক পদ্ধতি ব্যবহার করে কীভাবে সমস্যা মোকাবেলা করতে হবে তা জানতে চাই। এটিও ধরে নেওয়া যেতে পারে যে বেশিরভাগ, বা এমনকি সমস্ত, ভেরিয়েবলগুলি বাইনারি ভেরিয়েবল হয়।


1
যদি আপনার ডেটাতে শূন্য থাকে তবে সূচকীয় সংক্ষিপ্ততা যথাযথ নাও হতে পারে, যেহেতু আপনি যেমন মডেল বলেছিলেন সেই মডেলটি শূন্য মানগুলি পর্যবেক্ষণ করতে দেয় না।
এমপিক্টাস

উত্তর:


11

এখানে বেশ কয়েকটি সমস্যা রয়েছে।

(1) মডেলটির স্পষ্টভাবে সম্ভাব্যতা থাকা দরকার । প্রায় সব ক্ষেত্রেই প্যারামিটারের কোনও সেট থাকবে না যার জন্য lhs আপনার সমস্ত ডেটার জন্য আরএসএসের সাথে মেলে: অবশিষ্টগুলি থাকবে। আপনার সেই অবশিষ্টাংশ সম্পর্কে অনুমান করা দরকার। আপনি কি গড়পড়তা শূন্য হওয়ার আশা করেন? প্রতিসম বিতরণ করা হবে? প্রায় বিতরণ করতে হবে?

এখানে দুটি মডেল যা নির্দিষ্ট একটির সাথে একমত হয় তবে মারাত্মকভাবে পৃথকভাবে অনুপাতীয় আচরণের অনুমতি দেয় (এবং ফলস্বরূপ বিভিন্ন পরামিতির অনুমানের ফলস্বরূপ হবে)। আপনি এই মডেলগুলিকে of এর যৌথ বন্টন সম্পর্কে অনুমানের পরিবর্তনের মাধ্যমে পরিবর্তিত করতে পারেন :ϵi

A: yi=β0exp(β1x1i++βkxki+ϵi)
B: yi=β0exp(β1x1i++βkxki)+ϵi.

(নোট করুন যে এটি ডেটার জন্য মডেল ; সাধারণত আনুমানিক ডেটা মান মতো কোনও জিনিস থাকে না ))yiyi^

(২) y এর ইঙ্গিতটির জন্য শূন্য মানগুলি হ্যান্ডেল করার প্রয়োজনটি বর্ণিত মডেল (এ) উভয়ই ভুল এবং অপর্যাপ্ত , কারণ এটি এলোমেলো ত্রুটির সমান হোক না কেন এটি শূন্যের মান উত্পাদন করতে পারে না। উপরের দ্বিতীয় মডেল (বি) y এর মান শূন্য (বা এমনকি নেতিবাচক) মান দেয়। তবে একমাত্র এই জাতীয় ভিত্তিতে কোনও মডেল নির্বাচন করা উচিত নয়। # 1 পুনরাবৃত্তি করতে: ত্রুটিগুলি যুক্তিসঙ্গতভাবে মডেল করা গুরুত্বপূর্ণ।

(3) লিনিয়ারাইজেশন মডেল পরিবর্তন করে । সাধারণত এটির ফলাফল এ (এ) তবে (বি) এর মতো নয় models এটি এমন ব্যক্তিদের দ্বারা ব্যবহৃত হয় যারা এই পরিবর্তনটি জানার জন্য তাদের ডেটা বিশ্লেষণ করেছেন তা প্যারামিটারের অনুমানগুলিতে প্রশংসনীয়ভাবে প্রভাব ফেলবে না এবং যা ঘটছে সে সম্পর্কে অজানা লোকেরা। (পার্থক্যটি বলা শক্ত, বহুবার))

(৪) শূন্য মানের সম্ভাবনাটি পরিচালনা করার একটি সাধারণ উপায় হ'ল প্রস্তাবনা দেওয়া (বা এর কিছু পুনরায় প্রকাশ, যেমন বর্গমূল) সমান শূন্যের কঠোর ইতিবাচক সম্ভাবনা রয়েছে। গাণিতিকভাবে, আমরা কিছু অন্যান্য বিতরণের সাথে একটি পয়েন্ট ভর (একটি "ডেল্টা ফাংশন") মিশ্রিত করছি। এই মডেলগুলি দেখতে এরকম:y

f(yi)F(θ);θj=βj0+βj1x1i++βjkxki

যেখানে ভেক্টর in এর অন্তর্ভুক্ত প্যারামিটারগুলির মধ্যে একটি , কিছু বিতরণ পরিবারকে প্যারামিটারাইজড দ্বারা এবং এর reexpression হয় (: onestop উত্তর দেখুন "লিঙ্ক" সাধারণ রৈখিক মডেলের ফাংশন) 'র। (অবশ্যই, তারপর, = যখন ) উদাহরণগুলি জিরো-স্ফীত পইসন এবং ঋণাত্মক বাইনমিয়াল মডেলPrFθ[f(Y)=0]=θj+1>0θFθ1,,θjfyPrFθ[f(Y)t](1θj+1)Fθ(t)t0

(5) একটি মডেল তৈরি এবং এটি ফিটিংয়ের বিষয়গুলি সম্পর্কিত তবে ভিন্ন । একটি সাধারণ উদাহরণ হিসাবে, এমনকি একটি সাধারণ রিগ্রেশন মডেল ন্যূনতম স্কোয়ারের মাধ্যমে অনেক উপায়ে ফিট হতে পারে (যা সর্বোচ্চ সম্ভাবনা এবং প্রায় একই স্ট্যান্ডার্ড ত্রুটি হিসাবে একই প্যারামিটার অনুমান দেয়), iteratively এই লিস্ট স্কোয়ার reweighted , বিভিন্ন অন্যান্য ধরনের " শক্তসমর্থ লিস্ট স্কোয়ার ," ইত্যাদি ফিটিং পছন্দমত প্রায়ই সুবিধা, মহত উদ্দেশ্য উপর ভিত্তি করে করা হয় ( যেমন , সফ্টওয়্যার প্রাপ্যতা), পরিচিতি, অভ্যাস, বা প্রচলিত রীতি অনুযায়ী, কিন্তু অন্তত কিছু চিন্তা করা উচিত ত্রুটি পদগুলি , কী কী তা অনুমান করা বিতরণের জন্য উপযুক্ত কি তা দেওয়া হয়Y=β0+β1X+ϵϵiসমস্যার ক্ষতির ফাংশন যুক্তিসঙ্গতভাবে হতে পারে এবং অতিরিক্ত তথ্য (যেমন প্যারামিটারগুলির জন্য পূর্ব বিতরণ ) শোষণের সম্ভাবনা হতে পারে ।


10

এটি লগ লিঙ্ক ফাংশন সহ একটি সাধারণীকরণিত লিনিয়ার মডেল (GLM) ।

শূন্যের অ-শূন্য ঘনত্ব সহ কোনও সম্ভাব্যতা বিতরণ কিছু পর্যবেক্ষণে পরিচালনা করবে ; সর্বাধিক সাধারণ হবে পয়সন বিতরণ, যার ফলে পোসন রিগ্রেশন , ওরফে লগ-লিনিয়ার মডেলিং হয়। আর একটি পছন্দ হবে নেতিবাচক দ্বিপদী বিতরণ[0,)yi=0

আপনি COUNT তথ্য না থাকে তাহলে, অথবা যদি অ পূর্ণসংখ্যা মান লাগে, আপনি কি এখনও সম্পূর্ণরূপে জন্য একটি বিতরণ উল্লেখ না করে মডেল রৈখিক সাধারণ কাঠামোর ব্যবহার করতে পারেন কিন্তু এর পরিবর্তে অর্ধ-সম্ভাবনা ব্যবহার করে এর গড় এবং বৈকল্পিকের মধ্যে সম্পর্ক নির্দিষ্ট করে ।yiP(yi|x)


লজ্জাজনকভাবে আমাকে বিশ্ববিদ্যালয়ে এ সম্পর্কে শেখানো হয়নি: / দেখে মনে হচ্ছে এটি এক্ষেত্রে সহায়ক হবে, তবে বিশদে আরও গভীর হতে আমার কিছুটা সময় প্রয়োজন। ধন্যবাদ!
টোমেক তার্কিজেনস্কি

নোট করুন যে সর্বদা পূর্ণসংখ্যার মানগুলিতে পুনরুদ্ধার করা যায় যখন এটি যুক্তিযুক্ত হয়, উদাহরণস্বরূপ পাউন্ড / ডলারের চেয়ে পেন্স / সেন্ট পরিমাপ করুন। যদিও পণ্যের দামের পেন্স / সেন্ট অংশ বিতরণ করার পরে আপনি যে কোনও উপায়ে নিকটতম পাউন্ড / ডলারের সাথে গোল করতে চান, সম্ভবত খুব অসম হবে (অর্থাৎ বেশিরভাগ 99)। yi
জেমস

3

আপনি সর্বদা অ-রৈখিক সর্বনিম্ন স্কোয়ার ব্যবহার করতে পারেন । তারপরে আপনার মডেলটি হবেন:

yi=β0exp(β1x1i+...+βkxki)+εi

এর শূন্যগুলি তখন অ-রৈখিক প্রবণতা থেকে বিচ্যুতি হিসাবে বিবেচিত হবে।yi


পরামিতিগুলির প্রাথমিক মানগুলি সম্পর্কে কী? তাদের চয়ন করার ভাল উপায় কী? আমি যেমন একটি আপডেটে বলেছি এটি ধরে নেওয়া যেতে পারে যে কোনও ধ্রুবক ভেরিয়েবল নেই।
টোমেক তার্কিজেনস্কি

@ টোমেক, আমি মনে করি এগুলি বেছে নেওয়ার ভাল কোনও উপায় নেই। সাধারণত এটি ডেটার উপর নির্ভর করে। আমি ইন্টারসেপ্টের জন্য গড় এবং অন্যান্য সহগের জন্য শূন্য প্রস্তাব করছি।
এমপিটিকাস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.