কেস ওয়েট লজিস্টিক রিগ্রেশন


9

আমি কয়েকটি লজিস্টিক রিগ্রেশন ইস্যু দেখছি। ("নিয়মিত" এবং "শর্তসাপেক্ষ")।

আদর্শভাবে, আমি প্রতিটি ইনপুট কেস ওজন করতে চাই যাতে গ্ল্যাম সম্ভবত উচ্চতর ওজনযুক্ত কেসগুলি ভুলভাবে শ্রেণিবদ্ধ করার জন্য ব্যয় করে উচ্চতর ওজনযুক্ত কেসগুলি সঠিকভাবে ভবিষ্যদ্বাণী করতে আরও ফোকাস করবে।

অবশ্যই এটি আগে করা হয়েছে। যে কেউ আমাকে কিছু প্রাসঙ্গিক সাহিত্যের দিকে নির্দেশ করতে পারে (বা সম্ভবত কোনও পরিবর্তিত সম্ভাবনা ফাংশনের পরামর্শ দেয়))

ধন্যবাদ!


1
আপনি ধরে নিচ্ছেন যে পূর্বাভাসের বিপরীতে শ্রেণিবিন্যাসটি লক্ষ্য। সম্ভাব্যতার সর্বোত্তম অনুমানের জন্য আপনাকে কোনও কিছুর পুনরায় ওজন করতে হবে না। "ভুয়া negativeণাত্মক" এবং "মিথ্যা ধনাত্মক" কেবলমাত্র বাধ্যতামূলক পছন্দগুলির সাথেই ঘটে এবং সাধারণত কেউ খাঁটি বাইনারি পছন্দ জোর করে না।
ফ্রাঙ্ক হ্যারেল

@ ফ্র্যাঙ্ক আপনি একটি ভাল কথা বলতে। শেষ পর্যন্ত, এই প্রকল্পের লক্ষ্য হ'ল আরও ইভেন্টগুলির ফলাফলের পূর্বাভাস দেওয়া। (সুতরাং, আমি অনুমান করি যে এটি প্রশিক্ষণের ডেটা সহ একটি মেশিন লার্নিংয়ের স্বাদ হিসাবে ভাবা যেতে পারে)) কিছু ফলাফল অন্যদের তুলনায় "গুরুত্বপূর্ণ", তাই আমি সেই অনুযায়ী তাদের ওজন করার উপায় খুঁজছিলাম। সম্ভাবনা ফাংশনটির জন্য নিকের পরামর্শটি অর্থবোধ করে এবং কোডটিতে প্রয়োগ করার জন্য এটি যথেষ্ট তুচ্ছ হওয়া উচিত should
নোয়া

1
আপনার মতো ওজনের কোনও প্রয়োজন ছাড়াই হুবহু একটি সম্ভাবনার মডেল দরকার need
ফ্র্যাঙ্ক হ্যারেল

1
রাইট; ব্যয় ফাংশন প্লাগ ইন এবং পূর্বাভাস সম্ভাবনা ব্যবহার করুন এবং আপনার একটি অনুকূল সিদ্ধান্ত আছে।
ফ্র্যাঙ্ক হ্যারেল

1
একটি ভাল-ক্যালিব্রেটেড সম্ভাব্যতা মডেলের সাথে কোনও "ত্রুটি" নেই, কেবল এলোমেলোতা রয়েছে যা পূর্বাভাস দেওয়া যায় না। অনুকূল সিদ্ধান্তগুলি ভবিষ্যদ্বাণী করা সম্ভাবনার একটি কার্য এবং বিভিন্ন সিদ্ধান্ত গ্রহণের জন্য ব্যয় কার্যকারিতা।
ফ্র্যাঙ্ক হ্যারেল

উত্তর:


3

glmweightsএই উদ্দেশ্যে ঠিক একটি প্যারামিটার ধারণ করে । আপনি এটিকে কোনও স্কেলে সংখ্যার ভেক্টর সরবরাহ করেন যা আপনার পর্যবেক্ষণের মতো একই সংখ্যক ওজন ধারণ করে।

আমি কেবল এখন বুঝতে পারি যে আপনি কথা বলছেন না R। যদি না হয়, আপনি চান করতে পারেন।


আমি আর এর সাথে খুব পরিচিত, তবে আমি সম্ভাবনা ফাংশনের পিছনে গণিতটি বুঝতে চাই। আমি এটি সি ++ বা অন্য কোনও ভাষায় কোড করতে পারি। (কেবলমাত্র গ্ল্যাম ফাংশনের "ব্ল্যাকবক্স" এ বিশ্বাস করা সর্বদা সর্বোত্তম সমাধান নয়)
নূহ

আহ। তোমার জন্য ভাল. ঠিক আছে, যতদূর আমি জানি, ওজনগুলি প্রতি-পর্যবেক্ষণের লগলিস্টিভালিটির সাথে কেবল গুণিত করতে ব্যবহৃত হয়। সুতরাং আপনি যদি একটি অদম্য সংস্করণ লিখে থাকেন তবে ওজনগুলি যুক্ত করে রাখা উচিত le এছাড়াও নোট করুন যে আপনি সর্বদা glm(সম্ভবত) একটি সি বাস্তবায়ন খুঁজে পাওয়ার জন্য উত্স কোডটি দেখতে পারেন ।
নিক সাব্বে

2
@ নিক, আমিও এই ভ্রান্ত ধারণার মধ্যে ছিলাম যে এটি উজ্জ্বলতার মধ্যে ওজন যুক্তির কাজ - এটি নয়। এটি আসলে ব্যবহৃত হয় যখন দ্বি-দ্বিস্থ ফলাফলগুলি এই অর্থে একজাতীয় যে তারা বিভিন্ন সংখ্যক বিচারের ভিত্তিতে রয়েছে। উদাহরণস্বরূপ, যদি প্রথম পর্যবেক্ষণটি দ্বিপদী ছিল (3,.5) এবং দ্বিতীয় বাইনমিয়াল (ছিল ), তাদের ওজন হবে । আবার, গ্ল্যামে ওজন যুক্তি () ওজনকে নমুনা দেয় না। আর এ করতে আপনার ওয়েট অনুযায়ী সেট করা ডেটা প্রসারিত করতে হবে এবং বর্ধিত ডেটা সেটটিতে মডেলটিকে ফিট করতে হবে (এসইগুলি যদিও এই ক্ষেত্রে ভুল হতে পারে)। 7,.53,7
ম্যাক্রো

3
এখানে একটি বার্তা বোর্ডে 'ওজন' যুক্তি নিয়ে আলোচনা করা হয়েছে: r.789695.n4.nabble.com/Weights-in-binomial-glm-td1991249.html
ম্যাক্রো

@ ম্যাক্রো: থেক্স! খুব ঝরঝরে. আপনার মন্তব্যের আগে যদি আমি এটি ব্যবহার করতাম তবে দাঁতে আঘাত করতে পারে এমন একটি বিষয় :-)
নিক সাবে

1

আপনার যদি এসএএস এ অ্যাক্সেস থাকে তবে এটি খুব সহজেই প্রোক জেনমড ব্যবহার করে সম্পন্ন হয়। যতক্ষণ না প্রতিটি পর্যবেক্ষণের ওজনের পরিবর্তনশীল থাকে ততক্ষণ ওজন বিবৃতি ব্যবহারের ফলে আপনি যে ধরণের বিশ্লেষণ সন্ধান করছেন তা সম্পাদন করতে পারবেন। আমি বেশিরভাগই এটি চিকিত্সার ওভার্স-সম্ভাবনা-এর ওজন ব্যবহার করে ব্যবহার করেছি, তবে আপনি কোনও নির্দিষ্ট ধরণের ক্ষেত্রে জোর দেওয়ার জন্য আপনার ডেটাতে ওজন নির্ধারণ করতে পারবেন না এমন কোনও কারণ আমি দেখতে পাচ্ছি না, যতক্ষণ আপনি নিশ্চিত হন যে আপনার এন স্থির থাকবে remains আপনি কোনও ধরণের আইডি ভেরিয়েবল অন্তর্ভুক্ত করার বিষয়টিও নিশ্চিত করতে চাইবেন, কারণ প্রযুক্তিগতভাবে উজ্জ্বল ক্ষেত্রে পুনরায় পর্যবেক্ষণ করা হয়। 'আইডি' এর একটি পর্যবেক্ষণ আইডি এবং 'ডাব্লুটি'র ওজন পরিবর্তনশীল সহ উদাহরণ কোড:

proc genmod data=work.dataset descending;
    class id;
    model exposure = outcome covariate / dist=bin link=logit;
    weight wt;
    repeated subject=id/type=ind;
run;
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.