কোয়ান্ট্রিগ ব্যবহার করে বক্ররেখা সনাক্তকরণের জন্য পরামর্শ


10

আমি ডেটা সেটে আমার মানগুলির 99 তম পার্সেন্টাইল ব্যবহার করে একটি রিগ্রেশন মডেল তৈরি করতে কোয়ান্ট্রিগ প্যাকেজটি ব্যবহার করছি । পূর্ববর্তী স্ট্যাকওভারফ্লো প্রশ্নটি সম্পর্কে পরামর্শের ভিত্তিতে আমি জিজ্ঞাসা করেছি, আমি নিম্নলিখিত কোড কাঠামোটি ব্যবহার করেছি।

mod <- rq(y ~ log(x), data=df, tau=.99)    
pDF <- data.frame(x = seq(1,10000, length=1000) ) 
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )

যা আমি আমার ডেটার শীর্ষে চক্রান্ত করে দেখি। পয়েন্টগুলির জন্য একটি আলফা মান সহ আমি জিজিপ্লট 2 ব্যবহার করে এটি চক্রান্ত করেছি। আমি মনে করি যে আমার বিশ্লেষণে আমার বিতরণের পুচ্ছ যথেষ্ট বিবেচিত হচ্ছে না। সম্ভবত এটি পৃথক পয়েন্ট রয়েছে এই সত্যের কারণে, সেগুলি পারসেন্টাইল ধরণের পরিমাপ দ্বারা উপেক্ষা করা হচ্ছে।

মন্তব্যের মধ্যে একটি পরামর্শ দিয়েছে

প্যাকেজ ভিগনেটে ননলাইনার কোয়ান্টাইল রিগ্রেশন বিভাগ এবং এছাড়াও স্মুথ স্প্লিংস ইত্যাদি মডেল অন্তর্ভুক্ত রয়েছে includes

আমার আগের প্রশ্নের ভিত্তিতে আমি একটি লোগারিথমিক সম্পর্ক ধরেছিলাম, তবে আমি নিশ্চিত নই যে এটি সঠিক কিনা। আমি ভেবেছিলাম আমি 99 তম পারসেন্টাইল অন্তরগুলিতে সমস্ত পয়েন্টগুলি বের করতে এবং তারপরে সেগুলি পৃথকভাবে পরীক্ষা করতে পারি, তবে আমি কীভাবে এটি করব তা নিশ্চিত নই, বা যদি এটি একটি ভাল পদ্ধতির হয়। এই সম্পর্কটি চিহ্নিত করতে কীভাবে উন্নতি করা যায় সে সম্পর্কে আমি যে কোনও পরামর্শের প্রশংসা করব।

এখানে চিত্র বর্ণনা লিখুন


সাইটে ইতিমধ্যে এই জাতীয় ডেটা ট্রান্সফর্ম করার বিষয়ে কথা বলার জন্য বেশ কয়েকটি ভাল প্রশ্ন রয়েছে, দেখুন stats.stackexchange.com/q/1444/1036 বা stats.stackexchange.com/q/298/1036
অ্যান্ডি ডব্লু

আপনি শর্তযুক্ত মিডিয়ান যোগ করার প্লটটি আপডেট করতে পারেন? এটি আমার কাছে ডেটা ট্রান্সফর্মেশন সমস্যার চেয়ে কোয়ান্টাইল ক্রসিং সমস্যার মতো আরও মনে হচ্ছে ...
ব্যবহারকার 603

@ ব্যবহারকারী 603 শর্তসাপেক্ষ মিডিয়ান বলতে কী বোঝ? (আমি অনলাইনে অনুসন্ধান করেছি তবে কীভাবে এটি গণনা করব তা নিশ্চিত নই)
সেলেনিয়াস

rq () ফাংশনে টাউ = 0.5
ব্যবহারকারী 603

1
যদি আপনার লক্ষ্যটি বিশেষত শর্তসাপেক্ষ 99 তম পার্সেন্টাইল অনুমান করা হয়, আমি ননলাইনার কোয়ান্টাইল রিগ্রেশনকে ভোট দেব (কোনও ধরণের - আমি আর প্যাকেজগুলি ভাল করে জানি না), কারণ এটি সত্যিকারের কার্যকরী ফর্মটি জানেন বলে মনে হয় না । প্রকৃত লক্ষ্যটি কী তা আপনার পূর্ববর্তী প্রশ্ন থেকে এখনও আমার কাছে পরিষ্কার ছিল না, তবে আমি স্পেসডম্যান 4 জানুয়ারী থেকে 17:01 এ আপনার পূর্ববর্তী প্রশ্নের মন্তব্যটি পুনরায় প্রকাশ করব
ডেভিড এম কাপলান

উত্তর:


1

সমস্ত মডেল ভুল, কিন্তু কিছু দরকারী (জর্জ বক্স)। আপনি আপনার লাগানো বক্ররেখাতে একটি লগরিদমিক আকৃতি জোর করছেন, এবং সত্যই এটি দেখতে খারাপ লাগে না। লেজটিতে ফিট কম নয় কারণ সেখানে কম পয়েন্ট রয়েছে; আপনি যে দুটি প্যারামিটারকে মঞ্জুরি দিয়েছেন তা হ'ল উপাত্তের মধ্যে ফিট করে। অন্য কথায়, লগ স্কেলে, লেভেজ সরবরাহের জন্য সেই লেজটি আপনার ডেটা থেকে প্রচুর পরিমাণে দূরে নয়। এটি রিগ্রেশনের পরিমাণের প্রকৃতির সাথে সম্পর্কিত নয়; ওএলএস সেই পয়েন্টগুলিকেও উপেক্ষা করবে (বিশেষত লগ স্কেলে)।

আরও কিছু অ-রৈখিকতার জন্য অনুমতি দেওয়া বেশ সহজ। আমি প্রাকৃতিক ভাণ্ডারের আংশিক, কিন্তু আবার সব মডেলই ভুল:

library(splines)
mod <- rq(y ~ ns(log(x), df=6), data=df, tau=.99)

আপনার quantregযদি উদ্বেগের বিষয় থাকে তবে প্যাকেজটিতে মনোোটনিক স্প্লাইজের জন্য কিছু বিশেষ হুক রয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.