আমি ডেটা সেটে আমার মানগুলির 99 তম পার্সেন্টাইল ব্যবহার করে একটি রিগ্রেশন মডেল তৈরি করতে কোয়ান্ট্রিগ প্যাকেজটি ব্যবহার করছি । পূর্ববর্তী স্ট্যাকওভারফ্লো প্রশ্নটি সম্পর্কে পরামর্শের ভিত্তিতে আমি জিজ্ঞাসা করেছি, আমি নিম্নলিখিত কোড কাঠামোটি ব্যবহার করেছি।
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
যা আমি আমার ডেটার শীর্ষে চক্রান্ত করে দেখি। পয়েন্টগুলির জন্য একটি আলফা মান সহ আমি জিজিপ্লট 2 ব্যবহার করে এটি চক্রান্ত করেছি। আমি মনে করি যে আমার বিশ্লেষণে আমার বিতরণের পুচ্ছ যথেষ্ট বিবেচিত হচ্ছে না। সম্ভবত এটি পৃথক পয়েন্ট রয়েছে এই সত্যের কারণে, সেগুলি পারসেন্টাইল ধরণের পরিমাপ দ্বারা উপেক্ষা করা হচ্ছে।
মন্তব্যের মধ্যে একটি পরামর্শ দিয়েছে
প্যাকেজ ভিগনেটে ননলাইনার কোয়ান্টাইল রিগ্রেশন বিভাগ এবং এছাড়াও স্মুথ স্প্লিংস ইত্যাদি মডেল অন্তর্ভুক্ত রয়েছে includes
আমার আগের প্রশ্নের ভিত্তিতে আমি একটি লোগারিথমিক সম্পর্ক ধরেছিলাম, তবে আমি নিশ্চিত নই যে এটি সঠিক কিনা। আমি ভেবেছিলাম আমি 99 তম পারসেন্টাইল অন্তরগুলিতে সমস্ত পয়েন্টগুলি বের করতে এবং তারপরে সেগুলি পৃথকভাবে পরীক্ষা করতে পারি, তবে আমি কীভাবে এটি করব তা নিশ্চিত নই, বা যদি এটি একটি ভাল পদ্ধতির হয়। এই সম্পর্কটি চিহ্নিত করতে কীভাবে উন্নতি করা যায় সে সম্পর্কে আমি যে কোনও পরামর্শের প্রশংসা করব।