রিগ্রেশন-এ সাম্প্রতিক পর্যবেক্ষণগুলিতে আরও ওজন নির্ধারণ করা


9

আর-এ সাম্প্রতিক পর্যবেক্ষণগুলিতে আমি আরও ওজন কীভাবে নির্ধারণ করব?

আমি এটিকে একটি সাধারণভাবে জিজ্ঞাসা করা প্রশ্ন বা আকাঙ্ক্ষা হিসাবে ধরে নিই তবে এটি কীভাবে বাস্তবায়ন করা যায় তা নির্ণয় করতে আমার খুব কষ্ট হয়েছে। আমি এর জন্য প্রচুর অনুসন্ধান করার চেষ্টা করেছি কিন্তু আমি এর থেকে ভাল ব্যবহারিক উদাহরণ খুঁজে পাচ্ছি না।

আমার উদাহরণে আমার সময়ের সাথে সাথে একটি বড় ডেটাসেট থাকবে। আমি বলতে চাই যে ডেটা সারিগুলির সাম্প্রতিকতম আকারের এক ধরণের ক্ষতিকারক ওজন প্রয়োগ করুন। সুতরাং আমার কাছে এক ধরণের ক্ষতিকারক ক্রিয়াকলাপটি হবে 2015 সালের পর্যবেক্ষণগুলি ___ ২০১২ সালের পর্যবেক্ষণের চেয়ে মডেলটির প্রশিক্ষণের জন্য আরও গুরুত্বপূর্ণ।

আমার ডেটাসেট ভেরিয়েবলগুলিতে শ্রেণিবদ্ধ এবং সংখ্যাসূচক মানগুলির মিশ্রণ রয়েছে এবং আমার লক্ষ্যটি একটি সংখ্যাসূচক মান - যদি তা বিবেচনা করে।

আমি আদর্শভাবে CARET প্যাকেজটিতে, GBM / র্যান্ডম ফরেস্টের মতো মডেলগুলি ব্যবহার করে এটি পরীক্ষা করতে / চেষ্টা করতে চাই।

আপডেটের-প্রশ্ন

আমি দুটি পয়েন্টের মধ্যে তারিখের দূরত্বের মাধ্যমে কীভাবে দ্রুত ওজন ক্ষয় করতে হবে সে সম্পর্কে নীচে প্রদত্ত প্রতিক্রিয়াটির আমি প্রশংসা করি।

যাইহোক, যখন ক্যারেটে এই মডেলটি প্রশিক্ষণের কথা আসে, তখন ওজন ফ্যাক্টরটি ঠিক কীভাবে কার্যকর করে? প্রতিটি প্রশিক্ষণ সারিতে ওজনের মান হ'ল ভবিষ্যতের কিছু বিন্দুর মধ্যবর্তী দূরত্ব এবং thatতিহাসিকভাবে যখন এটি ঘটেছিল।

ওজন কি ভবিষ্যদ্বাণী করার সময় খেলতে আসে? কারণ প্রশিক্ষণ চলাকালীন যদি তারা খেলতে আসে, তাহলে কি বিভিন্ন ধরণের সমস্যাগুলি ঘটবে না কারণ বিভিন্ন ক্রস-ভাঁজগুলির ওজন বিভিন্ন রকম হতে পারে, এমন কি এমন কিছু ভবিষ্যদ্বাণী করার চেষ্টা করেছিল যা এর আগে সময়ে সময়ে হতে পারে?


3
ক্লোজভোট কারণ প্রশ্নকর্তাকে পরিসংখ্যান সংক্রান্ত বিষয়গুলি পরিষ্কার করতে হবে। এটি আমার কাছে পরিষ্কার নয় যে এখানে জিবিএন বা আরএফ উপযুক্ত। এটি সিভি ডটকম
ডিউইন

ঠিক আছে. আমি শীঘ্রই একটি উদাহরণ যুক্ত করব। আমি কেবল ইন্টারনেটে এই ধরণের প্রশ্নটি দেখি, তবে কীভাবে এটি প্রয়োগ / সমাধান করা যায় তার কোনও ठोस উদাহরণ নেই।
user3788557

উত্তর:


5

আর-এ সাম্প্রতিক পর্যবেক্ষণগুলিতে আমি আরও ওজন কীভাবে নির্ধারণ করব?

আমার ধারণা আপনার প্রতিটি পর্যবেক্ষণের সাথে একটি টাইমস্ট্যাম্প যুক্ত। আপনি একটি পরিবর্তনশীল গণনা করতে পারেন timeElapsed = modelingTime - observationTime। এখন আপনি একটি সহজ সূচকীয় ফাংশন প্রয়োগ W=K*exp(-timeElapsed/T)যেখানে, Kএকটি স্কেলিং ধ্রুবক এবং Tহয় সময় ধ্রুবক ক্ষয় ফাংশন জন্য। Wকেস-ওজন হিসাবে কাজ করে।

আমার জ্ঞানের সর্বোপরি , অনেকগুলি প্যারামিটার হিসাবে caretমঞ্জুরি দেয় weight, যা সংশ্লিষ্ট পর্যবেক্ষণের ক্ষেত্রে কেস-ওজনের কলাম হিসাবে সরবরাহ করা হয় (এভাবে # তীরের সমান দৈর্ঘ্য রয়েছে)।


1
ইন ফাংশন caret::trainহয় weights
টিমকিড্লুকাস

ধন্যবাদ উজ্জ্বল - তবে আপনার সমীকরণে 'কে' নির্ধারণের পদ্ধতিটি কী? কোন গাইডলাইন বা সেরা অনুশীলন? এছাড়াও, ক্ষয়ের ক্রিয়াকলাপটির জন্য আপনি 'সময়কাল' বলতে কী বোঝায়?
user3788557

কে কেবলমাত্র একটি স্কেলিং ধ্রুবক এবং এটি মডেলের ফলাফলগুলিকে বেশি প্রভাবিত করবে না। আপনি কিছু মান সেট করতে পারেন যাতে কেস-ওজনের মানগুলির পরিসীমা 0-1 এর কাছাকাছি হতে পারে। "সময়-কালীন" সম্পর্কিত, এটিকে 1 ম আদেশের ঘনিষ্ঠ ক্ষয় ফাংশন বা গড়-জীবনকাল জন্য সময় ধ্রুবকও বলা হয়। আপনি এটি উইকিপিডিয়ায় দেখতে পারেন।
উজ্জ্বল কুমার

আমার পোস্টে আমার আপডেট দেখুন। এই প্রশিক্ষণের সময় সঠিকভাবে কাজ করবে? পরীক্ষার সেটটির বিরুদ্ধে ওজনগুলি কেবল তখন প্রয়োগ করা যেতে পারে কারণ প্রশিক্ষণের মডেলটির পক্ষপাতিত্ব থাকবে? যখন প্রশিক্ষণ সেটটি এলোমেলোভাবে পরিবর্তিত হয়, অতীতে ওজনগুলি অতীতে দামের পূর্বাভাস দেওয়ার জন্য বা সময় মতো নয় যা সময়ের কাছাকাছি নয় against
user3788557

কেস-ওজন ছাড়াই আপনার মডেল প্রশিক্ষণটি পুরানো এবং নতুন উভয় ডেটারকেই সমান গুরুত্ব দেবে তবে প্রস্তাবিত কেস-ওজন সহ এটি আরও নতুন ডেটাটিকে বেশি গুরুত্ব দেবে, সুতরাং সেই দিক থেকে এটি নতুন পর্যবেক্ষণের প্রতি পক্ষপাতদুষ্ট, তবে তা তুমি কি চাও. "কেন কেবল ওজন পরীক্ষার ক্ষেত্রে অনুমোদিত হতে পারে" তা আমি বুঝতে পারি না । এছাড়াও, প্রশিক্ষণ সেট এলোমেলোভাবে পরিবর্তিত হয়ে গেলে বয়স্ক মানগুলির জন্য কীভাবে উচ্চতর ওজন ব্যবহার করা হবে? যখন মডেলিংটাইম সমস্ত প্রশিক্ষণের ক্ষেত্রে একই থাকে। PS মডেল-ওজনগুলি কেবলমাত্র কোনও মডেল ব্যবহার করার সময় প্রয়োগ হয় না, এটি কেবল প্রশিক্ষণের সময়কালেই প্রযোজ্য।
উজ্জ্বল কুমার

0

ডেটা (বিশ্লেষক নয় অনুমানগুলি - অনুমানগুলি) প্রায়শই ওজন স্কিমের রূপটি প্রস্তাব করতে পারে। এটি জিএলএসের মাধ্যমে করা হয় যেখানে তিলের বৈকল্পের মধ্যে পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ পার্থক্য থেকে ভারিত সর্বনিম্ন বর্গাকার মডেলের উপযুক্ত ওজন পাওয়া যায়। ARIMA (টিএসএ পদ্ধতি) এবং এখানে http://docplayer.net/12080848-Outliers-level-shifts-and-variance-changes-in-time-series.html- এর মাধ্যমে পরিবর্তন এবং আউটলাইয়ার সনাক্তকরণের দিকে একবার নজর দিন । আপনি যদি ডেটা পোস্ট করতে চান তবে দয়া করে এখানে এটি করুন এবং আমি আরও আলোকপাত করতে পারে এমন সফ্টওয়্যারটিতে আমার নিয়মিত অ্যাক্সেস রয়েছে বলে আমি আরও চেষ্টা করব এবং আরও সহায়তা করব।

আমি যে সফটওয়্যারটি ব্যবহার করছি তার একটি আর সংস্করণ রয়েছে।

আপনি এআরআইএমএর সাথে কোনও হস্তক্ষেপ বিশ্লেষণে নিয়ন্ত্রণ ভেরিয়েবলগুলি কীভাবে অন্তর্ভুক্ত করবেন সেদিকে লক্ষ্য করতে পারেন? যেহেতু উদাহরণস্বরূপ রয়েছে যে কীভাবে ওজন চিহ্নিত করা হয় এবং ত্রুটি বৈকল্পিকতা স্থিতিশীল করতে ব্যবহৃত হয় তা কার্যকরভাবে বিশ্বাস করা / অস্বীকার করা / ছাড় দেওয়া / ভার করা / নির্দিষ্ট পূর্ববর্তী মানগুলিকে বিশ্বাস করা।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.