অতীত ক্রয় থেকে প্রাপ্ত উপাত্ত ব্যবহারের পূর্বাভাস দেওয়ার জন্য কোন অ্যালগরিদম ব্যবহার করা যেতে পারে?


10

একটি অনুমিত সরল তবে আকর্ষণীয় সমস্যার কথা চিন্তা করে, আমি আমার পূর্ববর্তী ক্রয়ের পুরো ইতিহাসের দিক দিয়ে অদূর ভবিষ্যতে প্রয়োজনীয় উপাস্যর পূর্বাভাসের জন্য কিছু কোড লিখতে চাই। আমি নিশ্চিত যে এই ধরণের সমস্যার আরও কিছু জেনেরিক এবং ভাল স্টাডি সংজ্ঞা রয়েছে (কেউ পরামর্শ দিয়েছেন এটি ইআরপি সিস্টেমগুলির মতো কিছু ধারণার সাথে সম্পর্কিত এবং এর মতো)।

আমার কাছে থাকা ডেটা হ'ল পূর্বের ক্রয়ের পুরো ইতিহাস। ধরা যাক আমি কাগজের সরবরাহগুলিতে দেখছি, আমার ডেটা দেখতে (তারিখ, পত্রক) এর মতো দেখাচ্ছে:

2007-05-10   500
2007-11-11  1000
2007-12-18  1000
2008-03-25   500
2008-05-28  2000
2008-10-31  1500
2009-03-20  1500
2009-06-30  1000
2009-09-29   500
2009-12-16  1500
2010-05-31   500
2010-06-30   500
2010-09-30  1500
2011-05-31  1000

এটি নিয়মিত বিরতিতে 'নমুনাযুক্ত' নয়, তাই আমি মনে করি এটি টাইম সিরিজের ডেটা হিসাবে যোগ্যতা অর্জন করে না ।

আমার কাছে প্রতিবার আসল স্টক স্তরের কোনও ডেটা নেই। আমি এই সহজ এবং সীমাবদ্ধ ডেটাটি ব্যবহার করতে চাই ভবিষ্যতে 3,6,12 মাসের মধ্যে আমাকে কত কাগজ লাগবে (উদাহরণস্বরূপ)।

এতক্ষণ আমি জানতে পেরেছি যে আমি যা খুঁজছি তাকে এক্সট্রোপোলেশন বলা হয় এবং এর চেয়ে বেশি কিছু নয় :)

এমন পরিস্থিতিতে কোন অ্যালগরিদম ব্যবহার করা যেতে পারে?

এবং পূর্ববর্তীটি থেকে আলাদা থাকলে কোন অ্যালগরিদম বর্তমান সরবরাহের মাত্রা প্রদান করে আরও কিছু ডেটা পয়েন্টের সুবিধা নিতে পারে (উদাহরণস্বরূপ, যদি আমি জানি যে তারিখে একাদশে ওয়াই শিটগুলি বাকী ছিল)?

আপনি যদি এর জন্য আরও ভাল পরিভাষা জানেন তবে দয়া করে প্রশ্ন, শিরোনাম এবং ট্যাগগুলি সম্পাদনা করতে দ্বিধা বোধ করবেন।

সম্পাদনা করুন: এটির মূল্য কী, তার জন্য আমি পাইথনটিতে কোড করার চেষ্টা করব। আমি জানি যে প্রচুর লাইব্রেরি রয়েছে যা কম-বেশি কোনও অ্যালগরিদম প্রয়োগ করে। এই প্রশ্নের মধ্যে আমি ধারণাগুলি এবং যে কৌশলগুলি ব্যবহার করা যেতে পারে তার সত্যিকার বাস্তবায়ন পাঠকের অনুশীলন হিসাবে রেখে যেতে চাই।


1
প্রিয় পরিসংখ্যানবিদরা, আমি আপনাকে কেবল এই প্রশ্নটি ছেড়ে দেওয়া হয়নি তা জানাতে চাই। সময় এবং অনুপ্রেরণা খুঁজে পাওয়ার সাথে সাথেই আমি এই নির্দিষ্ট সমস্যাটিতে ফিরে আসব (পড়ুন: বস আমাকে এটি করতে বলেছে) এবং আপনার মূল্যবান উত্তরগুলি তদন্ত করবে এবং শেষ পর্যন্ত স্বীকৃত হিসাবে চিহ্নিত করবে (যার অর্থ আমার কাছে "বাস্তবায়িত" বোঝানো হবে)।
লুক 404

উত্তর:


12

প্রশ্নটি সময়ের তুলনায় গ্রাহকের হার নিয়ে উদ্বেগ প্রকাশ করে । এটি সময়ের বিপরীতে হারের রিগ্রেশন (সময়ের বিপরীতে মোট ক্রয়ের রিগ্রেশন নয় ) দাবি করে। ভবিষ্যতের ক্রয়ের জন্য পূর্বাভাস সীমা তৈরি করে এক্সট্রোপোলেশন সম্পন্ন হয় ।

বেশ কয়েকটি মডেল সম্ভব। একটি কাগজবিহীন অফিসে সরানো (যা প্রায় 25 বছর ধরে চলছে :-), আমরা একটি ক্ষতিকারক (হ্রাস) মডেল গ্রহণ করতে পারি। ফলাফলটি নিম্নোক্ত স্ক্যাটারপ্ল্লট দ্বারা গ্রাহক হিসাবে চিত্রিত করা হয়েছে, যার উপর ঘনিষ্ঠভাবে বক্ররেখা অঙ্কন করা হয় (গ্রাহকের লোগারিদমে সাধারণ ন্যূনতম স্কোয়ারগুলির মাধ্যমে লাগানো) এবং এর 95% পূর্বাভাস সীমা। এক্সট্রপোলেটেড মানগুলি 95% আত্মবিশ্বাসের সাথে লাইনের কাছাকাছি এবং পূর্বাভাস সীমাটির মধ্যে থাকা আশা করা যায়।

ব্যক্তিত্ব

উল্লম্ব অক্ষগুলি লিনিয়ার স্কেলে প্রতিদিন পৃষ্ঠাগুলি দেখায়। গা blue় নীল সলিড লাইনটি ফিট: এটি সত্যই ক্ষতিকর তবে লিনিয়ার হওয়ার খুব কাছাকাছি আসে। সূচকীয় ফিটগুলির প্রভাব ভবিষ্যদ্বাণী ব্যান্ডগুলিতে উপস্থিত হয়, যা এই রৈখিক স্কেলগুলিতে ফিটের চারপাশে অসামান্যভাবে স্থাপন করা হয়; একটি লগ স্কেল, তারা প্রতিসাম্য হতে হবে।

একটি আরও সুনির্দিষ্ট মডেল এই সত্যকে বিবেচনা করবে যে স্বল্প সময়ের তুলনায় (বা যখন মোট ক্রয় কম হয়) ব্যবহারের তথ্য আরও অনিশ্চিত, যা ভারী সর্বনিম্ন স্কোয়ারগুলি ব্যবহার করে লাগানো যেতে পারে। এই ডেটাতে পরিবর্তনশীলতা এবং সমস্ত ক্রয়ের আকারের মোটামুটি সমতা দেওয়া, এটি অতিরিক্ত পরিশ্রমের পক্ষে উপযুক্ত নয়।

এই পদ্ধতির মধ্যে অন্তর্বর্তী ইনভেন্টরি ডেটা সামঞ্জস্য করা হয় , যা মধ্যবর্তী সময়ে ব্যবহারের হারকে হ্রাস করতে ব্যবহৃত হতে পারে। যেমন একটি ক্ষেত্রে, কারণ মধ্যবর্তী পরিমাণে খরচ যথেষ্ট পরিমাণে পরিবর্তিত হতে পারে, ওজন সর্বনিম্ন স্কোয়ার পদ্ধতির পরামর্শ দেওয়া হবে।

কি ওজন ব্যবহার করতে হবে? আমরা কাগজের ব্যবহার বিবেচনা করতে পারি, যা অগত্যা কাগজের অবিচ্ছেদ্য পরিমাণে জমা হয়, একটি গণনা হিসাবে যা দিন দিন স্বাধীনভাবে পরিবর্তিত হয়। সংক্ষিপ্ত সময়ের মধ্যে, গণনাটির বৈচিত্রটি পিরিয়ডের দৈর্ঘ্যের সমানুপাতিক হবে। প্রতিদিন গণনাটির বৈচিত্রটি পিরিয়ডের দৈর্ঘ্যের সাথে বিপরীতভাবে আনুপাতিক হবে। ফলস্বরূপ ওজনগুলি আবিষ্কারের মধ্যবর্তী সময়গুলির সাথে সরাসরি আনুপাতিক সমানুপাতিক হওয়া উচিত । সুতরাং, উদাহরণস্বরূপ, ২০০-0-০৫-১০ থেকে ২০০ 2007-০১-১১-এর মধ্যে (প্রায় 180 দিন) 1000 শীটের ব্যবহার 2007-01-2007-2007-এর মধ্যে 1000 শিটের ওজনের প্রায় পাঁচগুণ বেশি হবে - 18, মাত্র 37 দিনের সময়কাল।

পূর্বাভাস অন্তরগুলিতে একই ওজনকে সমন্বিত করা যায়। এটি বলুন, তিন মাস ধরে খাওয়ার পূর্বাভাসের তুলনায় একদিনের মধ্যে গ্রহণের পূর্বাভাসের তুলনামূলকভাবে বিস্তৃত ব্যবধান হবে।

দয়া করে নোট করুন যে এই পরামর্শগুলি সাধারণ মডেল এবং সাধারণ পূর্বাভাসগুলির উপর দৃষ্টি নিবদ্ধ করে, উদ্দেশ্যযুক্ত প্রয়োগের জন্য উপযুক্ত এবং ডেটাতে সুস্পষ্ট বৃহত পরিবর্তনশীল vari যদি প্রজেক্টগুলি জড়িত থাকে, বলুন, একটি বৃহত দেশের জন্য প্রতিরক্ষা ব্যয়, আমরা আরও অনেক ব্যাখ্যামূলক ভেরিয়েবলগুলিকে সামঞ্জস্য করতে চাই, সাময়িক সম্পর্কের জন্য অ্যাকাউন্ট করতে পারি এবং মডেলটিতে আরও অনেক বিশদ তথ্য সরবরাহ করতে চাই।


ডেটা নিয়মিত বিরতিতে নমুনা তৈরি করা হত, হারের বিপরীতে গণনা ব্যবহার করা কি যথাযথ হয়েছে?
ম্যানিজি

1
@ ম্যানিজি হ্যাঁ, তবে কেবল কারণগুলি গণনাগুলি হারের সাথে সরাসরি সমানুপাতিক হবে না, কারণ এটি নিজেরাই গণনা করা উপযুক্ত হবে would ভবিষ্যতের মানটির পূর্বাভাস দেওয়ার প্রকৃত অর্থ কী তা আমরা যখন বিবেচনা করি তখন এখানে হারগুলি ব্যবহারের প্রয়োজনীয়তা স্পষ্ট: আপনাকে পূর্বাভাসের ব্যবহারের সময় ব্যবধান নির্দিষ্ট করতে হবে। এর মধ্যে একটি পরিমাণ পরিমাণ পাওয়ার জন্য একটি সময় পরিমাণের পূর্বাভাস দিচ্ছে, বোঝাচ্ছে যে পরিমাণটি প্রতি ইউনিট সময়কালের পরিমাণ হতে হবে : খরচ হার
হোবার

@ হুবুহু আমাকে ক্ষমা করুন তবে আমি আপনার উত্তরটিতে কোন মডেলগুলি বর্ণনা করা হয়েছে এবং কোন পয়েন্টে একটি শেষ হয়ে অন্যটি শুরু করবে তা আমি পরিষ্কারভাবে বুঝতে পারি না। আমার অনুরূপ সমস্যা রয়েছে এবং আপনার উত্তরের অংশগুলি আমার ঠিক যেমনটি প্রয়োজন তা মনে হচ্ছে তবে এই বিষয়ে আমাকে আরও কিছু গবেষণা করতে হবে এবং যদি আপনি স্বতন্ত্র মডেল বা একটি নির্দিষ্ট বিষয়ে কথা বলছেন তবে আপনার উত্তরটি পড়ে আমি বলতে পারি না that ধীরে ধীরে উন্নতি করা হয়। আপনি যে ওজনগুলি বর্ণনা করছেন তার সাথে মডেলটির কোনও আনুষ্ঠানিক নাম আছে? আপনার প্রথম মডেল (তাত্পর্যপূর্ণ হ্রাস) ওজন জড়িত? আগাম ধন্যবাদ.
এগ্রিস

@rensokuken আমি একটি মডেল এবং ডেটা ওজন করে এমন একটি প্রকরণ বর্ণনা করি describe এই উত্তরের দ্বিতীয়ার্ধে ওজন কীভাবে নির্ধারণ করা যায় তা পরামর্শ দেয়। আমি "ওজনযুক্ত ন্যূনতম স্কোয়ারগুলি" এর বাইরে কোনও আনুষ্ঠানিক নাম জানি না।
whuber

@ যাহা আমি দেখি শুরুতে আপনি বর্ণনা করছি এই এবং তারপর যখন আপনি ওজন যোগ করেন তারা আপনার বর্ণনা করছেন এই , ডান? এছাড়াও, নির্দিষ্ট সমাধানের সাথে সম্পর্কিত এবং পূর্বাভাসে কোনও শিক্ষানবিশকে দেখার জন্য আপনার কি কোনও সংস্থান আছে? স্পষ্টতার জন্য ধন্যবাদ।
এগ্রিস

5

এটি অবশ্যই মেশিন শেখার সমস্যা (আমি আপনার পোস্টে ট্যাগগুলি আপডেট করেছি)। সম্ভবত, এটি লিনিয়ার রিগ্রেশন । সংক্ষেপে, লিনিয়ার রিগ্রেশন 1 নির্ভরশীল এবং 1 বা আরও বেশি স্বাধীন ভেরিয়েবলের মধ্যে সম্পর্ক পুনরুদ্ধার করার চেষ্টা করে। এখানে নির্ভরশীল ভেরিয়েবলটি ভোগ্যযোগ্য ব্যবহারযোগ্য । স্বাধীন ভেরিয়েবলের জন্য আমি ক্রয়ের মধ্যে সময়ের ব্যবধানের পরামর্শ দিই। আপনি আরও স্বতন্ত্র ভেরিয়েবলগুলি যুক্ত করতে পারেন, উদাহরণস্বরূপ, প্রতিটি মুহুর্তে উপভোগযোগ্য জিনিস ব্যবহারকারীর সংখ্যা বা আরও কিছু কিছু যা ক্রয়ের পরিমাণকে প্রভাবিত করতে পারে। আপনি পাইথন মধ্যে বাস্তবায়ন রৈখিক রিগ্রেশনের একসঙ্গে চমৎকার বিবরণ জানতে পারেন এখানে

তত্ত্বগতভাবে, এটিও সম্ভব যে কেবল ক্রয়ের মধ্যে সময়ের ব্যবধানগুলিই নয়, সময়ের সাথে সাথে মুহুর্তগুলিও পরিমাণের উপর প্রভাব ফেলে। উদাহরণস্বরূপ, জানুয়ারিতে কোনও কারণে লোকেরা এপ্রিলের চেয়ে বেশি কাগজ চাইতে পারে। এক্ষেত্রে আপনি নিজেই লিনিয়ার রিগ্রেশন প্রকৃতির কারণে মাসের সংখ্যাটি স্বাধীন ভেরিয়েবল হিসাবে ব্যবহার করতে পারবেন না (মাসের সংখ্যাটি কেবল একটি লেবেল, তবে পরিমাণ হিসাবে ব্যবহৃত হবে)। সুতরাং এটি কীভাবে কাটিয়ে উঠবেন আপনার কাছে 2 উপায় রয়েছে।

প্রথমত, আপনি 12 টি অতিরিক্ত ভেরিয়েবল যুক্ত করতে পারেন , প্রতি মাসের জন্য একটি করে এবং প্রতিটি ভেরিয়েবল 1 তে সেট করে যদি এটি ক্রয়ের মাস উপস্থাপন করে এবং 0 না করে তবে সেট করে to তারপরে একই লিনিয়ার রিগ্রেশন ব্যবহার করুন।

দ্বিতীয়ত, আপনি আরও পরিশীলিত অ্যালগরিদম যেমন এম 5 ' ব্যবহার করতে পারেন যা লিনিয়ার রিগ্রেশন এবং সিদ্ধান্ত গাছের মিশ্রণ রয়েছে (আপনি ডেটা মাইনিং: প্রাকটিকাল মেশিন লার্নিং সরঞ্জামসমূহ এবং কৌশলসমূহের এই অ্যালগরিদমের বিস্তারিত বিবরণ পেতে পারেন )।


এটি আপনার ব্যবহারকারীর সম্পর্কে কতটা ডেটা নির্ভর করে। যদি যথেষ্ট যথেষ্ট হয় (তবে বলুন,> 1 বছরের বেশি 100 লেনদেন), আপনি এই নির্দিষ্ট ব্যবহারকারীর জন্য একটি মডেলকে প্রশিক্ষণ দিতে পারেন। অন্যথায়, সমস্ত ব্যবহারকারীর উপর সাধারণ মডেল আপনাকে আরও ভাল ফলাফল দিতে পারে। আপনি উভয় পদ্ধতির পারফরম্যান্স পরিমাপ করতে ক্রস-বৈধতা ব্যবহার করতে পারেন।
15:48

5

এটি নিয়মিত বিরতিতে 'নমুনাযুক্ত' নয়, তাই আমি মনে করি এটি টাইম সিরিজের ডেটা হিসাবে যোগ্যতা অর্জন করে না।

ক্রয়ের পূর্বাভাস কীভাবে দেওয়া যায় সে সম্পর্কে এখানে একটি ধারণা দেওয়া হয়েছে: তথ্যকে একটি অন্তর্বর্তী ডিমান্ড সিরিজ হিসাবে বিবেচনা করুন । এটি হ'ল নিয়মিত বিরতিতে আপনার কাছে একটি সময় সিরিজ নমুনা থাকে তবে ইতিবাচক মানগুলি স্পষ্টতই অনিয়মিতভাবে ব্যবধানে থাকে। আন্তঃসমাধ্যমে চাহিদা সিরিজের পূর্বাভাস দেওয়ার জন্য ক্রবস্টনের পদ্ধতিটি ব্যবহার করার ক্ষেত্রে রব হ্যান্ডম্যানের একটি সুন্দর কাগজ রয়েছে । আমি পাইথনেও প্রচুর প্রোগ্রাম করার সময়, আপনি ক্রস্টনের পদ্ধতি ব্যবহারের পাশাপাশি রবের দুর্দান্ত আর প্যাকেজ পূর্বাভাসে সহজেই উপলব্ধ অন্যান্য সময় সিরিজের পূর্বাভাস পদ্ধতি ব্যবহার করে প্রচুর অনুসন্ধানের সময় সাশ্রয় করবেন ।


1
+1 একটি নতুন ধারণা দেওয়ার জন্য। শেনস্টোন অ্যান্ড হ্যান্ডম্যান কাগজের প্রবর্তন এবং সিদ্ধান্তগুলি অনুধাবন করা হলেও, পরামর্শ দেয় ক্রোস্টনের পদ্ধতিটি সাধারণত খুব ভাল হয় না: কাগজটি এমন একটি জনপ্রিয় পদ্ধতির ন্যায্যতা প্রমাণ করার চেষ্টা করে যা সীমাবদ্ধ বলে প্রমাণিত হয়; সবচেয়ে ভাল লেখকরা বলতে পারেন যে এটি সত্ত্বেও, "পূর্বাভাস ... এখনও কার্যকর হতে পারে"। এছাড়াও, দেখে মনে হচ্ছে এই মডেলটি ওপির অনুরোধ অনুসারে "বর্তমান সরবরাহের স্তরের" অতিরিক্ত ডেটা সামঞ্জস্য করতে পারে না।
হোবার

3

আমি নিশ্চিত যে আপনি আপনার ডেটা পয়েন্টগুলির সাথে একটি লাইনের সাথে মানিয়ে নিতে কিছুটা রিগ্রেশন বিশ্লেষণ করার চেষ্টা করছেন pretty আপনাকে সহায়তা করার জন্য প্রচুর সরঞ্জাম রয়েছে - এমএস এক্সেল সর্বাধিক অ্যাক্সেসযোগ্য। আপনি যদি নিজের সমাধানটি রোল করতে চান তবে আপনার পরিসংখ্যানগুলিতে সর্বাধিক ব্রাশ করা ভাল ( এখানে এবং এখানে সম্ভবত)। একবার আপনি আপনার ডেটাতে একটি লাইন ফিট করলে আপনি ভবিষ্যতে এক্সট্রোপোলেটেড করতে পারেন।

সম্পাদনা: নীচের মন্তব্যগুলিতে আমি উল্লিখিত এক্সেল উদাহরণটির একটি স্ক্রিনশট এখানে। সাহসী তারিখগুলি আমার নিজের মধ্যে টাইপ করা ভবিষ্যতে এলোমেলো তারিখ। বি কলামের গা bold় মানগুলি এক্সেল এর ক্ষতিকারক প্রতিরোধের স্বাদ দ্বারা গণনা করা বহির্মুখী মান। এখানে চিত্র বর্ণনা লিখুন

সম্পাদনা 2: ঠিক আছে, তাই এই প্রশ্নের উত্তর দিতে, "আমি কী কৌশল ব্যবহার করতে পারি?"

  • ঘৃণ্য প্রতিরোধ (উপরে বর্ণিত)
  • হল্টের পদ্ধতি
  • শীতের পদ্ধতি
  • Arima

দয়া করে প্রতিটি উপর একটু ইন্ট্রো এই পাতা দেখুন: http://www.decisioncraft.com/dmdirect/forecastingtechnique.htm


এটি আমার নিজেকে জিজ্ঞাসা নেতৃত্বে কি হয় আমার ডেটা পয়েন্ট? একক ক্রয় নয় - এটি তাদের মধ্যে কতটা সময় কেটে যায় এবং এইভাবে প্রদত্ত সংস্থার মোট ব্যয় বিবেচনায় নেবে না। নিয়মিত বিরতিতে (যেমন, প্রতি সপ্তাহের পরিমাণ) কিছুটা গড় পেতে আমার তাদের বিরক্ত করা উচিত এবং তারপরে ভবিষ্যতের ডেটা এক্সপোলেটেড করার জন্য টাইম সিরিজ ডেটা ইনপুট হিসাবে এটি ব্যবহার করতে পারি?

একটি প্লটের আপনার 'x' মানগুলির পার্থক্য হিসাবে সময়ের পার্থক্যটিকে ভাবুন। বেশিরভাগ ধরণের রিগ্রেশন বিশ্লেষণ বিবিধ পার্থক্য বিবেচনায় নেবে। এক্সেলে GROWTH ফাংশনটি ব্যবহার করে আপনার নমুনা ডেটা ব্যবহার করে দেখুন, যা ক্ষতিকারক রিগ্রেশন ব্যবহার করে। আপনি যদি তারিখগুলি পরিবর্তন করেন তবে আপনার অনুমানিত মানগুলি সেই অনুযায়ী পরিবর্তন হবে।

3

একটি মন্তব্য হিসাবে শুরু হয়েছে, খুব দীর্ঘ বৃদ্ধি পেয়েছে ...

এটি নিয়মিত বিরতিতে 'নমুনাযুক্ত' নয়, তাই আমি মনে করি এটি টাইম সিরিজের ডেটা হিসাবে যোগ্যতা অর্জন করে না

এটি একটি ভ্রান্ত উপসংহার - এটি অবশ্যই সময় সিরিজ। একটি সময় সিরিজ অনিয়মিতভাবে নমুনাযুক্ত হতে পারে, যখন এটি হয় তখন সাধারণ পদ্ধতির থেকে আলাদা প্রয়োজন হয়।

এই সমস্যাটি বাঁধের স্তরের মতো স্টোকাস্টিক সমস্যাগুলির সাথে সম্পর্কিত বলে মনে হয় (জল সাধারণত সময়ের সাথে মোটামুটি স্থিতিশীল হারে ব্যবহৃত হয়, কখনও কখনও দ্রুত বা কম বা দ্রুত হ্রাস হয়, অন্য সময়ে এটির স্থিতিশীল স্থিতিশীল থাকে), যখন বাঁধের মাত্রা কেবল বৃদ্ধি পেতে থাকে বৃষ্টিপাত হওয়ায় দ্রুত (মূলত লাফিয়ে লাফিয়ে) কাগজের ব্যবহার এবং পুনরায় পরিশোধের ধরণগুলি কিছুটা অনুরূপ হতে পারে (যদিও অর্ডার করা পরিমাণটি বৃষ্টিপাতের পরিমাণের তুলনায় অনেক বেশি স্থিতিশীল এবং অনেক বেশি গোলাকার সংখ্যায় থাকতে পারে এবং যখনই স্তরটি কম হয় তখনই ঘটে থাকে)।

এটি বীমা কোম্পানির মূলধনের সাথেও সম্পর্কিত (তবে বিপরীত ধরণের) - প্রাথমিক মূলধনিকে বাদ দিয়ে, প্রিমিয়ামের অর্থ (নেট অপারেটিং ব্যয়) এবং বিনিয়োগগুলি মোটামুটি স্থিরভাবে (কখনও কখনও কম বা কম) আসে, যখন বীমা পলিসির অর্থ তুলনামূলকভাবে বড় হয় পরিমাণ।

এই দুটি জিনিসই মডেল করা হয়েছে এবং এই সমস্যার জন্য কিছুটা অন্তর্দৃষ্টি সরবরাহ করতে পারে।


-1

আপনার WEKA এ নজর দেওয়া উচিত। এটি একটি সরঞ্জাম এবং একটি জাভা এপিআই যা মেশিন লার্নিং অ্যালগরিদমগুলির স্যুট সহ। বিশেষত আপনার শ্রেণিবদ্ধকরণ অ্যালগরিদমগুলির সন্ধান করা উচিত।

শুভকামনা


একটি শ্রেণিবদ্ধকরণ অ্যালগরিদম কীভাবে আমাকে পরিমাণগত পূর্বাভাস দেয়?

@ লুক 404: ওয়েকার কাছে 3 ধরণের অ্যালগোরিদম রয়েছে (শ্রেণিবদ্ধকরণ, গুচ্ছবদ্ধতা এবং মাইনিং মাইনিং), এবং তারা সিদ্ধান্ত নিয়েছে শ্রেণিবদ্ধকরণ বিভাগে রিগ্রেশনকে। তবে সাধারণভাবে আপনি সঠিক, শ্রেণিবদ্ধকরণ এবং পরিমাণগত ভবিষ্যদ্বাণী কিছুটা আলাদা জিনিস।
বন্ধু

-1

আমি ক্রমবর্ধমান খরচ (যেমন তারিখ অনুসারে মোট পৃষ্ঠাগুলি চলমান) এর সাথে মডেল ফিট করতে লিনিয়ার সর্বনিম্ন স্কোয়ার ব্যবহার করব । প্রাথমিক অনুমানটি হ'ল প্রথম ডিগ্রি বহুবচন ব্যবহার করা। তবে অবশিষ্টাংশগুলি ইঙ্গিত দেয় যে উদাহরণটিতে প্রথম ডিগ্রীটি ডেটাটিকে কমিয়ে দিচ্ছে, সুতরাং পরবর্তী যৌক্তিক পদক্ষেপটি এটি দ্বিতীয় ডিগ্রীতে (অর্থাত্ চতুর্ভুজযুক্ত) ফিট বাড়ানো হবে। এটি অবশিষ্টাংশগুলিতে বক্রতা সরিয়ে দেয় এবং স্কোয়ার টার্মের জন্য সামান্য নেতিবাচক সহগের অর্থ হ'ল সময়ের সাথে সাথে ব্যবহারের হার হ্রাস পাচ্ছে, যা বেশিরভাগ লোকেরা সম্ভবত সময়ের সাথে সাথে কম কাগজ ব্যবহার করার ঝোঁক দেখায় seems এই ডেটার জন্য আমি মনে করি না যে আপনাকে দ্বিতীয় ডিগ্রি ফিটের বাইরে যাওয়ার দরকার হবে, কারণ আপনি অত্যধিক মানসিক চাপ শুরু করতে পারেন এবং ফলস্বরূপ এক্সট্রাপোলেশন অর্থহীন হতে পারে।

আপনি নীচের প্লটে ফিটগুলি (এক্সট্রাপোলেশন সহ) এবং অবশিষ্টাংশগুলি দেখতে পাচ্ছেন।

হইয়া অবশিষ্ট

আপনি যদি পারেন তবে পূর্বাভাস ত্রুটির আরও ভাল অনুমান করার জন্য বুটস্ট্র্যাপিং করা ভাল।


যেহেতু সংশ্লেষিত গ্রাহ্যের অবশিষ্টাংশগুলি দৃ strongly ়ভাবে সম্পর্কিত হয়, এই পদ্ধতিটি পরিসংখ্যানগতভাবে ন্যায়সঙ্গত বলে মনে হয় না। এই মৌলিক সমস্যার জন্য কেবল চতুর্ভুজ ফিট করে কাগজপত্র ব্যবহার; এটি এটি নিরাময় করতে পারে না।
শুক্র

-2

আমি মনে করি আপনি অপারেশন গবেষণা ব্যবহার করে আপনার ডেটা পেতে পারেন ।

আপনি কেন এমন কিছু সমীকরণ সন্ধানের চেষ্টা করবেন না যা ভেরিয়েবল হিসাবে সময়কালে ব্যবহৃত কাগজের পরিমাণ, কাগজের ব্যবহারকারী ইত্যাদি গ্রহণ করে?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.