ফেসবুক থেকে নবী কি লিনিয়ার রিগ্রেশন থেকে আলাদা?


11

সুতরাং আমি ফেসবুকের নবী সম্পর্কে যা পড়েছি তা হ'ল এটি মূলত সময়ের ধারাটিকে প্রবণতা এবং seasonতুতে বিভক্ত করে তোলে। উদাহরণস্বরূপ, একটি অ্যাডিটিভ মডেল হিসাবে লিখিত হবে:

y(t)=g(t)+s(t)+h(t)+et

সঙ্গে

  • t সময়
  • g(t) প্রবণতা (এটি লিনিয়ার বা লজিস্টিক হতে পারে)
  • s(t) মৌসুমী (প্রতিদিন, সাপ্তাহিক, বার্ষিক ...)
  • h(t) ছুটি
  • et ত্রুটি

আমার প্রশ্নগুলি: এটি একটি সাধারণ লিনিয়ার রিগ্রেশন দিয়ে করা যায় না? আমরা যদি তাদের তুলনা করি তবে ফলাফলের মেয়াদে পার্থক্য কী হবে এবং কেন?


হ্যাঁ আপনি একটি লিনিয়ার মডেল দিয়ে এটি করতে পারেন। আমি নবীকে জানি না তবে যদি এটি সমস্ত কিছু করে যাচ্ছেন তবে কোনও পার্থক্য নেই।
ব্যবহারকারী 2974951

উত্তর:


13

এখানে সমস্যাটি এমন একটি সমীকরণে পৌঁছানো যা পর্যবেক্ষণ করা ডেটাটিকে সংকেত ও শব্দ করার জন্য পার্স করে। যদি আপনার ডেটা সহজ হয় তবে আপনার প্রতিরোধের পদ্ধতির কাজ করতে পারে। তারা নবী (সা।) এর সাথে যে অনুমান করছে তা বোঝার জন্য যত্ন নেওয়া উচিত। আপনার রাসূল কী করেন তা আপনার আরও ভালভাবে বোঝা উচিত, কারণ এটি কেবলমাত্র একটি সাধারণ মডেলের সাথে ফিট করে না তবে কিছু কাঠামো যুক্ত করার চেষ্টা করে।

উদাহরণস্বরূপ, কিছু লিখিত প্রতিচ্ছবি যা সেগুলির লিখিত ভূমিকা পড়ার পরে আমি আপনাকে মূল্যায়নে সহায়তা করতে পারি। আমি যদি তাদের পদ্ধতির ভুল বুঝতে পারি তবে আমি আগে থেকে ক্ষমা চাই এবং যদি তা হয় তবে তা সংশোধন করতে চাই।

1) তাদের নেতৃত্বের উদাহরণটিতে দুটি ব্রেক-পয়েন্ট রয়েছে তবে তারা কেবল সবচেয়ে স্পষ্টতই একটিটি ধারণ করেছে।

2) তারা বাদ দেওয়া স্টোকাস্টিক সিরিজ বা পূর্বাভাসকে গাইড করার জন্য ওয়াইয়ের historicalতিহাসিক মানগুলি ব্যবহার করার মান প্রতিফলিত করে এমন কোনও এবং সমস্ত আরিমা কাঠামো উপেক্ষা করে।

3) তারা ব্যবহারকারীর প্রস্তাবিত স্টোকাস্টিক এবং ডিটারমিনিস্টিক সিরিজের যেকোন সম্ভাব্য গতিশীলতা (সীসা এবং পিছনে প্রভাব) উপেক্ষা করে। নবীর কার্যকারণ সংক্রান্ত প্রতিক্রিয়াগুলি কেবল সমসাময়িক।

৪) কোনও অজানা বাহ্যিক ঘটনার কারণে সময়ের মধ্য দিয়ে সোমবারের প্রভাবটি অর্ধেকের মধ্যে সিরিজ বা মৌসুমী ডালের পদক্ষেপ / স্তরের শিফটগুলি সনাক্ত করার চেষ্টা করা হয় না। নবী বিকল্প সম্ভাবনা যাচাই করে একে বৈধ করার চেয়ে "সাধারণ লিনিয়ার বৃদ্ধি" ধরে নিয়েছেন। এর সম্ভাব্য উদাহরণের জন্য দেখুন ফেসবুক নবী এবং আর ব্যবহার করে একটি অনলাইন সাবস্ক্রিপশন ব্যবসায়ের জন্য পুনরাবৃত্তি আদেশগুলি পূর্বাভাস দেখুন

৫) সাইনস এবং কোসাইনগুলি seasonতুসত্তাকে মোকাবিলার একটি অস্বচ্ছ উপায়, যখন seasonতুগত প্রভাব যেমন সপ্তাহের দিন, মাসের দিন, মাসের সপ্তাহ, বছরের-বছরের, অ্যানথ্রোপোজেনিক (মানুষের সাথে ডিলিং!) প্রভাবগুলি নিয়ে কাজ করার সময় আরও কার্যকর / তথ্যবহুল।

বার্ষিক নিদর্শনগুলির জন্য ৩5৫.২৫ এর ফ্রিকোয়েন্সিগুলির প্রস্তাবনা কিছুটা হলেও বোঝায় না কারণ আমরা গত বছরের মতো ঠিক একই দিনে একই ক্রিয়াটি করি না, যখন মাসিক ক্রিয়াকলাপ আরও বেশি অবিচল থাকে, তবে নবী 11 মাসিক সূচক উপস্থাপন করে না বলে মনে হয় বিকল্প। 52 এর সাপ্তাহিক ফ্রিকোয়েন্সিগুলি সামান্য বোঝায় কারণ আমাদের প্রতি বছর এবং 52 বছরে নেই।

)) ত্রুটি প্রক্রিয়াগুলি গাউসীয় হওয়ার কারণে বৈধতা দেওয়ার কোনও প্রচেষ্টা করা হয় নি তাই তাৎপর্যের অর্থপূর্ণ পরীক্ষাগুলি তৈরি করা যায়।

)) মডেল ত্রুটির প্রকরণটি একজাতীয় হওয়ার জন্য উদ্বিগ্ন নয়, অর্থাত্ ওজনযুক্ত সর্বনিম্ন স্কোয়ারগুলির পরামর্শ দেওয়ার জন্য নির্দিষ্ট সময়ে নির্দিষ্ট সময়ে বিন্দুভাবে পরিবর্তন করা উচিত নয়। প্রত্যাশিত মানটির সাথে আনুপাতিক ত্রুটি বৈকল্পের মোকাবিলায় অনুকূল শক্তি রূপান্তর অনুসন্ধান করার জন্য কোন উদ্বেগ নেই কখন (এবং কেন) আপনি কোনও বিতরণের লগ (সংখ্যার) নেওয়া উচিত?

৮) ব্যবহারকারীর সমস্ত সম্ভাব্য সীসা এবং ইভেন্ট / ছুটির দিনে প্রভাবগুলি পূর্বনির্ধারিত করতে হবে। উদাহরণস্বরূপ, দৈনিক বিক্রয় প্রায়শই নভেম্বরের শেষ দিকে বৃদ্ধি পেতে শুরু করে যা ক্রিসমাসের দীর্ঘমেয়াদী প্রভাবকে প্রতিফলিত করে।

9) কোনও উদ্বেগ নয় যে ফলস্বরূপ ত্রুটিগুলি পর্যাপ্ততার জন্য ডায়াগনস্টিক চেকিংয়ের মাধ্যমে মডেলটিকে উন্নত করার উপায়গুলি বিন্যাস মুক্ত রাখে।

10) অ-তাত্পর্যপূর্ণ কাঠামো মোছার মাধ্যমে সম্ভবত মডেলটির উন্নতি নিয়ে কোনও উদ্বেগ নেই।

১১) সিমুলেটেড পূর্বাভাসের কোনও পরিবার পাওয়ার জন্য কোনও সুবিধা নেই যেখানে সম্ভাব্য ব্যঙ্গতার ভাতা দিয়ে মডেলের ত্রুটিগুলি বুটস্ট্র্যাপিংয়ের মাধ্যমে আত্মবিশ্বাসের সীমা অগত্যা প্রতিসাম্য হতে পারে না।

১২) প্রবণতা সম্পর্কে ব্যবহারকারীকে অনুমান করা দেওয়া (# ট্রেন্ড ব্রেকপয়েন্ট এবং আসল ব্রেকপয়েন্টস এর #) বৃহত্তর বিশ্লেষণের মুখে অযাচিত / অব্যবহৃত নমনীয়তা দেয় যার নাম দিয়ে এটি হ্যান্ডস-ফ্রি বৃহত-স্কেল অ্যাপ্লিকেশনগুলির জন্য ডিজাইন করা হয়েছে।


সম্মত হন, তবে আমি বলব যে এই জিনিসগুলি "বৈশিষ্ট্যগুলি পাওয়া" খুব কাছাকাছি, তারপরে "অবশ্যই" থাকতে হবে। আপনার কাছে উচ্চ মানের পূর্বাভাস মডেল থাকতে পারে যার মধ্যে কিছু অভাব রয়েছে। তবে, আমি যেমন বলেছি, ভাল পয়েন্ট এবং চমৎকার পর্যালোচনা।
টিম

আপনি আপনার প্রতিবিম্বে বেশ সঠিক ... "তথ্য" এর অন্তর্নিহিত জটিলতা হ'ল রায় সংক্রান্ত সমস্যা। সাধারণ ডেটা .. সহজ সমাধানের প্রয়োজন .. জটিল ডেটা পরামর্শ দেয় যে "ভাল লাগলে" "হয়ে ওঠার দরকার" হয়ে যেতে পারে। আপনার ডেটা নিশ্চিতভাবেই জানে! ওকামের রেজার মনে আসে ..
আইরিশস্ট্যাট

@ টিম স্ট্যাটাস.স্ট্যাকেক্সেঞ্জাওয়েশনস / সেকশনস / ৪১90৯৯৮/২ থ্রেড পরামর্শ দেয় যে "বৈশিষ্ট্যযুক্ত" থাকা কিছু বৈশিষ্ট্য বাস্তবে "সরল রৈখিক প্রবণতা" এর মতো অনুচিত অনুমানগুলি বানিয়ে ফেলতে "থাকা উচিত"।
আইরিশস্ট্যাট

10

আমি এটি ব্যবহার করি নি, তবে এটি তাদের প্রিন্টের বিমূর্ত (জোর দেওয়া খনি):

পূর্বাভাস হ'ল একটি সাধারণ তথ্য বিজ্ঞান টাস্ক যা সক্ষমতা পরিকল্পনা, লক্ষ্য নির্ধারণ এবং অসাধারণ সনাক্তকরণ সহ সংস্থাগুলিকে সহায়তা করে। এর গুরুত্ব সত্ত্বেও, নির্ভরযোগ্য এবং উচ্চ মানের পূর্বাভাস উত্পাদন করার সাথে জড়িত গুরুতর চ্যালেঞ্জগুলি রয়েছে - বিশেষত যখন বিভিন্ন সময় সিরিজ থাকে এবং টাইম সিরিজ মডেলিংয়ে দক্ষতার সাথে বিশ্লেষকরা তুলনামূলকভাবে বিরল । এই চ্যালেঞ্জগুলি মোকাবেলার জন্য, আমরা "স্কেল" এর পূর্বাভাসের একটি বাস্তব পদ্ধতির বর্ণনা করি যা বিশ্লেষক-ইন-লুপ পারফরম্যান্স বিশ্লেষণের সাথে কনফিগারযোগ্য মডেলগুলিকে একত্রিত করে। আমরা ব্যাখ্যামূলক পরামিতিগুলির সাথে একটি মডুলার রিগ্রেশন মডেল প্রস্তাব করি যা বিশ্লেষকরা সময়সীমা সম্পর্কে ডোমেন জ্ঞান সহ স্বজ্ঞাতভাবে সামঞ্জস্য করতে পারেন। পূর্বাভাস পদ্ধতিগুলি তুলনা ও মূল্যায়নের জন্য পারফরম্যান্স বিশ্লেষণগুলি বর্ণনা করি এবং ম্যানুয়াল পর্যালোচনা এবং সামঞ্জস্যের জন্য স্বয়ংক্রিয়ভাবে পতাকা পূর্বাভাস। এমন সরঞ্জামগুলি যা বিশ্লেষকদের তাদের দক্ষতার ব্যবহার সবচেয়ে কার্যকরভাবে ব্যবসায়ের সময় সিরিজের নির্ভরযোগ্য, ব্যবহারিক পূর্বাভাস সক্ষম করে।

পরিচিতিতে:

ব্যবসায়ের পূর্বাভাস তৈরির অনুশীলনে আমরা দুটি মূল থিম পর্যবেক্ষণ করেছি। প্রথমত, সম্পূর্ণ স্বয়ংক্রিয়ভাবে পূর্বাভাস কৌশলগুলি টিউন করা শক্ত হতে পারে এবং প্রায়শই দরকারী অনুমান বা হিউরিস্টিক্সকে অন্তর্ভুক্ত করতে খুব জটিল হয় না। দ্বিতীয়ত, কোনও সংস্থা জুড়ে ডেটা সায়েন্সের কাজের জন্য দায়বদ্ধ বিশ্লেষকরা সাধারণত যে নির্দিষ্ট পণ্য বা পরিষেবাগুলি সমর্থন করেন সে সম্পর্কে গভীর ডোমেন দক্ষতা রাখে তবে প্রায়শই সময় সিরিজের পূর্বাভাসের প্রশিক্ষণ নেই।

সুতরাং আমার কাছে মনে হয় যে তারা এখানে যথেষ্ট পরিসংখ্যানগত অগ্রগতি দাবি করেছে না (যদিও এটি আপনার রূপরেখার সরল মডেলের চেয়ে অনেক বেশি সক্ষম) capable পরিবর্তে, তারা দাবি করে যে তাদের সিস্টেম তাদের নিজস্ব ডোমেন দক্ষতা এবং সিস্টেম-নির্দিষ্ট সীমাবদ্ধতা প্রয়োগ করার সময়কালের সিরিজ বিশ্লেষণে দক্ষতা ছাড়াই বিপুল সংখ্যক ব্যক্তির পক্ষে পূর্বাভাস তৈরি করা সম্ভব করে তোলে।

আপনার যদি ইতিমধ্যে উভয় টাইম সিরিজ বিশ্লেষণ এবং জটিল মডেলগুলির কোডিংয়ে দক্ষতা থাকে তবে এটি আপনার পক্ষে খুব সহায়ক হতে পারে না। তবে যদি তাদের দাবি সত্য হয় তবে এটি কার্যকরভাবে কার্যকর হতে পারে! বিজ্ঞান (এবং বাণিজ্য) কেবলমাত্র নতুন ধারণার কারণে নয়, নতুন সরঞ্জাম এবং তাদের ছড়িয়ে পড়ার কারণেও অগ্রগতি করে ( বিষয় এবং এই প্রতিক্রিয়া সম্পর্কে এই সংক্ষিপ্ত ফ্রিম্যান ডাইসন অংশটি দেখুন )।

পরিসংখ্যান থেকে নিজেই উদাহরণস্বরূপ নেওয়া: Rকোনও পরিসংখ্যানগত অগ্রগতির প্রতিনিধিত্ব করেন নি, তবে এটি ব্যাপকভাবে প্রভাবিত হয়েছে কারণ এটি আরও অনেক লোকের পক্ষে পরিসংখ্যান বিশ্লেষণকে সহজ করে তুলেছিল। এটি সেই ভাস্কর্যই ছিল যার ভিত্তিতে পরিসংখ্যানগত বোঝাপড়াটি নির্মিত হয়েছিল। আমরা ভাগ্যবান হলে, নবীও অনুরূপ ভূমিকা নিতে পারে।

ডাইসন, ফ্রিম্যান জে। "বিজ্ঞান কি বেশিরভাগ ধারণা দ্বারা চালিত হয় বা সরঞ্জাম দ্বারা ?." বিজ্ঞান 338, না। 6113 (2012): 1426-1427।


0

আপনি পরিবর্তন পয়েন্টগুলি মিস করছেন, টুকরোচক লিনিয়ার স্প্লাইনস, যা লিনিয়ার মডেলগুলিতে প্রয়োগ করা যেতে পারে।

আপনি ঠিক বলেছেন যে কমপক্ষে সীমাবদ্ধ ক্ষেত্রে এটি একটি রৈখিক নিয়মিত রেজিস্ট্রেশন (এল 1 এবং এল 2 নিয়ন্ত্রণ)।

মনে রাখবেন যে পৃথক নবী মডেল, যৌক্তিক বৃদ্ধি রয়েছে।

এছাড়াও আপনি ধরে নিচ্ছেন যে মরসুমের কারণগুলি সংযোজনীয়, তবে তারা গুণক মৌসুমী প্রভাবগুলিকেও সমর্থন করে, যা কমপক্ষে বৃদ্ধির মডেলিংয়ের জন্য আরও প্রাকৃতিক বলে মনে হয়।


লগগুলি গ্রহণের নবী অনুমানটি এই মূল্যবান আলোচনার মুখে উড়ে যায় ... stats.stackexchange.com/questions/18844/… যেখানে পাওয়ার ট্রান্সফর্মগুলি প্রত্যাশিত মান এবং মডেল ত্রুটির বৈকল্পিকতা বা একটি নির্দিষ্টের মধ্যে একটি অভিজ্ঞতামূলক সম্পর্কের ভিত্তিতে ন্যায়সঙ্গত হয় ডোমেন জ্ঞানের উপর ভিত্তি করে অ-লিনিয়ার অনুমানের ভিত্তি।
আইরিশস্ট্যাট

@ আইরিশস্ট্যাট সেই পয়েন্টটির জন্য আপনাকে ধন্যবাদ (আমি ভুলে গিয়েছিলাম যে তারা বহুগুণ seasonতু বাস্তবায়নের জন্য রূপান্তরিত লগটি ভুলে গিয়েছিল, তারা স্ট্যান ব্যবহার করে, তাই আমি বিশ্বাস করি যে তারা লগগুলি না নেওয়ার পরিবর্তে একটি ননলাইনার মডেল ব্যবহার করতে পারত)। গুণিত মৌসুমী অনুমান এবং '
ননলাইনার

আপনি যদি @ হুবুহু জবাবের পরিসংখ্যানগুলি দেখুন । এমিরিকাল পাওয়ার ট্রান্সফর্মগুলি কার্যকর যখন ত্রুটির বৈকল্পিক প্রত্যাশিত মানের সাথে সমানুপাতিক বলে মনে হয় অন্যথায় এটি কেবল "উইন্ডো ড্রেসিং" হতে পারে।
আইরিশস্ট্যাট

0

একটি সাধারণ লিনিয়ার রিগ্রেশন সহ অনেক কিছুই করা যায় তবে নবী যা করেন তা সব নয়। একটি উদাহরণ, আপনি একটি ট্রেন্ডের জন্য আপনার নিজস্ব পয়েন্ট প্রার্থী নির্দিষ্ট করতে পারেন, এবং নবী এটিকে পূর্ব হিসাবে ব্যবহার করবেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.