আকস্মিক পরিবর্তনের বৈশিষ্ট্য কীভাবে?


13

এই প্রশ্নটি খুব বেসিক হতে পারে। কোনও তথ্যের অস্থায়ী প্রবণতার জন্য, আমি "পঠন" পরিবর্তন ঘটে এমন পয়েন্টটি জানতে চাই। উদাহরণস্বরূপ, নীচে দেখানো প্রথম চিত্রটিতে, আমি কিছু পরিসংখ্যান পদ্ধতি ব্যবহার করে পরিবর্তন বিন্দুটি জানতে চাই। এবং আমি এই জাতীয় পদ্ধতিটি অন্য কয়েকটি উপাত্তে প্রয়োগ করতে চাই যার পরিবর্তনের বিষয়টি সুস্পষ্ট নয় (২ য় চিত্রের মতো) suchসেই এই জাতীয় উদ্দেশ্যে কোনও সাধারণ পদ্ধতি আছে কি?

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন


3
"টার্নিং পয়েন্ট" শব্দের একটি নির্দিষ্ট অর্থ রয়েছে যা আমি মনে করি না স্তরের হঠাৎ স্থানান্তরের (উপরে বা নীচে) প্রযোজ্য বলে আমি মনে করি না। আপনি 'চেঞ্জ পয়েন্ট' শব্দটিও ব্যবহার করেন এবং আমি মনে করি এটি সম্ভবত আরও ভাল পছন্দ। দয়া করে এটি 'খুব বেসিক' বলে মনে করবেন না; ক্ষমা চাওয়ার প্রয়োজন নেই এমন কি মৌলিক প্রশ্নগুলিও স্বাগত এবং এই প্রশ্নটি দূরবর্তীভাবে মৌলিক নয়।
গ্লেন_বি -রিনস্টেট মনিকা

ধন্যবাদ। আমি প্রশ্নে 'টার্নিং পয়েন্ট' পরিবর্তন করে 'চেঞ্জ পয়েন্ট' করে নিয়েছি
ব্যবহারকারী 2230101

উত্তর:


11

যদি আপনার সময় সিরিজের ডেটা পর্যবেক্ষণগুলি সাথে সাথে পূর্ববর্তী পর্যবেক্ষণগুলির সাথে সম্পর্কিত হয়, তবে চেন এবং লিউ (1993) [ 1 ] এর কাগজটি আপনার আগ্রহী হতে পারে। এটি অটোরেগ্রেসিভ মুভিং-এভারেজ টাইম সিরিজ মডেলের কাঠামোর স্তরের শিফ্ট এবং অস্থায়ী পরিবর্তনগুলি সনাক্ত করার একটি পদ্ধতি বর্ণনা করে।[1]

[1]: চেন, সি এবং লিউ, এলএম। (1993),
"টাইম সিরিজের মডেল প্যারামিটার এবং আউটিলার এফেক্টের যৌথ অনুমান,"
আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশন জার্নাল , 88 : 421, 284-297


+1 আমি এই কাগজটি সনাক্ত করার জন্য যথেষ্ট মনে রাখার চেষ্টা করছিলাম (তবে ব্যর্থ হচ্ছি)। এটি একটি ভাল রেফারেন্স।
গ্লেন_বি -রিনস্টেট মনিকা

6

পরিসংখ্যানগুলিতে এই সমস্যাটিকে (অদ্বিতীয়) অস্থায়ী ইভেন্ট সনাক্তকরণ হিসাবে উল্লেখ করা হয়। সবচেয়ে সহজ ধারণাটি হল একটি চলমান গড় এবং মানক বিচ্যুতি ব্যবহার করা। 3-স্ট্যান্ডার্ড বিচ্যুতিগুলির (নিয়ম-অফ-থাম্ব) বাইরে থাকা কোনও পাঠাকে "ইভেন্ট" হিসাবে বিবেচনা করা হয়। অবশ্যই, আরও উন্নত মডেল রয়েছে যা এইচএমএম, বা রিগ্রেশন ব্যবহার করে। এখানে ক্ষেত্রটির একটি প্রাথমিক ভূমিকা রয়েছে ।


5
এই শুধুমাত্র ফ্রেজ "Univariate টেম্পোরাল ইভেন্ট সনাক্তকরণ" অন্তর্ভুক্ত করা পোস্টটি সর্বজনীনভাবে সম্পূর্ণ ইন্টারনেট জুড়ে প্রবেশযোগ্য! এই শব্দটির জন্য আপনার উত্স কী?
whuber

বিভ্রান্তিকর হলে দুঃখিত। ইভেন্ট সনাক্তকরণ একটি আরও সাধারণ শব্দ, এবং টেম্পোরাল কখনও কখনও পৃথকভাবে ব্যবহৃত হয়। ইউনিভরিয়েটটি সাধারণত ব্যবহার করা হয় না কারণ পন্থাগুলি সাধারণত মাল্টিভারিয়েট হয় তবে এটি তাঁর বিশেষ ক্ষেত্রে।
ব্যবহারকারী 1669710

1
আপনার মন্তব্য @ শুভ
ব্যবহারকারী 1669710

@ ser1669710 ধন্যবাদ। এই আমি খুঁজছি। দেখে মনে হচ্ছে চলন্ত গড় আমার সমস্যা সমাধান করতে পারে না। আমার আরও জটিল মডেলটি দেখতে হবে।
ব্যবহারকারী 2230101

আমি এই অস্থায়ী ইভেন্ট সনাক্তকরণ সম্পর্কে আরও জানতে চাই। আপনার পোস্ট করা স্লাইডগুলি দুর্দান্ত, তবে আমি ভাবছিলাম যে আপনার কাছে কোনও পর্যালোচনা কাগজের লিঙ্ক আছে যা ক্ষেত্রটিকে আরও কিছুটা আনুষ্ঠানিকভাবে বর্ণনা করে?
অ্যারাগন

1

জেআমি={0এক্স<এক্সআমি1এক্সএক্সআমি
এক্স1<এক্স2<<এক্সমিজেআমিজেএকটিপিRআমিজেমিRএক্সআমি

জে1জে2এক্স1এক্স2


1
পিএস - @ ব্যবহারকারী 1669710 এবং আমি একই সাথে উত্তর পোস্ট করেছি। আমি তার পক্ষে ভোট দিয়েছি কারণ এটি অবশ্যই আরও ভাল গবেষণা হয়েছে। তবে আমি এটি এখানে রেখে চলেছি কারণ এটি বিকল্প হিসাবে কাজ করে যা কার্যকর করা সহজ এবং কার্যকর।
রুশ দৈর্ঘ্য

1
যেহেতু এটি ধাপে ধাপে রিগ্রেশন ব্যবহার করে এবং অনেক প্রার্থী ভেরিয়েবল নিয়োগ করে, এই পদ্ধতিটি সন্দেহজনক বলে মনে হচ্ছে। এটি কোথায় অধ্যয়ন করা হয়েছে এবং এর কোন বৈশিষ্ট্য রয়েছে? এটি অন্য পরিবর্তন পদ্ধতির পদ্ধতির সাথে কীভাবে তুলনা করে?
whuber

@ হুবুহু, আমার বক্তব্য এজন্য আমি অন্য উত্তরের পক্ষে ভোট দিয়েছি। আপনার চেঞ্জপয়েন্ট মানগুলির একটি খুব দানাদার সেট থাকলে এটি খুব অনুকূলভাবে তুলনা করবে না won't এবং এটি অন্যথায় অনুকূলভাবে তুলনাও করতে পারে না। আমি এটিকে একটি অ্যাডহক পদ্ধতি হিসাবে প্রকাশ করছি এবং আমার মনে হয় আমি এটিকে উপস্থাপন করেছি। তবে আমি মনে করি যে এর মতো একটি পদ্ধতি অরৈখিক পদ্ধতির জন্য প্রারম্ভিক মানগুলি পাওয়ার ভাল উপায় হিসাবে প্রতিশ্রুতি দেয়।
রাশ দৈর্ঘ্য

ধারণা আরো কার্যকর changepoint পদ্ধতি আমি খুঁজে পেয়েছি কিছু ভিত্তি, কিন্তু অন্যান্য পদ্ধতি উপর উন্নতি করতে বিশেষ তোলে, আমাকে আবার সন্দেহ মধ্যে ধাপে ধাপে রিগ্রেশন ব্যবহার (যদিও আমি নিশ্চিত নই) যে এই পদ্ধতি এমনকি ব্যর্থ হতে পারে যুক্তিসঙ্গত শুরুর পয়েন্ট উত্পাদন করতে। এ কারণেই এটি অধ্যয়ন করা হয়েছে কিনা তা জানতে আগ্রহী।
হোয়বার

আমি মনে করি সমস্ত সাবসেটের নির্বাচনের ক্ষেত্রে কিছু সমস্যা হবে, যতক্ষণ না সত্যই নির্দিষ্ট পরিমাণ জাম্প রয়েছে (দুটি বলুন), কারণ আমরা দুটি লাফ খুঁজে পাব যা উপাত্তকে সর্বোত্তমভাবে ব্যাখ্যা করে। অন্যান্য বাছাইয়ের পদ্ধতিগুলি যেমন সমস্যা হতে পারে ঠিক তেমন অন্যান্য পরিস্থিতিতেও। আমি মনে করি এটি সেরা উত্তর, বনাম একটি ভাল উত্তর বনাম একটি দ্রুত উত্তর পাওয়া কতটা গুরুত্বপূর্ণ তার উপর নির্ভর করে। সমস্ত সমস্যা এক রকম নয়, সমস্ত ক্লায়েন্টও নয়। আপনি যদি এটি ব্যাখ্যা না করতে পারেন তবে বিশ্বের সেরা উত্তরটি সম্পূর্ণ ব্যর্থতা।
রাশ দৈর্ঘ্য

1

আদর্শ ধ্রুবক মানগুলির সাথে একটি সিরিজ বা ক্রমকে মন্ত্রগুলিতে বিভক্ত করার সম্পর্কিত সমস্যা রয়েছে। দেখুন কীভাবে আমি প্রাকৃতিকভাবে "বন্ধনী" গঠনে সংখ্যাসূচক তথ্য গোষ্ঠীভুক্ত করতে পারি? (যেমন আয়)

এটি একেবারে একই সমস্যা নয় কারণ প্রশ্নটি কোনও বা সমস্ত দিকের ধীরগতির সাথে মন্ত্রকে বাদ দেয় না তবে আকস্মিক পরিবর্তন ছাড়াই।

আরও সরাসরি উত্তরটি হ'ল আমরা বড় লাফের সন্ধান করছি, সুতরাং আসল সমস্যাটি হ'ল জাম্প সংজ্ঞায়িত করা। প্রথম ধারণাটি কেবল প্রতিবেশী মানগুলির মধ্যে প্রথম পার্থক্যগুলি দেখার জন্য। এটি এমনকি পরিষ্কার নয় যে আপনাকে প্রথমে শব্দটি অপসারণের মাধ্যমে এটি পরিমার্জন করতে হবে, যেন ঝাঁপুনির শব্দগুলির মধ্যে পার্থক্য থেকে আলাদা করা যায় না, তারা অবশ্যই আকস্মিক হতে পারে না। অন্যদিকে, প্রশ্নকর্তা স্পষ্টতই হঠাৎ পরিবর্তনকে র‌্যাম্পের পাশাপাশি পদক্ষেপযুক্ত পরিবর্তনও অন্তর্ভুক্ত করতে চান, সুতরাং নির্দিষ্ট দৈর্ঘ্যের উইন্ডোর মধ্যে বৈকল্পিকতা বা পরিসীমা হিসাবে কিছু মানদণ্ডের প্রয়োজন বলে মনে হয়।


1

পরিসংখ্যানগুলির ক্ষেত্র যা আপনি সন্ধান করছেন তা হল চেঞ্জপয়েন্ট বিশ্লেষণ। এখানে একটি ওয়েবসাইট রয়েছে যা আপনাকে অঞ্চলটির ওভারভিউ দেবে এবং সফ্টওয়্যারটির জন্য একটি পৃষ্ঠাও দেবে।

আপনি যদি Rব্যবহারকারী হন তবে আমি changepointপ্যাকেজটি গড় পরিবর্তন এবং strucchangeপ্যাকেজটিকে রিগ্রেশন পরিবর্তনের জন্য সুপারিশ করব । আপনি যদি বায়েশিয়ান হতে চান তবে bcpপ্যাকেজটিও ভাল।

সাধারণভাবে আপনাকে একটি প্রান্তিক নির্বাচন করতে হবে যা আপনি যে পরিবর্তনগুলি সন্ধান করছেন তার শক্তি নির্দেশ করে। অবশ্যই কিছু প্রান্তিক পছন্দ রয়েছে যা কিছু নির্দিষ্ট পরিস্থিতিতে লোকেরা সমর্থন করে এবং আপনি আত্মবিশ্বাস অর্জনের জন্য অ্যাসেম্পোটিক কনফিডেন্স লেভেল বা বুটস্ট্র্যাপিং ব্যবহার করতে পারেন।


1
ওপি দুটি উদাহরণ সনাক্ত করেছে, যার একটির মধ্যে আমি একটি পদক্ষেপ এবং অন্যটিটিকে র‌্যাম্প বলব, যদিও শব্দের সম্পর্কে সর্বদা ঝগড়া করার সুযোগ রয়েছে। আমার উত্তর এখানে দেখুন। এই পদ্ধতিগুলি কীভাবে র‌্যাম্পগুলি মোকাবেলা করে? তাদের কি পদক্ষেপ পরিবর্তনের একটি স্পষ্ট বা স্পষ্ট মডেল আছে?
নিক কক্স

প্রশ্ন নিক জন্য ধন্যবাদ। সাধারণত এটি র‌্যাম্পটি কত দীর্ঘ তার উপর নির্ভর করে। যদি এটি একটি শর্ট র‌্যাম্প হয় তবে এটি 1 টি পরিবর্তন হিসাবে বিবেচিত হবে, যদি র‌্যাম্পটি দীর্ঘ হয় তবে প্রায়শই পরিবর্তন পয়েন্টগুলি 2 র‌্যাম্পের শনাক্ত করবে, 1 র‌্যাম্পের শুরুতে এবং 1 টি শেষে। স্পষ্টতই এটি আপনার ধারণার অন্তর্নিহিত মডেলের উপর নির্ভর করে।
অ্যাডুনাইক

1

পরিবর্তনের পয়েন্টস, স্যুইচ পয়েন্টস, ব্রেক পয়েন্টস, ব্রেকড লাইনের রিগ্রেশন, ভাঙা স্টিক রিগ্রেশন, বিলিনিয়ার রিগ্রেশন, টুকরোচক লিনিয়ার রিগ্রেশন, লোকাল লিনিয়ার রিগ্রেশন, সেগমেন্টেড রিগ্রেশন এবং বিচ্ছিন্নতা মডেল সহ এই অনুমানের সমস্যার অনেক নাম রয়েছে।

পেশাদার / কনস এবং কাজের উদাহরণ সহ পরিবর্তন পয়েন্ট প্যাকেজগুলির একটি সংক্ষিপ্ত বিবরণ এখানে । যদি আপনি পরিবর্তনগুলির সংখ্যাটি একটি অগ্রাধিকার পয়েন্টটি জানেন তবে mcpপ্যাকেজটি দেখুন। প্রথমে, ডেটা অনুকরণ করা যাক:

df = data.frame(x = seq(1, 12, by = 0.1))
df$y = c(rnorm(21, 0, 5), rnorm(80, 180, 5), rnorm(10, 20, 5))

আপনার প্রথম সমস্যার জন্য, এটি কেবল তিনটি বিরতি-কেবল বিভাগগুলি:

model = list(
  y ~ 1,  # Intercept
  ~ 1,  # etc...
  ~ 1
)
library(mcp)
fit = mcp(model, df, par_x = "x")

আমরা ফলস্বরূপ ফিটটি প্লট করতে পারি:

plot(fit)

এখানে চিত্র বর্ণনা লিখুন

এখানে, পরিবর্তন পয়েন্টগুলি খুব ভাল সংজ্ঞায়িত (সংকীর্ণ)। আসুন তাদের অনুমিত অবস্থানগুলি ( cp_1এবং cp_2) দেখতে ফিটকে সংক্ষিপ্ত করে বলি :

summary(fit)

Family: gaussian(link = 'identity')
Iterations: 9000 from 3 chains.
Segments:
  1: y ~ 1
  2: y ~ 1 ~ 1
  3: y ~ 1 ~ 1

Population-level parameters:
    name   mean lower upper Rhat n.eff
    cp_1   3.05   3.0   3.1    1  6445
    cp_2  11.05  11.0  11.1    1  6401
   int_1   0.14  -1.9   2.1    1  5979
   int_2 179.86 178.8 180.9    1  6659
   int_3  22.76  19.8  25.5    1  5906
 sigma_1   4.68   4.1   5.3    1  5282

আপনি mcpএনটি-অর্ডার অটোরিগ্রেশন (টাইম সিরিজের জন্য দরকারী) ইত্যাদি মডেলিং সহ আরও জটিল মডেলগুলি করতে পারেন দাবি অস্বীকার : আমি এর বিকাশকারী mcp

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.