আত্মহত্যার গণনার ডেটাতে মৌসুমী প্রভাবগুলির পরীক্ষা করার জন্য এটি কি উপযুক্ত পদ্ধতি?


24

আমি মার্কিন যুক্তরাষ্ট্রে একটি রাজ্যের জন্য আত্মহত্যা মৃত্যুর সাথে সম্পর্কিত মৃত্যুর শংসাপত্রের ডেটা 17 বছরের (1995 থেকে 2011) পেয়েছি সেখানে আত্মহত্যা এবং মাস / asonsতু সম্পর্কে প্রচুর পুরাণ রয়েছে, এটির অনেকগুলি বিরোধী এবং আমি সাহিত্যের " পর্যালোচনা করা হয়েছে, আমি ব্যবহার পদ্ধতিগুলির পরিষ্কার ধারণা বা ফলাফলের মধ্যে আস্থা পাই না।

সুতরাং আমি নির্ধারণ করতে পারি যে আমার ডেটা সেটের মধ্যে কোনও নির্দিষ্ট মাসে আত্মহত্যা কম-বেশি হওয়ার সম্ভাবনা আছে কিনা তা নির্ধারণ করতে পারি কিনা। আমার সমস্ত বিশ্লেষণ আরে করা হয়েছে।

তথ্যটিতে মোট আত্মহত্যার সংখ্যা ১৩,৯৯৯ জন।

যদি আপনি সংক্ষিপ্ত আত্মহত্যার সাথে বছরের দিকে তাকান, সেগুলি 309/365 দিন (85%) এ ঘটে। আপনি যদি বছরের সবচেয়ে বেশি আত্মহত্যার সাথে নজর রাখেন তবে এগুলি 339/365 দিন (93%) এ ঘটে।

সুতরাং প্রতি বছর আত্মহত্যা ছাড়াই মোটামুটি দিন রয়েছে। যাইহোক, যখন সমস্ত 17 বছর জুড়ে একত্রিত হন, সেখানে বছরের প্রতিটি দিনই আত্মহত্যা হয় 29 ফেব্রুয়ারি সহ (যদিও গড়টি 38 হয় কেবল মাত্র 5)।

এখানে চিত্র বর্ণনা লিখুন

বছরের প্রতিটি দিনে কেবল আত্মহত্যার সংখ্যা যুক্ত করা কোনও পরিষ্কার মৌসুমতা (আমার চোখে) নির্দেশ করে না।

মাসিক স্তরে একত্রিত, প্রতিমাসে গড়ে আত্মহত্যাগুলি থেকে:

(মি = 65, এসডি = 7.4, থেকে এম = 72, এসডি = 11.1)

আমার প্রথম দৃষ্টিভঙ্গি ছিল যে সমস্ত বছরের জন্য মাসের দ্বারা নির্ধারিত তথ্যগুলি একত্রিত করা এবং নাল অনুমানের জন্য প্রত্যাশিত সম্ভাবনাগুলি গণনা করার পরে একটি চি-স্কোয়ার পরীক্ষা করা, যে মাসে মাসে আত্মহত্যার গণনায় কোনও নিয়মতান্ত্রিক ভিন্নতা ছিল না। আমি প্রতিটি মাসের জন্য দিনের সংখ্যা বিবেচনায় রেখে সম্ভাব্যতাগুলি গণনা করেছি (এবং ফেব্রুয়ারী সাম্প্রতিক বছরগুলি সামঞ্জস্য করে)।

চি-স্কোয়ারের ফলাফলগুলি মাসে মাসে কোনও উল্লেখযোগ্য প্রকরণের ইঙ্গিত দেয়:

# So does the sample match  expected values?
chisq.test(monthDat$suicideCounts, p=monthlyProb)
# Yes, X-squared = 12.7048, df = 11, p-value = 0.3131

নীচের চিত্রটি প্রতি মাসে মোট সংখ্যা নির্দেশ করে indicates অনুভূমিক লাল রেখাগুলি যথাক্রমে ফেব্রুয়ারি, 30 দিনের মাস এবং 31 দিনের মাসের প্রত্যাশিত মানগুলিতে অবস্থিত। চি-স্কোয়ার পরীক্ষার সাথে সামঞ্জস্যপূর্ণ, কোনও মাসই প্রত্যাশিত গণনার জন্য 95% আত্মবিশ্বাসের ব্যবধানের বাইরে নয়। এখানে চিত্র বর্ণনা লিখুন

আমি ভেবেছিলাম যে আমি সময় সিরিজের ডেটা অনুসন্ধান শুরু না করা পর্যন্ত আমার কাজ শেষ হয়েছিল। আমি যেমন অনেকের কল্পনা করি তেমন, আমি stlস্ট্যাটাস প্যাকেজে ফাংশনটি ব্যবহার করে নন-প্যারাম্যাট্রিক মৌসুমী পচন পদ্ধতি দিয়ে শুরু করি ।

সময় সিরিজের ডেটা তৈরি করতে, আমি একত্রিত মাসিক ডেটা দিয়ে শুরু করেছি:

suicideByMonthTs <- ts(suicideByMonth$monthlySuicideCount, start=c(1995, 1), end=c(2011, 12), frequency=12) 

# Plot the monthly suicide count, note the trend, but seasonality?
plot(suicideByMonthTs, xlab="Year",
  ylab="Annual  monthly  suicides")

এখানে চিত্র বর্ণনা লিখুন

     Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
1995  62  47  55  74  71  70  67  69  61  76  68  68
1996  64  69  68  53  72  73  62  63  64  72  55  61
1997  71  61  64  63  60  64  67  50  48  49  59  72
1998  67  54  72  69  78  45  59  53  48  65  64  44
1999  69  64  65  58  73  83  70  73  58  75  71  58
2000  60  54  67  59  54  69  62  60  58  61  68  56
2001  67  60  54  57  51  61  67  63  55  70  54  55
2002  65  68  65  72  79  72  64  70  59  66  63  66
2003  69  50  59  67  73  77  64  66  71  68  59  69
2004  68  61  66  62  69  84  73  62  71  64  59  70
2005  67  53  76  65  77  68  65  60  68  71  60  79
2006  65  54  65  68  69  68  81  64  69  71  67  67
2007  77  63  61  78  73  69  92  68  72  61  65  77
2008  67  73  81  73  66  63  96  71  75  74  81  63
2009  80  68  76  65  82  69  74  88  80  86  78  76
2010  80  77  82  80  77  70  81  89  91  82  71  73
2011  93  64  87  75 101  89  87  78 106  84  64  71

এবং তারপর সঞ্চালিত stl()পচানি

# Seasonal decomposition
suicideByMonthFit <- stl(suicideByMonthTs, s.window="periodic")
plot(suicideByMonthFit)

এখানে চিত্র বর্ণনা লিখুন

এই মুহুর্তে আমি উদ্বিগ্ন হয়ে পড়েছিলাম কারণ এটি আমার কাছে মনে হয় যে একটি alতু উপাদান এবং একটি প্রবণতা উভয়ই রয়েছে। অনেক ইন্টারনেট গবেষণার পরে আমি রব হ্যান্ডম্যান এবং জর্জ অ্যাথানাসোপ্লোসের নির্দেশগুলি অনুসরণ করার সিদ্ধান্ত নিয়েছিলাম যা তাদের অন-লাইনের পাঠ্য "ভবিষ্যদ্বাণী: নীতি ও অনুশীলন" তে নির্দিষ্ট করে দেওয়া হয়েছে, বিশেষত একটি মৌসুমী আরিমা মডেল প্রয়োগ করার জন্য।

আমি ব্যবহৃত adf.test()এবং kpss.test()জন্য মূল্যায়ন করার stationarity এবং পরস্পরবিরোধী ফলাফল পেয়েছি। তারা উভয় নাল অনুমানকে প্রত্যাখ্যান করেছে (তারা বিপরীত অনুমানটি পরীক্ষা করে দেখছেন)।

adfResults <- adf.test(suicideByMonthTs, alternative = "stationary") # The p < .05 value 
adfResults

    Augmented Dickey-Fuller Test

data:  suicideByMonthTs
Dickey-Fuller = -4.5033, Lag order = 5, p-value = 0.01
alternative hypothesis: stationary

kpssResults <- kpss.test(suicideByMonthTs)
kpssResults

    KPSS Test for Level Stationarity

data:  suicideByMonthTs
KPSS Level = 2.9954, Truncation lag parameter = 3, p-value = 0.01

আমি তখন বইয়ের অ্যালগরিদমটি ব্যবহার করে দেখেছিলাম যে আমি প্রবণতা এবং মরসুম উভয়ের জন্য যে পরিমাণে পৃথক হওয়া দরকার তা নির্ধারণ করতে পারি কিনা। আমি এনডি = 1, এনএস = 0 দিয়ে শেষ করেছি।

আমি তখন দৌড়ে এসেছি auto.arima, যা এমন একটি মডেল বেছে নিয়েছিল যা "ড্রিফ্ট" টাইপের ধ্রুবক পাশাপাশি একটি ট্রেন্ড এবং একটি মৌসুমী উপাদান উভয়ই ছিল।

# Extract the best model, it takes time as I've turned off the shortcuts (results differ with it on)
bestFit <- auto.arima(suicideByMonthTs, stepwise=FALSE, approximation=FALSE)
plot(theForecast <- forecast(bestFit, h=12))
theForecast

এখানে চিত্র বর্ণনা লিখুন

> summary(bestFit)
Series: suicideByMonthFromMonthTs 
ARIMA(0,1,1)(1,0,1)[12] with drift         

Coefficients:
          ma1    sar1     sma1   drift
      -0.9299  0.8930  -0.7728  0.0921
s.e.   0.0278  0.1123   0.1621  0.0700

sigma^2 estimated as 64.95:  log likelihood=-709.55
AIC=1429.1   AICc=1429.4   BIC=1445.67

Training set error measures:
                    ME    RMSE     MAE       MPE     MAPE     MASE       ACF1
Training set 0.2753657 8.01942 6.32144 -1.045278 9.512259 0.707026 0.03813434

অবশেষে, আমি ফিট থেকে অবশিষ্টাংশগুলি তাকাল এবং যদি আমি এটি সঠিকভাবে বুঝতে পারি, যেহেতু সমস্ত মানগুলি প্রান্তিক সীমার মধ্যে রয়েছে, তারা সাদা শোরগোলের মতো আচরণ করছে এবং এইভাবে মডেলটি মোটামুটি যুক্তিসঙ্গত। আমি পাঠ্যটিতে বর্ণিত একটি পোর্টম্যানট্যু পরীক্ষা চালিয়েছি , যার এপি মান ভাল ছিল 0.05 এর উপরে, তবে আমি নিশ্চিত নই যে আমার পরামিতিগুলি সঠিক correct

Acf(residuals(bestFit))

এখানে চিত্র বর্ণনা লিখুন

Box.test(residuals(bestFit), lag=12, fitdf=4, type="Ljung")

    Box-Ljung test

data:  residuals(bestFit)
X-squared = 7.5201, df = 8, p-value = 0.4817

ফিরে গিয়ে আবার অরিমা মডেলিংয়ের অধ্যায়টি পড়ার পরে, আমি বুঝতে পেরেছি যে auto.arimaমডেল প্রবণতা এবং season তু বেছে নিয়েছিল। এবং আমি আরও উপলব্ধি করছি যে পূর্বাভাসটি বিশেষভাবে বিশ্লেষণ নয় যা আমার সম্ভবত করা উচিত। আমি জানতে চাই যে কোনও নির্দিষ্ট মাস (বা বছরের বেশি সময় ধরে বছরের) উচ্চ ঝুঁকির মাস হিসাবে চিহ্নিত করা উচিত। দেখে মনে হচ্ছে পূর্বাভাসের সাহিত্যের সরঞ্জামগুলি অত্যন্ত প্রাসঙ্গিক, তবে আমার প্রশ্নের পক্ষে সম্ভবত এটি সেরা নয়। যে কোনও এবং সমস্ত ইনপুট অনেক প্রশংসা করা হয়।

আমি একটি সিএসভি ফাইলে একটি লিঙ্ক পোস্ট করছি যাতে প্রতিদিনের গণনা রয়েছে। ফাইলটি দেখতে এমন দেখাচ্ছে:

head(suicideByDay)

        date year month day_of_month t count
1 1995-01-01 1995    01           01 1     2
2 1995-01-03 1995    01           03 2     1
3 1995-01-04 1995    01           04 3     3
4 1995-01-05 1995    01           05 4     2
5 1995-01-06 1995    01           06 5     3
6 1995-01-07 1995    01           07 6     2

daily_suicide_data.csv

এই দিনটি ঘটেছিল এমন আত্মহত্যা সংখ্যা গণনা। "t" হ'ল টেবিলে (5533) দিনের মোট সংখ্যা 1 থেকে এক সংখ্যার ক্রম।

আমি নীচের মন্তব্যে নোট করেছি এবং মডেলিং আত্মহত্যা এবং asonsতু সম্পর্কিত দুটি বিষয় সম্পর্কে চিন্তা করেছি। প্রথমত, আমার প্রশ্নের বিষয়ে, মাসগুলি কেবল seasonতু পরিবর্তনের জন্য চিহ্নিত করা হয়, আমি ওয়েথারের প্রতি আগ্রহী নই বা একটি বিশেষ মাস অন্যদের থেকে আলাদা নয় (অবশ্যই এটি একটি আকর্ষণীয় প্রশ্ন, তবে এটি আমি সেট করেছিলাম না তদন্ত)। অতএব, আমি মনে করি সমস্ত মাসের প্রথম ২৮ দিন কেবলমাত্র ব্যবহার করে মাসগুলিকে সমান করে তোলা বুদ্ধিমান । আপনি যখন এটি করেন, আপনি কিছুটা খারাপ ফিট পান, যা আমি মৌসুমতার অভাবের দিকে আরও প্রমাণ হিসাবে ব্যাখ্যা করছি। নীচের আউটপুটে, প্রথম ফিটটি হ'ল মাসের সাথে তাদের সঠিক সংখ্যা সহ কয়েক মাস ব্যবহার করে নীচের উত্তর থেকে একটি পুনরুত্পাদন, তারপরে একটি ডেটা সেট করে সুইসাইডমন্টযার মধ্যে সমস্ত মাসের প্রথম ২৮ দিন থেকে আত্মহত্যার গণনা করা হয়েছিল। আমি লোকেদের সম্পর্কে কী ভাবতে আগ্রহী বা এই সমন্বয়টি একটি ভাল ধারণা, প্রয়োজনীয় নয় বা ক্ষতিকারক?

> summary(seasonFit)

Call:
glm(formula = count ~ t + days_in_month + cos(2 * pi * t/12) + 
    sin(2 * pi * t/12), family = "poisson", data = suicideByMonth)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.4782  -0.7095  -0.0544   0.6471   3.2236  

Coefficients:
                     Estimate Std. Error z value Pr(>|z|)    
(Intercept)         2.8662459  0.3382020   8.475  < 2e-16 ***
t                   0.0013711  0.0001444   9.493  < 2e-16 ***
days_in_month       0.0397990  0.0110877   3.589 0.000331 ***
cos(2 * pi * t/12) -0.0299170  0.0120295  -2.487 0.012884 *  
sin(2 * pi * t/12)  0.0026999  0.0123930   0.218 0.827541    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 302.67  on 203  degrees of freedom
Residual deviance: 190.37  on 199  degrees of freedom
AIC: 1434.9

Number of Fisher Scoring iterations: 4

> summary(shortSeasonFit)

Call:
glm(formula = shortMonthCount ~ t + cos(2 * pi * t/12) + sin(2 * 
    pi * t/12), family = "poisson", data = suicideByShortMonth)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-3.2414  -0.7588  -0.0710   0.7170   3.3074  

Coefficients:
                     Estimate Std. Error z value Pr(>|z|)    
(Intercept)         4.0022084  0.0182211 219.647   <2e-16 ***
t                   0.0013738  0.0001501   9.153   <2e-16 ***
cos(2 * pi * t/12) -0.0281767  0.0124693  -2.260   0.0238 *  
sin(2 * pi * t/12)  0.0143912  0.0124712   1.154   0.2485    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 295.41  on 203  degrees of freedom
Residual deviance: 205.30  on 200  degrees of freedom
AIC: 1432

Number of Fisher Scoring iterations: 4

দ্বিতীয় জিনিসটি আমি আরও সন্ধান করেছি isতুর জন্য প্রক্সি হিসাবে মাস ব্যবহার করার বিষয়টি। সম্ভবত কোনও মৌসুমের আরও ভাল সূচক হ'ল কোনও অঞ্চল প্রাপ্ত দিবালোকের সংখ্যা। এই তথ্যটি একটি উত্তর রাজ্য থেকে আসে যা দিবালোকের ক্ষেত্রে যথেষ্ট পার্থক্য রাখে। নীচে ২০০২ সাল থেকে দিবালোকের গ্রাফ দেওয়া আছে।

এখানে চিত্র বর্ণনা লিখুন

আমি যখন বছরের মাসের চেয়ে এই ডেটা ব্যবহার করি তখন এর প্রভাবটি তাত্পর্যপূর্ণ তবে প্রভাব খুব খুব কম। উপরের মডেলগুলির তুলনায় অবশিষ্ট অবলম্বন অনেক বেশি। যদি দিবালোকের সময়গুলি মরসুমের জন্য আরও ভাল মডেল হয় এবং ফিট ততটা ভাল না হয় তবে এটি খুব ছোট মৌসুমী প্রভাবের আরও প্রমাণ?

> summary(daylightFit)

Call:
glm(formula = aggregatedDailyCount ~ t + daylightMinutes, family = "poisson", 
    data = aggregatedDailyNoLeap)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-3.0003  -0.6684  -0.0407   0.5930   3.8269  

Coefficients:
                  Estimate Std. Error z value Pr(>|z|)    
(Intercept)      3.545e+00  4.759e-02  74.493   <2e-16 ***
t               -5.230e-05  8.216e-05  -0.637   0.5244    
daylightMinutes  1.418e-04  5.720e-05   2.479   0.0132 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 380.22  on 364  degrees of freedom
Residual deviance: 373.01  on 362  degrees of freedom
AIC: 2375

Number of Fisher Scoring iterations: 4

কেউ যদি এর সাথে খেলা করতে চায় তবে আমি দিবালোক পোস্ট করছি। দ্রষ্টব্য, এটি কোনও লিপ বছর নয়, সুতরাং আপনি যদি লিপ বছরের জন্য কয়েক মিনিটের মধ্যে রাখতে চান, হয় এক্সট্রোপোলেট বা ডেটা পুনরুদ্ধার করুন।

state.daylight.2002.csv

[ মুছে ফেলা উত্তর থেকে প্লট যুক্ত করতে সম্পাদনা করুন (আশা করি rnso আমার মুছে ফেলা উত্তরে প্লটটি এখানে প্রশ্নের উত্তর দিকে সরিয়ে নিতে আপত্তি মনে করবে না। সোভানয়, আপনি যদি এই পরে যুক্ত না চান তবে আপনি এটি আবারও ফিরিয়ে দিতে পারেন)]

এখানে চিত্র বর্ণনা লিখুন


1
"আমাদের 50 টির মধ্যে একটি রাষ্ট্র" শব্দটি বোঝায় যে সমস্ত পাঠক আমেরিকা যুক্তরাষ্ট্রের অন্তর্ভুক্ত। স্পষ্টতই অনেক এলিয়েন এখানে লুকিয়ে থাকে।
নিক কক্স

1
এটি কি পাবলিক ডেটাসেট থেকে? আপনি কি সপ্তাহে সপ্তাহে বা এমনকি দিনের পর দিন ডেটা উপলব্ধ করতে পারেন?
এলভিস

1
@ এলভিস - আমি প্রতিদিনের গণনা ডেটার লিঙ্ক পোস্ট করেছি। ডেটা শংসাপত্রগুলি থেকে আসে যা 'পাবলিক রেকর্ড' তবে এটির জন্য একটি প্রক্রিয়া প্রয়োজন; যাইহোক, সমষ্টিগত গণনা ডেটা করে না। পিএস - আমি লিঙ্কটি নিজেই চেষ্টা করেছি এবং এটি কাজ করেছে, তবে আমি এর আগে কোনও সার্বজনিক ড্রপবক্স ফোল্ডারে পোস্ট করি নি তাই লিঙ্কটি কাজ না করে তবে আমাকে জানান।
সোভনয়

1
যেহেতু আপনার ডেটা গণনা করা হয়েছে, আমি আশা করি বৈচিত্রটি গড়ের সাথে সম্পর্কিত হবে। সাধারণ টাইম সিরিজের মডেলগুলি এর জন্য অ্যাকাউন্ট করে না (তবে, আপনি ট্রান্সফর্মেশন বলতে সম্ভবত ফ্রিম্যান-টুকি বলতে পারেন) বলতে পারেন, বা আপনি কোনও সময় সিরিজের মডেলটি দেখতে পারেন যা গণনা উপাত্তের জন্য ডিজাইন করা হয়েছে। (আপনি যদি এটি না করেন তবে এটি বিশাল সমস্যা নাও হতে পারে যেহেতু সংখ্যাটি কেবল
দু'একটি কারণের মধ্যে রয়েছে

1
Yটিμটিvar(Yটি)=μটি

উত্তর:


13

পইসন রিগ্রেশন সম্পর্কে কি?

আমি আপনার ডেটা সমেত একটি ডেটা ফ্রেম তৈরি করেছি, সাথে সাথে tসময়ের জন্য (মাসগুলিতে) একটি সূচক monthdaysএবং প্রতিটি মাসে দিনের সংখ্যার জন্য একটি পরিবর্তনশীল ।

T <- read.table("suicide.txt", header=TRUE)
U <- data.frame( year = as.numeric(rep(rownames(T),each=12)), 
         month = rep(colnames(T),nrow(T)), 
         t = seq(0, length = nrow(T)*ncol(T)), 
         suicides = as.vector(t(T)))
U$monthdays <- c(31,28,31,30,31,30,31,31,30,31,30,31)
U$monthdays[ !(U$year %% 4) & U$month == "Feb" ] <- 29

সুতরাং এটির মতো দেখাচ্ছে:

> head(U,14)
   year month  t suicides monthdays
1  1995   Jan  0       62        31
2  1995   Feb  1       47        28
3  1995   Mar  2       55        31
4  1995   Apr  3       74        30
5  1995   May  4       71        31
6  1995   Jun  5       70        30
7  1995   Jul  6       67        31
8  1995   Aug  7       69        31
9  1995   Sep  8       61        30
10 1995   Oct  9       76        31
11 1995   Nov 10       68        30
12 1995   Dec 11       68        31
13 1996   Jan 12       64        31
14 1996   Feb 13       69        29

এবার আসুন এমন একটি মডেলকে সময় প্রভাব এবং বেশ কয়েকটি দিনের প্রভাবের সাথে এমন একটি মডেলের সাথে তুলনা করি যেখানে আমরা এক মাসের প্রভাব যুক্ত করি:

> a0 <- glm( suicides ~ t + monthdays, family="poisson", data = U )
> a1 <- glm( suicides ~ t + monthdays + month, family="poisson", data = U )

এখানে "ছোট" মডেলের সংক্ষিপ্তসার রয়েছে:

> summary(a0)

Call:
glm(formula = suicides ~ t + monthdays, family = "poisson", data = U)

Deviance Residuals:
    Min       1Q   Median       3Q      Max
-2.7163  -0.6865  -0.1161   0.6363   3.2104

Coefficients:
             Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.8060135  0.3259116   8.610  < 2e-16 ***
t           0.0013650  0.0001443   9.461  < 2e-16 ***
monthdays   0.0418509  0.0106874   3.916 9.01e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 302.67  on 203  degrees of freedom
Residual deviance: 196.64  on 201  degrees of freedom
AIC: 1437.2

Number of Fisher Scoring iterations: 4

আপনি দেখতে পারেন যে দুটি ভেরিয়েবলের বেশিরভাগ ক্ষেত্রে উল্লেখযোগ্য প্রান্তিক প্রভাব রয়েছে। এখন আরও বড় মডেল দেখুন:

> summary(a1)

Call:
glm(formula = suicides ~ t + monthdays + month, family = "poisson",
    data = U)

Deviance Residuals:
     Min        1Q    Median        3Q       Max
-2.56164  -0.72363  -0.05581   0.58897   3.09423

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept)  1.4559200  2.1586699   0.674    0.500
t            0.0013810  0.0001446   9.550   <2e-16 ***
monthdays    0.0869293  0.0719304   1.209    0.227
monthAug    -0.0845759  0.0832327  -1.016    0.310
monthDec    -0.1094669  0.0833577  -1.313    0.189
monthFeb     0.0657800  0.1331944   0.494    0.621
monthJan    -0.0372652  0.0830087  -0.449    0.653
monthJul    -0.0125179  0.0828694  -0.151    0.880
monthJun     0.0452746  0.0414287   1.093    0.274
monthMar    -0.0638177  0.0831378  -0.768    0.443
monthMay    -0.0146418  0.0828840  -0.177    0.860
monthNov    -0.0381897  0.0422365  -0.904    0.366
monthOct    -0.0463416  0.0830329  -0.558    0.577
monthSep     0.0070567  0.0417829   0.169    0.866
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 302.67  on 203  degrees of freedom
Residual deviance: 182.72  on 190  degrees of freedom
AIC: 1445.3

Number of Fisher Scoring iterations: 4

ঠিক আছে, অবশ্যই monthdaysপ্রভাবটি অদৃশ্য হয়ে যায়; এটি লিপ বছরগুলি শুধুমাত্র ধন্যবাদ অনুমান করা যায় !! এটি মডেলটিতে রাখার (এবং অ্যাকাউন্টে লাফিয়ে নেওয়ার ক্ষেত্রে নেওয়া) দুটি মডেলের তুলনা করার জন্য অবশিষ্ট অবলম্বনগুলি ব্যবহার করার অনুমতি দেয়।

> anova(a0, a1, test="Chisq")
Analysis of Deviance Table

Model 1: suicides ~ t + monthdays
Model 2: suicides ~ t + monthdays + month
  Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1       201     196.65
2       190     182.72 11   13.928    0.237

সুতরাং, কোন (উল্লেখযোগ্য) মাসের প্রভাব? তবে মৌসুমী প্রভাব সম্পর্কে কী বলা যায়? আমরা দুটি ভেরিয়েবল ব্যবহার করে ক্যাপচার করার চেষ্টা করতে পারিকোসাইন্(2πটি12)পাপ(2πটি12)

> a2 <- glm( suicides ~ t + monthdays + cos(2*pi*t/12) + sin(2*pi*t/12),
             family="poisson", data = U )
> summary(a2)

Call:
glm(formula = suicides ~ t + monthdays + cos(2 * pi * t/12) +
    sin(2 * pi * t/12), family = "poisson", data = U)

Deviance Residuals:
    Min       1Q   Median       3Q      Max
-2.4782  -0.7095  -0.0544   0.6471   3.2236

Coefficients:
                     Estimate Std. Error z value Pr(>|z|)
(Intercept)         2.8676170  0.3381954   8.479  < 2e-16 ***
t                   0.0013711  0.0001444   9.493  < 2e-16 ***
monthdays           0.0397990  0.0110877   3.589 0.000331 ***
cos(2 * pi * t/12) -0.0245589  0.0122658  -2.002 0.045261 *
sin(2 * pi * t/12)  0.0172967  0.0121591   1.423 0.154874
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 302.67  on 203  degrees of freedom
Residual deviance: 190.37  on 199  degrees of freedom
AIC: 1434.9

Number of Fisher Scoring iterations: 4

এখন এটি শূন্য মডেলের সাথে তুলনা করুন:

> anova(a0, a2, test="Chisq")
Analysis of Deviance Table

Model 1: suicides ~ t + monthdays
Model 2: suicides ~ t + monthdays + cos(2 * pi * t/12) + sin(2 * pi *
    t/12)
  Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1       201     196.65                   
2       199     190.38  2   6.2698   0.0435 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

সুতরাং, কেউ অবশ্যই বলতে পারেন যে এটি একটি alতু প্রভাবের পরামর্শ দেয় ...


2
পি

2
আমি সম্পূর্ণরূপে একমত, এটিই আমি প্ররোচিত করেছি :) "একজন অবশ্যই বলতে পারেন যে এটির প্রভাবের প্রস্তাব দেয়"; এবং "একটি প্রভাব আছে" না! আমি যা আকর্ষণীয় মনে করি তা হ'ল এই ত্রিকোণমিতিক রূপান্তরটি, এটি খুব স্বাভাবিক এবং কেন এটি প্রায়শই দেখা যায় না তা আমি বুঝতে পারি না। তবে এটি কেবল একটি শুরুর পয়েন্ট ... বুটস্ট্র্যাপিং, মডেলটি মূল্যায়ন করা ... আরও অনেক কিছুই।
এলভিস

1
কোন প্রব! আমার খারাপ তখন, আমি রসিকতাটি সনাক্ত করতে অক্ষম। :)
usεr11852 19-10 তে মনিকে

2
+1 টি। পোইসন ফুরিয়ার সাথে দেখা করেছেন .... আমি মনে করি অর্থনীতিবিদ এবং কিছু অন্যান্য সূচক পরিবর্তনশীলগুলিকে জোর দেয় কারণ মৌসুমতা স্পাইকি হতে পারে তবে ত্রিকোণমিতিক পদ্ধতিটি প্রায়শই সহায়তা করে।
নিক কক্স

2
প্রকৃতপক্ষে. আমি যে টিউটোরিয়াল পর্যালোচনাটি লিখেছি তা stata-jorter.com/article.html?article=st0116
নিক কক্স

8

একটি চি-বর্গ পরীক্ষা আপনার প্রশ্নের প্রাথমিক ভিউ হিসাবে একটি ভাল পদ্ধতির approach

stlপচানি ঋতু উপস্থিতি পরীক্ষা করার জন্য একটি হাতিয়ার হিসেবে বিভ্রান্তিকর হতে পারে। কোনও সাদা গোলমাল (কোনও কাঠামোর সাথে এলোমেলো সিগন্যাল) ইনপুট হিসাবে পাস করা হলেও এই পদ্ধতিটি একটি স্থিতিশীল seasonতু প্যাটার্ন ফিরিয়ে আনতে পরিচালিত করে। উদাহরণস্বরূপ চেষ্টা করুন:

plot(stl(ts(rnorm(144), frequency=12), s.window="periodic"))

একটি স্বয়ংক্রিয় আরিমা মডেল নির্বাচন প্রক্রিয়া দ্বারা নির্বাচিত আদেশগুলি অনুসন্ধান করাও কিছুটা ঝুঁকিপূর্ণ কারণ মৌসুমী আরিমা মডেল সর্বদা seasonতুতে জড়িত না (বিশদগুলির জন্য এই আলোচনাটি দেখুন )। এই ক্ষেত্রে, নির্বাচিত মডেলটি alতুচক্র উত্পাদন করে এবং @ রিচার্ড হার্ডির মন্তব্যটি যুক্তিসঙ্গত, তবে, আত্মহত্যাগুলি একটি alতু বিন্যাস দ্বারা পরিচালিত হয়েছে এই সিদ্ধান্তে আরও অন্তর্দৃষ্টি প্রয়োজন।

নীচে, আমি আপনার পোস্ট করা মাসিক সিরিজের বিশ্লেষণের উপর ভিত্তি করে কিছু ফলাফল সংক্ষিপ্ত করছি। এটি মৌলিক কাঠামোগত সময় সিরিজের মডেল অনুসারে মৌসুমী উপাদান:

require(stsm)
m <- stsm.model(model = "llm+seas", y = x)
fit <- stsmFit(m, stsm.method = "maxlik.td.scoring")
plot(tsSmooth(fit)$states[,2], ylab = "")
mtext(text = "seasonal component", side = 3, adj = 0, font = 2)

আনুমানিক মৌসুমী উপাদান

ডিফল্ট বিকল্পগুলির সাথে ট্রামো-সিটস সফ্টওয়্যার ব্যবহার করে অনুরূপ উপাদানটি বের করা হয়েছিল। আমরা দেখতে পাচ্ছি যে অনুমিত মৌসুমী প্যাটার্ন সময়কালে স্থিতিশীল নয় এবং তাই, নমুনা সময়কালে কয়েক মাস জুড়ে আত্মহত্যার সংখ্যায় পুনরাবৃত্ত প্যাটার্নটির অনুমান সমর্থন করে না। এক্স -13ARIMA-SEATS সফ্টওয়্যারটি ডিফল্ট বিকল্পগুলির সাথে চালনা করে, seasonতুরতার জন্য সম্মিলিত পরীক্ষাটি এই সিদ্ধান্তে পৌঁছে যে শনাক্তযোগ্য seasonতু উপস্থিতি নেই।

সম্পাদনা করুন ( শনাক্তযোগ্য seasonতুসংশ্লিষ্ট সংজ্ঞা দেওয়ার জন্য এই উত্তর এবং আমার মন্তব্য দেখুন )।

আপনার ডেটা প্রকৃতি দেওয়া, গণনা তথ্য জন্য একটি মডেল (যেমন পোইসন মডেল) এবং সেই মডেলটিতে seasonতুত্বের তাত্পর্য পরীক্ষা করার জন্য সময় সিরিজের পদ্ধতিগুলির ভিত্তিতে এই বিশ্লেষণকে পরিপূরক করা উপযুক্ত worth আপনার প্রশ্নে ট্যাগ কাউন্ট-ডেটা যুক্ত করার ফলে এই দিকটিতে আরও দেখা এবং সম্ভাব্য উত্তর হতে পারে।


ধন্যবাদ @ জাভিয়াকল, আপনার পরামর্শের পদ্ধতিগুলি আমি তদন্ত করব। আপনার পোস্ট করা গ্রাফের সমাপ্তি সম্পর্কে আমি কী জিজ্ঞাসা করতে পারি, এটি কি সত্য যে আপনার মন্তব্যের ভিত্তিতে বছরের অগ্রগতির সাথে প্রশস্ততা বৃদ্ধি পায়, "আমরা দেখতে পাচ্ছি যে অনুমিত মৌসুমী প্যাটার্ন সময়কালে স্থিতিশীল নয়" বা তা করে আরও সূক্ষ্ম পর্যবেক্ষণ অন্তর্ভুক্ত করুন যে প্রতিটি শিখরের আকৃতি কিছুটা আলাদা? আমি প্রাক্তনকে ধরে নিচ্ছি, তবে অনুমানগুলি আমাদের কোথায় নিয়ে যায় তা আমরা জানি।
সোয়ানওয়াই

2
χ2

@ সোভানয় আমার উত্তরে ব্যবহৃত টাইম সিরিজ পদ্ধতির উপর ভিত্তি করে প্রধান উপসংহারটি হ'ল নমুনা তথ্যে কোনও পরিষ্কার মৌসুমী প্যাটার্ন নেই। Alতুচক্র তথ্যের পরিবর্তনশীলতার একটি অংশ ব্যাখ্যা করেও, একটি seasonতুগত নিদর্শন নির্ভরযোগ্যভাবে চিহ্নিত করা যায় না কারণ এটি উচ্চ মাত্রায় অনিয়মিত ওঠানামা দ্বারা অস্পষ্ট হয়ে যায় (এটিও প্রশ্নটিতে প্রদর্শিত নির্বাচিত আরিমা মডেলের লাভ ফাংশন প্রদর্শন করে পরীক্ষা করা যেতে পারে) ।
জাভালাকলে

@ODDsKooL আমি সপ্তাহের দিন চি-স্কোয়ার পরীক্ষাও করেছি, শনিবার / রবিবার প্রত্যাশার চেয়ে কিছুটা নীচে এবং সোমবার / মঙ্গলবার ঠিক উপরে ....
সান্নয়

6

আমার মন্তব্যে উল্লিখিত হিসাবে, এটি একটি খুব আকর্ষণীয় সমস্যা। মৌসুমতা সনাক্তকরণ একা পরিসংখ্যান অনুশীলন নয়। একটি যুক্তিসঙ্গত পন্থা হবে তত্ত্ব এবং বিশেষজ্ঞের সাথে পরামর্শ করা যেমন:

  • মনস্তত্ত্বিক
  • মনোরোগ বিশেষজ্ঞ
  • সমাজবিজ্ঞানী

এই বিশ্লেষণে "কেন" বোঝার জন্য ডেটা বিশ্লেষণের পরিপূরক করতে seasonতুবদ্ধতা থাকবে। ডেটাতে এসে, আমি একটি দুর্দান্ত পচন পদ্ধতি ব্যবহার করি যা অবহিত উপাদান মডেল (ইউসিএম) নামে পরিচিত যা রাজ্য স্পেস পদ্ধতির একটি রূপ। কোপম্যানের এই খুব অ্যাক্সেসযোগ্য নিবন্ধটিও দেখুন । আমার অ্যাপ্রোভ @ জাভালাক্যালির মতো। এটা না শুধুমাত্র পচা সময় সিরিজ তথ্য একটি হাতিয়ার প্রদান করে কিন্তু নিরপেক্ষভাবে উপস্থিতি বা ঋতু নির্ভর অনুপস্থিতি তাত্পর্য পরীক্ষামূলক মাধ্যমে নির্ণয়। আমি অ-পরীক্ষামূলক ডেটাতে তাত্পর্যপূর্ণ পরীক্ষার বড় অনুরাগী নই তবে আমি এমন কোনও প্রক্রিয়া জানি না যে আপনি কোনও সময় সিরিজের ডেটাতে seasonতুপর্ণের উপস্থিতি বা অনুপস্থিতিতে আপনার অনুমানটি পরীক্ষা করতে সক্ষম হবেন।

অনেকে উপেক্ষা করে তবে একটি অত্যন্ত গুরুত্বপূর্ণ বৈশিষ্ট্য যা কেউ বুঝতে চাইবে তা হ'ল seasonতুরতার ধরণ:

  1. স্টোকাস্টিক - এলোমেলোভাবে পরিবর্তিত হয় এবং পূর্বাভাস দেওয়া শক্ত
  2. নির্ধারক - পুরোপুরি অনুমানযোগ্য পরিবর্তন হয় না। আপনি মডেল করতে ডামি বা ত্রিকোণমিতি (সিন / কোস ইত্যাদি) ব্যবহার করতে পারেন

আপনার মতো দীর্ঘ সময় সিরিজের ডেটাগুলির জন্য, এটি সম্ভবত সম্ভাব্য সময়ের সাথে পরিবর্তিত হতে পারে। আবার ইউসিএম হ'ল একমাত্র পন্থা যা আমি জানি যে এই স্টোকাস্টিক / ডিটারনিস্টিক মৌসুমী সনাক্ত করতে পারে। ইউসিএম আপনার সমস্যাটিকে নিম্নলিখিত "উপাদানগুলিতে" বিভক্ত করতে পারে:

Time Series Data = level + Slope + Seasonality + Cycle + Causal + Error(Noise).

আপনি যদি স্তর, opeাল, চক্র নির্বিচারক বা স্টোকাস্টিক হয় তাও পরীক্ষা করতে পারেন। দয়া করে নোট করুন level + slope = trend। ইউসিএম ব্যবহার করে নীচে আমি আপনার ডেটাতে কিছু বিশ্লেষণ উপস্থাপন করছি। আমি বিশ্লেষণ করতে এসএএস ব্যবহার করেছি।

data input;
format date mmddyy10.;
date = intnx( 'month', '1jan1995'd, _n_-1 );
      input deaths@@;
datalines;
62    47  55  74  71  70  67  69  61  76  68  68
64    69  68  53  72  73  62  63  64  72  55  61
71    61  64  63  60  64  67  50  48  49  59  72
67    54  72  69  78  45  59  53  48  65  64  44
69    64  65  58  73  83  70  73  58  75  71  58
60    54  67  59  54  69  62  60  58  61  68  56
67    60  54  57  51  61  67  63  55  70  54  55
65    68  65  72  79  72  64  70  59  66  63  66
69    50  59  67  73  77  64  66  71  68  59  69
68    61  66  62  69  84  73  62  71  64  59  70
67    53  76  65  77  68  65  60  68  71  60  79
65    54  65  68  69  68  81  64  69  71  67  67
77    63  61  78  73  69  92  68  72  61  65  77
67    73  81  73  66  63  96  71  75  74  81  63
80    68  76  65  82  69  74  88  80  86  78  76
80    77  82  80  77  70  81  89  91  82  71  73
93    64  87  75  101 89  87  78  106 84  64  71
;
run;

ods graphics on;
 proc ucm data = input plots=all; 
      id date interval = month; 
      model deaths ; 
      irregular ; 
      level checkbreak; 
      season length = 12 type=trig var = 0 noest; * Note I have used trigonometry to model seasonality;
   run;

   ods graphics off;

বিভিন্ন উপাদান এবং সংমিশ্রণগুলি বিবেচনা করে বেশ কয়েকটি পুনরাবৃত্তির পরে, আমি নিম্নলিখিত ফর্মটির একটি পার্সিমোনিয়াস মডেল দিয়ে শেষ করেছি:

একটি স্টোকাস্টিক স্তর আছে + নির্ণায়ক মৌসুমতা + কিছু আউটলিয়ার এবং ডেটাতে অন্য কোনও সনাক্তকারী বৈশিষ্ট্য নেই।

এখানে চিত্র বর্ণনা লিখুন

নীচে বিভিন্ন উপাদানগুলির তাত্পর্য বিশ্লেষণ করা হল। লক্ষ্য করুন যে আমি @ এলভিস এবং @ নিক কক্সের অনুরূপ ত্রিকোণমিতি (এটি প্রোসি ইউসিএম-তে মৌসুমী বিবৃতিতে পাপ / কোস) ব্যবহার করেছি। আপনি ইউসিএম-এ ডামি কোডিংও ব্যবহার করতে পারেন এবং যখন আমি উভয়ই পরীক্ষা করেছিলাম তখন একই ফলাফল পেয়েছি। এসএএসে মৌসুমীতা মডেল করার দুটি উপায়ের মধ্যে পার্থক্যের জন্য এই ডকুমেন্টেশনটি দেখুন ।

এখানে চিত্র বর্ণনা লিখুন

উপরে প্রদর্শিত হিসাবে আপনি বিদেশী আছেন: দুটি ডাল এবং ২০০৯ সালে একটি স্তর বদল (২০০৯ এর পরে কী অর্থনীতি / আবাসন বুদবুদ ভূমিকা পালন করেছিল ??) যা আরও গভীর ডাইভ বিশ্লেষণের মাধ্যমে ব্যাখ্যা করা যেতে পারে। ব্যবহারের একটি ভাল বৈশিষ্ট্যProc UCM এটি দুর্দান্ত গ্রাফিকাল আউটপুট সরবরাহ করে।

নীচে seasonতু এবং একটি সম্মিলিত প্রবণতা এবং মৌসুমী প্লট রয়েছে। যা কিছু অবশিষ্ট আছে তা হ'ল আওয়াজ

এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন

আপনি যদি পি মান এবং তাত্পর্য পরীক্ষা ব্যবহার করতে চান তবে আরও গুরুত্বপূর্ণ ডায়াগনস্টিক পরীক্ষা হ'ল আপনার অবশিষ্টাংশগুলি প্যাটার্ন-কম এবং সাধারণভাবে বিতরণ করা হয়েছে যা ইউসিএম ব্যবহার করে উপরের মডেলটিতে সন্তুষ্ট এবং নীচে যেমন এসিএফ / প্যাকফের মতো অবশিষ্টাংশ ডায়াগনস্টিক প্লটগুলিতে দেখানো হয়েছে এবং অন্যদের.

এখানে চিত্র বর্ণনা লিখুন

উপসংহার : ইউসিএম ব্যবহার করে ডেটা বিশ্লেষণ এবং তাত্পর্যপূর্ণ পরীক্ষার উপর ভিত্তি করে ডেটা মৌসুমী বলে মনে হয় এবং আমরা মে / জুন / জুলাইয়ের গ্রীষ্মের মাসে এবং ডিসেম্বর ও ফেব্রুয়ারির শীতের মাসে সবচেয়ে কম মৃত্যুর মুখ দেখি।

অতিরিক্ত বিবেচনাগুলি : দয়া করে alতু পরিবর্তনের পরিমাণের বাস্তব তাত্পর্যটিও বিবেচনা করুন। কাউন্টারফ্যাক্টুয়াল যুক্তি উপেক্ষা করার জন্য দয়া করে আপনার হাইপোথিসিসটি আরও পরিপূরক ও বৈধ করার জন্য ডোমেন বিশেষজ্ঞদের সাথে পরামর্শ করুন।

আমি কোনওভাবেই বলছি না যে এই সমস্যাটি সমাধান করার জন্য এটিই একমাত্র পন্থা। ইউসিএম সম্পর্কে আমি যে বৈশিষ্ট্যটি পছন্দ করি তা হ'ল এটি আপনাকে সমস্ত সময়ের সিরিজের বৈশিষ্ট্যগুলিকে স্পষ্টভাবে মডেল করতে দেয় এবং পাশাপাশি এটি অত্যন্ত চাক্ষুষও হয়।


এই উত্তর এবং আকর্ষণীয় মন্তব্যের জন্য ধন্যবাদ। আমি ইউসিএম জানি না, এটি খুব আকর্ষণীয় বলে মনে হচ্ছে, আমি এটিকে মাথায় রাখার চেষ্টা করব ...
এলভিস

(+1) আকর্ষণীয় বিশ্লেষণ। আমি এখনও উল্লেখযোগ্য নির্বিচার মৌসুমী প্যাটার্নের উপস্থিতি সমাপ্ত করার বিষয়ে সতর্ক থাকব তবে আপনার ফলাফলগুলি এই সম্ভাবনাটি আরও ঘনিষ্ঠভাবে দেখার জন্য বলবে। Seasonতু স্থিতিশীলতার জন্য ক্যানোভা এবং হ্যানসেন পরীক্ষা সহায়ক হতে পারে, এটি এখানে উদাহরণ হিসাবে বর্ণনা করা হয়েছে
javlacalle

gretlπ/6

1
+1 টি। অনেক আকর্ষণীয় এবং সহায়ক মন্তব্য। আপনার মনোবিজ্ঞানী, মনোচিকিত্সক, সমাজবিজ্ঞানী তালিকায় আবহাওয়াবিদ / জলবায়ু বিশেষজ্ঞকে যুক্ত করা যেতে পারে। এই জাতীয় ব্যক্তি যোগ করতে চান যে কোনও দুটি বছর বৃষ্টিপাত এবং তাপমাত্রার চক্রের ক্ষেত্রে এক রকম নয়। শীতকালে আরও হতাশার (কম দিন দৈর্ঘ্য ইত্যাদির জন্য) আমি অদ্ভুতভাবে অনুমান করতে পারি, তবে কিছু তথ্য দেওয়া অনুমানের জন্য এত বেশি।
নিক কক্স

ধন্যবাদ @ ফোরকাস্টার, এটি আমার শিক্ষায় অনেক কিছু যুক্ত করে। আমি একজন মনস্তত্ত্ববিদ, জনস্বাস্থ্যের ডিগ্রি সহ। আমি আপনার তালিকায় এপিডেমিওলজিস্ট যুক্ত করব। আমি প্রথমদিকে যেমন উল্লেখ করেছি, মৌসুমী প্রবণতা এবং আত্মহত্যা সম্পর্কে প্রচুর পুরাণ (ওরফে থিয়োরাইজিং) রয়েছে। যে কোনও দিকেই মৌসুমী প্রবণতার জন্য দৃ strong় যুক্তি তৈরি করা যায় যাতে আমাদের (ডিস) নিশ্চিতকরণের পরিমাণগত বিশ্লেষণ প্রয়োজন। জনস্বাস্থ্যের দৃষ্টিকোণ থেকে, যদি আমরা তীব্র বিচ্ছিন্নতা খুঁজে পাই তবে আমরা হস্তক্ষেপগুলি লক্ষ্যবস্তু করতে পারি। আমি এই তথ্যতে তা দেখছি না। আত্মহত্যার তত্ত্বের দিক থেকে, এমনকি ছোট প্রবণতাগুলি নিশ্চিত করে তত্ত্বের বিকাশকে অবহিত করতে পারে।
সোভনয়

1

প্রাথমিক চাক্ষুষ অনুমানের জন্য, নিম্নলিখিত গ্রাফটি ব্যবহার করা যেতে পারে। লোয়েস বক্ররেখা এবং এর 95% আত্মবিশ্বাসের ব্যবধানের সাথে মাসিক ডেটা প্লট করা, এটি প্রদর্শিত হয় যে জুনে একটি মাঝারি বছর পিকিং রয়েছে। অন্যান্য উপাদানগুলি ডেটা বিস্তৃত বিতরণের কারণ হতে পারে, সুতরাং মৌসুমী প্রবণতা এই কাঁচা ডেটা লোয়েস প্লটটিতে মুখোশ পেতে পারে। তথ্য পয়েন্টগুলি jitters হয়েছে।

এখানে চিত্র বর্ণনা লিখুন

সম্পাদনা করুন: নিম্নলিখিত প্লটটি আগের মাসে সংখ্যা থেকে মামলার সংখ্যার পরিবর্তনের জন্য নিম্ন বক্ররেখা এবং আত্মবিশ্বাসের ব্যবধান দেখায়:

এখানে চিত্র বর্ণনা লিখুন

এটি আরও দেখায় যে বছরের প্রথমার্ধের মাসগুলিতে, মামলার সংখ্যা বাড়তে থাকে, যখন তারা বছরের দ্বিতীয়ার্ধে পড়ছে। এটি বছরের মাঝামাঝি শীর্ষের প্রস্তাব দেয়। যাইহোক, আত্মবিশ্বাসের ব্যবধানগুলি প্রশস্ত হয় এবং সারা বছর ধরে 0, অর্থাৎ কোনও পরিবর্তন হয় না, যা পরিসংখ্যানিক তাত্পর্যটির অভাবকে ইঙ্গিত করে।

এক মাসের সংখ্যার পার্থক্যটি পূর্ববর্তী 3 মাসের মানের সাথে তুলনা করা যেতে পারে:

এখানে চিত্র বর্ণনা লিখুন

এটি মে মাসে সংখ্যায় সুস্পষ্ট বৃদ্ধি এবং অক্টোবরে হ্রাস দেখায়।


(-1) ইতিমধ্যে এই প্রশ্নের তিনটি উচ্চ-মানের উত্তর রয়েছে। আপনার উত্তর পোস্ট করা প্রশ্নের উত্তর দেয় না - আপনি এটি মন্তব্য হিসাবে পোস্ট করতে পারেন । এই ডেটা কীভাবে বিশ্লেষণ করা যায় আপনি উত্তর সরবরাহ করেন না।
টিম

আমি আগে এখানে মন্তব্য পোস্ট করেছিলেন (প্রশ্নের নীচে দেখুন), কিন্তু আমি মন্তব্যগুলিতে চিত্র পোস্ট করতে পারি না।
rnso

যদিও আমি এখানে সম্পাদকীয় বুঝতে পেরেছি, আমি বলব যে @ আরএনএসো একটি দুর্দান্ত গ্রাফ সরবরাহ করেছে যা সম্ভাব্য মৌসুমী উপাদানটি সুন্দরভাবে চিত্রিত করে এবং আমার মূল পোস্টের অংশ হওয়া উচিত ছিল।
সোভনয়

আমি তা বুঝতে পারি এবং সম্মত হই তবে এখনও এটি কোনও উত্তর নয় বরং মন্তব্য বা উন্নতি। @ আরএনএসো আপনাকে মন্তব্যের মাধ্যমে পরামর্শ দিতে পারে যে আপনি এই জাতীয় প্লটটি দেখতে বা অন্তর্ভুক্ত করতে পারেন।
টিম

@ গ্লেন_বি, @ টিম: আমি আরও একটি প্লট যুক্ত করেছি যা কার্যকর হতে পারে এবং আমি কোনও মন্তব্য করতে পারি না।
rnso
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.