প্রশ্ন ট্যাগ «outliers»

আউটলেটর এমন একটি পর্যবেক্ষণ যা ডেটাসেটের একটি সাধারণ বৈশিষ্ট্যের তুলনায় অস্বাভাবিক বা ভালভাবে বর্ণিত নয় বলে মনে হয়। একটি অস্বস্তিকর সম্ভাবনা হ'ল এই ডেটাগুলি অধ্যয়ন করার উদ্দেশ্যে করা তথ্যের চেয়ে পৃথক জনসংখ্যার থেকে আসে।

1
পূর্বাভাসে ছুটির প্রভাবগুলির জন্য কীভাবে অ্যাকাউন্ট করবেন
আমার কাছে সাপ্তাহিক seasonতুতে মোটামুটি অনুমানযোগ্য দৈনিক সময় সিরিজ রয়েছে। আমি যখন কোন ছুটি না থাকি তখন ভবিষ্যদ্বাণীগুলি নিয়ে আসতে সক্ষম হয়েছি যেগুলি বেশ নির্ভুল বলে মনে হয় (ক্রস-বৈধকরণের দ্বারা নিশ্চিত)। যাইহোক, যখন ছুটি থাকে, আমার নিম্নলিখিত বিষয়গুলি থাকে: আমি আমার পূর্বাভাসে ছুটির দিনে শূন্যের সংখ্যা পেয়েছি, যদিও সমস্ত holidaysতিহাসিক …

3
কেন বৃদ্ধির পদ্ধতিটি বিদেশীদের কাছে সংবেদনশীল
আমি অনেক নিবন্ধ পেয়েছি যা জানিয়েছে যে বুস্টিং পদ্ধতিগুলি বিদেশীদের কাছে সংবেদনশীল তবে কেন এটি ব্যাখ্যা করার মতো কোনও নিবন্ধ নেই। আমার অভিজ্ঞতায় আউটলিয়াররা কোনও মেশিন লার্নিং অ্যালগরিদমের পক্ষে খারাপ, তবে কেন উত্সাহ দেওয়ার পদ্ধতিগুলি বিশেষ সংবেদনশীল হিসাবে বিবেচিত হয়? নীচের অ্যালগরিদমগুলি কীভাবে বহিরাগতদের সংবেদনশীলতার দিক থেকে র‌্যাঙ্ক করবে: বুস্ট-ট্রি, …

4
অপারীদের অপসারণ করার জন্য ভাল ফর্ম?
আমি সফটওয়্যার তৈরির জন্য পরিসংখ্যান নিয়ে কাজ করছি। পাস / ব্যর্থ এবং অতিবাহিত সময়ের প্রতিটি বিল্ডের জন্য আমার কাছে ডেটা রয়েছে এবং আমরা এই / সপ্তাহের 200 ডলার উত্পন্ন করি। সাফল্যের হার একত্রিত করা সহজ, আমি বলতে পারি যে 45% কোনও নির্দিষ্ট সপ্তাহ পেরিয়ে গেছে। তবে আমি পাশাপাশি সময় অতিবাহিত …

3
অসঙ্গতি সনাক্তকরণের জন্য হারিয়ে যাওয়া মানগুলির সাথে সময় সিরিজে এসটিএল
আমি কিছু অনুপস্থিত পর্যবেক্ষণের সাথে জলবায়ু ডেটা একটি সিরিজ সময় ব্যতীত মান সনাক্ত করার চেষ্টা করছি। ওয়েবে অনুসন্ধান করে আমি অনেকগুলি উপলব্ধ পন্থা পেয়েছি। এর মধ্যে, স্ট্রল পচনটি প্রবণতা এবং seasonতু উপাদানগুলি অপসারণ এবং বাকী অংশটি অধ্যয়ন করার অর্থে মনে হয়। এসটিএল পড়া : essতুর ভিত্তিতে একটি asonতু-ট্রেন্ড পচন প্রক্রিয়া …

1
আরআর-তে স্বাধীনতা ডিগ্রিআরসিআরসি মিশ্রিত এবং lme / lmer এর মধ্যে পার্থক্য
দ্রষ্টব্য: এই প্রশ্নটি পুনরায় পোস্ট করা হয়েছে, কারণ আমার আগের প্রশ্নটি আইনি কারণে মুছে ফেলা হয়েছিল। আর- lmeএর nlmeপ্যাকেজ থেকে ফাংশনটির সাথে এসএএস থেকে প্রসকে মিক্সেড তুলনা করার সময় , আমি কিছু বরং বিভ্রান্তিকর পার্থক্যের উপর হোঁচট খেয়েছি। আরও সুনির্দিষ্টভাবে বলা যায় যে বিভিন্ন পরীক্ষায় স্বাধীনতার ডিগ্রিগুলির মধ্যে পার্থক্য রয়েছে …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

3
খুব ছোট সেটগুলিতে আউটলেট সনাক্তকরণ
বারোটি নমুনা আলোকিত মানের মান প্রদত্ত একটি মূলত স্থিতিশীল আলোক উত্সের উজ্জ্বলতার জন্য আমার যথাসম্ভব নির্ভুল হওয়া দরকার। সেন্সরটি অসম্পূর্ণ, এবং আলো মাঝে মাঝে "ঝাঁকুনি" উজ্জ্বল বা গাer় হতে পারে, যা উপেক্ষা করা যায়, অতএব আমার বহিরাগত সনাক্তকরণের প্রয়োজন (আমার মনে হয়?)? আমি এখানে বিভিন্ন পদ্ধতির উপর কিছু পড়া করেছি …

4
টাইম-সিরিজে আউটিলার সনাক্তকরণ: মিথ্যা পজিটিভ কীভাবে হ্রাস করা যায়?
আমি সময়-সিরিজে আউটলেট সনাক্তকরণ স্বয়ংক্রিয় করার চেষ্টা করছি এবং আমি এখানে রব হ্যান্ডম্যান প্রস্তাবিত সমাধানটির একটি পরিবর্তন ব্যবহার করেছি । বলুন, আমি প্রতিদিন বিভিন্ন দেশ থেকে কোনও ওয়েবসাইটে ভিজিট পরিমাপ করি। এমন কয়েকটি দেশে যেখানে প্রতিদিনের পরিদর্শনগুলি কয়েক হাজার বা হাজার হাজার, আমার পদ্ধতিটি যুক্তিযুক্তভাবে কাজ করছে বলে মনে হয়। …

1
কুর্তোসিসের মজবুত অনুমান?
আমি কুর্তোসিসের জন্য সাধারণ অনুমানক ব্যবহার করছি, , তবে আমি লক্ষ্য করেছি যে আমার অভিজ্ঞতাগত বিতরণে এমনকি ছোট 'বিদেশী' , অর্থাত্ কেন্দ্র থেকে অনেক ছোট শিখর এটি প্রচণ্ডভাবে প্রভাবিত করে। কুর্তোসিসের প্রাক্কলনকারীটি আরও শক্তিশালী?কে^= μ^4σ^4কে^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}

2
সাধারণীকৃত লিনিয়ার মিশ্রিত মডেল: ডায়াগনস্টিক্স
আমার একটি এলোমেলো ইন্টারসেপ্ট লজিস্টিক রিগ্রেশন রয়েছে (বারবার পরিমাপের কারণে) এবং আমি কিছু ডায়াগনস্টিক করতে চাই, বিশেষত বিদেশী এবং প্রভাবশালী পর্যবেক্ষণ সম্পর্কিত। আমি পর্যবেক্ষণগুলি দাঁড়িয়ে আছে কিনা তা দেখতে অবশিষ্টাংশের দিকে তাকালাম। তবে আমি কুকের দূরত্ব বা ডিএফএফআইটিএস এর মতো কিছু দেখতে চাই। হোসমার এবং লেমশো (2000) বলেছেন যে পারস্পরিক …

2
বিদেশীদের সনাক্ত করার জন্য আইকিউআর কতটা সঠিক
আমি একটি স্ক্রিপ্ট লিখছি যা প্রক্রিয়া চলমান সময় বিশ্লেষণ করে। আমি তাদের বিতরণ সম্পর্কে নিশ্চিত নই তবে আমি জানতে চাই যে কোনও প্রক্রিয়া "খুব দীর্ঘ" হয় কিনা। এখনও অবধি আমি সর্বশেষ রান বারের (এন> ৩০) তিনটি স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করেছি, তবে আমাকে জানানো হয়েছিল যে ডেটা স্বাভাবিক না হলে (যা …

1
অসাধারণ সনাক্তকরণের জন্য স্বয়ংক্রিয় বৈশিষ্ট্য নির্বাচন
অসাধারণ সনাক্তকরণের জন্য বৈশিষ্ট্যগুলি স্বয়ংক্রিয়ভাবে নির্বাচন করার সর্বোত্তম উপায় কী? আমি সাধারণত অ্যানোমালি ডিটেকশনকে এমন একটি অ্যালগোরিদম হিসাবে গণ্য করি যেখানে বৈশিষ্ট্যগুলি মানব বিশেষজ্ঞরা নির্বাচিত করেছেন: আউটপুট পরিসরটি কীভাবে গুরুত্বপূর্ণ (যেমন "অস্বাভাবিক ইনপুট - অস্বাভাবিক আউটপুট" হিসাবে) তাই অনেকগুলি বৈশিষ্ট্য সহ আপনি সংমিশ্রণ করে আরও অনেক ছোট সাবসেট নিয়ে আসতে …

3
গড় জিপিএস পয়েন্ট সন্ধান করা হচ্ছে
পয়েন্টের জনসংখ্যার থেকে গড় জিপিএস পয়েন্ট খুঁজতে আমার একটি প্রোগ্রাম লিখতে হবে। অনুশীলনে নিম্নলিখিতটি ঘটে: প্রতি মাসে কোনও ব্যক্তি একই স্থিতিশীল সম্পদের একটি জিপিএস পয়েন্ট রেকর্ড করে। জিপিএসের প্রকৃতির কারণে এই পয়েন্টগুলি প্রতি মাসে কিছুটা আলাদা হয়। কখনও কখনও ব্যক্তি একটি ভুল একটি ভুল একটি সম্পূর্ণ ভিন্ন স্থানে ভুল সেটাকে …
11 outliers  spatial 

2
রিগ্রেশন ব্যবহার করে আউটলেট সনাক্তকরণ
মিথ্যা সনাক্তকরণের জন্য রিগ্রেশন ব্যবহার করা যেতে পারে। আমি বুঝতে পারি যে বিদেশীদের অপসারণ করে একটি রিগ্রেশন মডেল উন্নত করার উপায় রয়েছে। তবে এখানে প্রাথমিক লক্ষ্যটি কোনও রিগ্রেশন মডেল ফিট করা নয় তবে রিগ্রেশন ব্যবহার করে মিথ্যাবাদী খুঁজে বের করা

6
অ-লিনিয়ার রিগ্রেশন জন্য আউটলিয়ারদের সনাক্ত করা
আমি মাইটগুলির কার্যকরী প্রতিক্রিয়ার ক্ষেত্রে গবেষণা করছি। আমি রজার্স টাইপ II ফাংশনের প্যারামিটারগুলি (আক্রমণ হার এবং হ্যান্ডলিংয়ের সময়) অনুমান করতে একটি রিগ্রেশন করতে চাই। আমার কাছে পরিমাপের একটি ডেটাসেট রয়েছে। আমি কীভাবে সর্বোপরি বিদেশী নির্ধারণ করতে পারি? (Dateset একটি সহজ 2 কলামটি পাঠ্য নামক ফাইল: আমার রিগ্রেশন জন্য আমি আর …

3
ডেটা প্রিপ্রোসেসিং এবং আউটলেট সনাক্তকরণ কৌশলগুলি কভার করে ভাল বই
শিরোনামটি যেমন চলে যায়, কেউ কি কোনও ভাল, আপ টু ডেট বই সম্পর্কে জানেন যা সাধারণ এবং বিশেষত আউটিলার সনাক্তকরণ কৌশলগুলিতে ডেটা প্রিপ্রোসেসিংয়ের তথ্য কভার করে? বইটিতে একচেটিয়াভাবে ফোকাস করার দরকার নেই, তবে এটি পূর্বোক্ত বিষয়গুলিকে নিখুঁতভাবে মোকাবেলা করতে হবে - আমি এমন কোনও বিষয় নিয়ে খুশি হতে পারব না …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.