প্রশ্ন ট্যাগ «outliers»

আউটলেটর এমন একটি পর্যবেক্ষণ যা ডেটাসেটের একটি সাধারণ বৈশিষ্ট্যের তুলনায় অস্বাভাবিক বা ভালভাবে বর্ণিত নয় বলে মনে হয়। একটি অস্বস্তিকর সম্ভাবনা হ'ল এই ডেটাগুলি অধ্যয়ন করার উদ্দেশ্যে করা তথ্যের চেয়ে পৃথক জনসংখ্যার থেকে আসে।

4
স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করে আউটলিয়ারগুলি সনাক্ত করা
এখানে আমার প্রশ্ন অনুসরণ করে , আমি ভাবছি যে আউটলিয়ারগুলি সনাক্ত করার জন্য স্ট্যান্ডার্ড বিচ্যুতি ব্যবহারের পক্ষে বা বিপক্ষে দৃ strong় মতামত রয়েছে কিনা (উদাহরণস্বরূপ যে কোনও ডেটাপয়েন্ট যা 2 টিরও বেশি স্ট্যান্ডার্ড বিচ্যুতি আউটলেটর)। আমি জানি এটি অধ্যয়নের প্রসঙ্গে নির্ভরশীল, উদাহরণস্বরূপ একটি ডাটা পয়েন্ট, 48 কেজি অবশ্যই বাচ্চাদের ওজনের …
27 outliers 

1
পিসিএ কেন বিদেশীদের প্রতি সংবেদনশীল?
এই এসইতে অনেকগুলি পোস্ট রয়েছে যা মূল উপাদানগুলির বিশ্লেষণের (পিসিএ) দৃ rob় পদ্ধতির বিষয়ে আলোচনা করে তবে পিসিএ কেন প্রথমে বিদেশীদের প্রতি সংবেদনশীল তা সম্পর্কে একটিও ভাল ব্যাখ্যা আমি পাই না ।

4
র্যানস্যাক পরিসংখ্যানগুলিতে কেন বহুল ব্যবহৃত হয় না?
কম্পিউটার দর্শনের ক্ষেত্র থেকে আগত, আমি প্রায়শই প্রচুর বিদেশিদের সাথে ডেটাতে মডেলগুলি ফিটিংয়ের জন্য রানস্যাক (র্যান্ডম নমুনা সম্মতি) পদ্ধতিটি ব্যবহার করেছি। যাইহোক, আমি এটি পরিসংখ্যানবিদদের দ্বারা ব্যবহৃত কখনও দেখিনি, এবং আমি সর্বদা এই ধারণাটির মধ্যে ছিলাম যে এটি একটি "পরিসংখ্যানগতভাবে কার্যকর" পদ্ধতি হিসাবে বিবেচিত হয় না। কেন যে এত? এটি …

3
সময়-সিরিজ-ভিত্তিক অ্যানোমালি সনাক্তকরণের অ্যালগোরিদমে ওয়েবেলেটগুলির প্রয়োগ
আমি অ্যান্ড্রু মুরের স্ট্যাটিস্টিকাল ডেটা মাইনিং টিউটোরিয়ালগুলির মাধ্যমে আমার পথে কাজ শুরু করেছি (এই ক্ষেত্রে প্রথমে যে কারও পক্ষে উদ্যোগী হওয়ার জন্য অত্যন্ত প্রস্তাবিত)। আমি "টাইম-সিরিজ ভিত্তিক অ্যানোমালি ডিটেকশন অ্যালগরিদমগুলির পরিচিতি ওভারভিউ" শিরোনামে এই অত্যন্ত আকর্ষণীয় পিডিএফটি পড়তে শুরু করেছিলাম যেখানে মুর রোগের প্রাদুর্ভাবগুলি সনাক্ত করতে একটি অ্যালগরিদম তৈরিতে ব্যবহৃত …

3
স্কেল বিতরণগুলিতে আউটিলার সনাক্তকরণ
আউটলারের একটি শাস্ত্রীয় সংজ্ঞায়নের আওতায় ডেটা পয়েন্ট হিসাবে উপরের বা নিম্ন কোয়ার্টাইল থেকে 1.5 * আইকিউআরকে ছাড়িয়ে যায়, সেখানে স্কিচবিহীন বিতরণের অনুমান রয়েছে। স্কিউড ডিস্ট্রিবিউশনের জন্য (এক্সফেনশনাল, পোইসন, জ্যামিতিক, ইত্যাদি) মূল ফাংশনের রূপান্তর বিশ্লেষণ করে কোনও আউটলেটর সনাক্ত করার সেরা উপায়? উদাহরণস্বরূপ, কোনও তাত্পর্যপূর্ণ বিতরণ দ্বারা আলগাভাবে পরিচালিত বিতরণগুলি একটি …

2
লিনিয়ার রিগ্রেশন ডায়াগনস্টিকগুলি আপনাকে কোন ক্রম অনুসারে করা উচিত?
লিনিয়ার রিগ্রেশন বিশ্লেষণে, আমরা বহিরাগতদের বিশ্লেষণ করি, বহুবিশ্লেষ পরীক্ষা করি, পরীক্ষা বৈধতা পরীক্ষা করি astic প্রশ্নটি হল: এগুলি প্রয়োগ করার কোনও আদেশ আছে কি? আমি বলতে চাইছি, আমাদের কি প্রথমে আউটলিয়ারদের বিশ্লেষণ করতে হবে, এবং তারপরে মাল্টিকোলাইনারিটি পরীক্ষা করতে হবে? নাকি বিপরীত? এ নিয়ে কি কোনও নিয়ম আছে?

2
পর্যবেক্ষণ-স্তরের মহালানোবিস দূরত্ব বিতরণ
আমার যদি মাল্টিভারিয়েট স্বাভাবিক আইআইড নমুনা এবং ডি 2 আই ( বি , এ ) = ( এক্স আই - বি ) ′ এ - 1 ( এক্স আই - বি ) সংজ্ঞায়িত হয় ) (ক মহলানবিশ দূরত্ব একটি নমুনা বিন্দু থেকে ভেক্টর কে [ছক] সাজানোর যা একটি ম্যাট্রিক্স ব্যবহার …

4
একাধিক রিগ্রেশন করার সময় স্ট্যাটিস্টিকাল সফ্টওয়্যার দ্বারা আউটলিয়ার হিসাবে চিহ্নিত হওয়া কেসগুলি মুছবেন কিনা?
আমি একাধিক রিগ্রেশন বিশ্লেষণ সম্পাদন করছি এবং আমার ডেটা থেকে বহিরাগতদের মুছে ফেলা উচিত কিনা তা সম্পর্কে আমি নিশ্চিত নই। আমি যে ডেটা সম্পর্কে উদ্বিগ্ন সেগুলি এসপিএসএস বক্সপ্লটগুলিতে "চেনাশোনা" হিসাবে প্রদর্শিত হবে, তবে কোনও নক্ষত্রমুখে নেই (যা আমাকে মনে করে যে তারা 'খারাপ নয়')। আমি যে কেসগুলির জন্য উদ্বিগ্ন তাগুলি …

1
গণনার ডেটাতে আউটলিয়ারগুলি সনাক্ত করা
আমার কাছে নির্দ্বিধায় একটি মোটামুটি সোজা ফরোয়ার্ড সমস্যা বলে মনে হয়েছিল যা গণনা উপাত্তের অনেকগুলি সেটের জন্য আউটলেট সনাক্তকরণের সাথে জড়িত। বিশেষত, আমি নির্ধারণ করতে চাই যে গণনা উপক্রমের একটি সিরিজের এক বা একাধিক মান বিতরণের বাকি গণনাগুলির তুলনায় প্রত্যাশার চেয়ে বেশি বা কম if বিস্ময়কর কারণটি হ'ল আমার ৩,৫০০ …

3
কিভাবে একটি বক্সপ্লট থেকে skewness মূল্যায়ন?
এই ডেটা থেকে তৈরি একটি বক্সপ্লট দেখে কীভাবে সঙ্কোচনের সিদ্ধান্ত নেওয়া যায়: 340, 300, 520, 340, 320, 290, 260, 330 একটি বই বলে, "যদি নিম্ন চতুর্ভুজটি মধ্যের থেকে উপরের কোয়ার্টাইলের চেয়ে বেশি দূরে থাকে, তবে বিতরণটি নেতিবাচকভাবে সঙ্কুচিত হয়।" আরও কয়েকটি সূত্র কম-বেশি একই কথা বলেছে। আমি আর ব্যবহার করে …

2
বুটস্ট্র্যাপিং - আমার আগে আউটলিয়ারগুলি অপসারণ করা দরকার?
আমরা একটি নতুন পণ্য বৈশিষ্ট্যের বিভাজন পরীক্ষা চালিয়েছি এবং উপার্জনের উপর উত্সাহটি উল্লেখযোগ্য হলে তা পরিমাপ করতে চাই। আমাদের পর্যবেক্ষণগুলি অবশ্যই সাধারণত বিতরণ করা হয় না (আমাদের বেশিরভাগ ব্যবহারকারী ব্যয় করেন না এবং এটির মধ্যে, এটি প্রচুর পরিমাণে ছোট ব্যয়কারী এবং কয়েকটি খুব বড় ব্যয়কারীদের দিকে ভারী হয়)। আমরা উপায়গুলি …

2
ডামি বৈশিষ্ট্যগুলি (এবং অন্যান্য স্বতন্ত্র / শ্রেণিবদ্ধ বৈশিষ্ট্যগুলি) সহ অসাধারণ সনাক্তকরণ
TL; ড discreteঅসাধারণ সনাক্তকরণ সম্পাদন করার সময় ডেটা মোকাবেলা করার প্রস্তাবিত উপায় কী ? categoricalঅসাধারণ সনাক্তকরণ সম্পাদন করার সময় ডেটা মোকাবেলা করার প্রস্তাবিত উপায় কী ? এই উত্তরটি কেবল ফলাফলগুলি ফিল্টার করার জন্য পৃথক ডেটা ব্যবহার করার পরামর্শ দেয়। সম্ভবত পর্যবেক্ষণের পারক্টেজ সুযোগের সাথে বিভাগের মানটি প্রতিস্থাপন করবেন? ইন্ট্রো এখানে …

4
কোনও আউটলারের বক্স এবং হুইস্কার প্লটের সংজ্ঞা দেওয়ার ভিত্তি কী?
একটি বাক্স এবং হুইস্কার প্লটের বাইরে পয়েন্ট , যেখানে এবং কি 1 প্রথম কোয়ার্টাইল এবং ডেটা তৃতীয় কোয়ার্টাইল হয়।{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 এই সংজ্ঞা জন্য ভিত্তি কি? প্রচুর পরিমাণে পয়েন্ট সহ, এমনকি একটি সাধারণভাবে সাধারণ বিতরণও বিদেশীদের প্রত্যাবর্তন করে। উদাহরণস্বরূপ, ধরুন আপনি ক্রমটি শুরু করেছেন: xseq<-seq(1-.5^1/4000,.5^1/4000, by = -.00025) এই ক্রমটি 4000 …

1
আমরা কি বিদেশীদের প্রকাশ করার জন্য এক ছাড়ের গড় এবং মানক বিচ্যুতি ব্যবহার করতে পারি?
মনে করুন আমি সাধারণত ডেটা বিতরণ করেছি। ডেটার প্রতিটি উপাদানের জন্য আমি এটি দেখতে চাই না যে এটি কতগুলি এসডি থেকে দূরে রয়েছে। ডেটাতে একটি আউটলেটর থাকতে পারে (সম্ভবত কেবলমাত্র একটি, তবে দুটি বা তিনটিও হতে পারে) বা নাও হতে পারে তবে এই আউটলেটটি মূলত আমি যা খুঁজছি তা। আমি …

3
চূড়ান্ত আউটলেটারের সাথে বক্স প্লট কীভাবে উপস্থাপন করবেন?
আমি কিছু তথ্য উপস্থাপন সম্পর্কে কিছু গাইডেন্স ব্যবহার করতে পারি। এই প্রথম প্লটটি সাইটোকাইন আইএল -10 এর ক্ষেত্রে কেস-নিয়ন্ত্রণের তুলনা। আমি 99% ডেটা অন্তর্ভুক্ত করতে আমি y অক্ষটি ম্যানুয়ালি সেট করেছি। আমি ম্যানুয়ালি এটি সেট করার কারণটি হ'ল কেস গ্রুপের চূড়ান্ত আউটলেট রয়েছে। আমার সহযোগীরা আমাদের ডেটাসেটে আউটলেট অপসারণ করতে …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.