প্রশ্ন ট্যাগ «dataset»

এই সাইটে ডেটাসেটগুলির জন্য অনুরোধগুলি অফ-টপিক। ডেটাসেট তৈরি, প্রক্রিয়াজাতকরণ বা রক্ষণাবেক্ষণ সম্পর্কিত প্রশ্নের জন্য এই ট্যাগটি ব্যবহার করুন।

3
ডেটা তৈরির ধারণাটির শূন্য-গড় রয়েছে
আমি প্রায়শই লোককে সমস্ত উপাদান থেকে মধ্যবর্তীতা সরিয়ে শূন্য-গড়ের একটি ডেটাসেটের একটি মাত্রা / বৈশিষ্ট্য তৈরি করতে দেখি। তবে আমি কখনই বুঝতে পারি নি কেন এমন করব? প্রাকপ্রসেসিং পদক্ষেপ হিসাবে এটি করার প্রভাব কী? এটি শ্রেণিবিন্যাসের পারফরম্যান্সকে উন্নত করে? এটি ডেটাসেট সম্পর্কে কিছু উত্তর দিতে সাহায্য করে? ডেটা বোঝার জন্য …

2
কিছু লোক কেন তাদের কাঁচা ডেটাতে রিগ্রেশন-জাতীয় মডেল অনুমানগুলি পরীক্ষা করে এবং অন্যান্য লোকেরা তাদের অবশিষ্টাংশে পরীক্ষা করে?
আমি পরীক্ষামূলক মনোবিজ্ঞানের পিএইচডি শিক্ষার্থী এবং আমার ডেটা কীভাবে বিশ্লেষণ করতে হয় তা সম্পর্কে আমার দক্ষতা এবং জ্ঞানের উন্নতি করার জন্য আমি কঠোর চেষ্টা করি। মনোবিজ্ঞানে আমার 5 ম বছর অবধি, আমি ভেবেছিলাম যে রিগ্রেশন-জাতীয় মডেলগুলি (যেমন, আনোভা) নিম্নলিখিত জিনিসগুলি ধরে নিয়েছে: তথ্য স্বাভাবিকতা ডেটা এবং এর জন্য বৈকল্পিক একজাতীয়তা …

4
আর এর মধ্যে পরিসংখ্যান বিশ্লেষণের জন্য সহজেই ডেটা সঞ্চয় করার সর্বোত্তম উপায় [বন্ধ]
বন্ধ থাকে। এই প্রশ্নটি অফ-টপিক । এটি বর্তমানে উত্তর গ্রহণ করছে না। এই প্রশ্নটি উন্নত করতে চান? প্রশ্নটি আপডেট করুন যাতে এটি ক্রস ভ্যালিডেটের জন্য অন-বিষয় । 6 বছর আগে বন্ধ ছিল । আমি কিছু সময়ের জন্য কোনও সমস্যা ছাড়াই আমার ডেটা সংরক্ষণ করতে টেক্সট ফাইলগুলি ব্যবহার করছি। তবে সাম্প্রতিক …
12 r  dataset 

1
আরআর-তে স্বাধীনতা ডিগ্রিআরসিআরসি মিশ্রিত এবং lme / lmer এর মধ্যে পার্থক্য
দ্রষ্টব্য: এই প্রশ্নটি পুনরায় পোস্ট করা হয়েছে, কারণ আমার আগের প্রশ্নটি আইনি কারণে মুছে ফেলা হয়েছিল। আর- lmeএর nlmeপ্যাকেজ থেকে ফাংশনটির সাথে এসএএস থেকে প্রসকে মিক্সেড তুলনা করার সময় , আমি কিছু বরং বিভ্রান্তিকর পার্থক্যের উপর হোঁচট খেয়েছি। আরও সুনির্দিষ্টভাবে বলা যায় যে বিভিন্ন পরীক্ষায় স্বাধীনতার ডিগ্রিগুলির মধ্যে পার্থক্য রয়েছে …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

4
পরিসংখ্যান সরঞ্জামগুলির অযাচিত ব্যবহার থেকে ব্যয়বহুল পরিণতির উদাহরণ
আমি সন্দেহ করি যে পরিসংখ্যান সংক্রান্ত সরঞ্জামগুলির বেশিরভাগ ব্যবহারকারী হ'ল আনুষঙ্গিক ব্যবহারকারী (ভক্তরা যাদের পরিসংখ্যান সম্পর্কে কোনও আনুষ্ঠানিক প্রশিক্ষণ ছিল না)। গবেষকরা এবং অন্যান্য পেশাদারদের তাদের উপাত্তগুলিতে পরিসংখ্যানগত পদ্ধতি প্রয়োগ করার জন্য এটি খুব লোভনীয় কারণ তারা পিয়ার-পর্যালোচিত কাগজপত্র, ধূসর সাহিত্যে, ওয়েব বা কোনও সম্মেলনে "এর আগে" দেখেছেন। তবে প্রয়োজনীয় …

2
প্রদত্ত প্রতিক্রিয়া ভেরিয়েবলের সম্মানের সাথে অনুকূল বিনিং
আমি প্রদত্ত প্রতিক্রিয়া (লক্ষ্য) বাইনারি ভেরিয়েবলের সাথে সম্মতি এবং একটি পরামিতি হিসাবে সর্বাধিক সংখ্যার অন্তর সহ একটানা পরিবর্তনশীলের অনুকূল বিনিং পদ্ধতি (বিচক্ষণতা) ​​খুঁজছি। উদাহরণ: আমার কাছে "উচ্চতা" (সংখ্যা অবিচ্ছিন্ন) এবং "has_back_pains" (বাইনারি) ভেরিয়েবলযুক্ত লোকদের পর্যবেক্ষণগুলির একটি সেট রয়েছে। আমি ব্যাক ব্যথার সাথে বিভিন্ন অনুপাতের লোকদের সাথে উচ্চতাটি 3 টি অন্তর …

2
'পরিশ্রমী ডেটা' তৈরির জন্য সেরা অভ্যাস
হ্যাডলি উইকহাম বিশ্লেষণ করার জন্য জেএসএসে "পরিশ্রমী ডেটা" ( লিংক ) নামে একটি স্টার্লার আর্টিকেল লিখেছিলেন বিশ্লেষণ করার জন্য ডেটা ম্যানিপুলেশন এবং ডেটাটিকে "অনুকূল" অবস্থাতে নিয়ে আসার বিষয়ে। যাইহোক, আমি ভাবছিলাম যে কোনও কাজের সেটিংয়ে টবুলার ডেটা উপস্থাপনের ক্ষেত্রে সর্বোত্তম অভ্যাসগুলি কী ছিল? ধরা যাক আপনার সহকর্মী আপনাকে তাকে কিছু …
12 dataset  tables 

2
ডেটাটিকে পরীক্ষা এবং প্রশিক্ষণে বিভক্ত করা কি নিখুঁতভাবে একটি "পরিসংখ্যান" জিনিস সেট করে?
আমি একজন পদার্থবিজ্ঞানের ছাত্র যিনি মেশিন লার্নিং / ডেটা সায়েন্স অধ্যয়ন করে যাচ্ছি তাই আমি এই প্রশ্নটির কোনও বিবাদ শুরু করার অর্থ বোঝাতে চাই না :) যাইহোক, কোনও পদার্থবিজ্ঞানের আন্ডারগ্রাজুয়েট প্রোগ্রামের একটি বড় অংশ ল্যাব / পরীক্ষা-নিরীক্ষা করা, যার অর্থ প্রচুর ডেটা প্রক্রিয়াজাতকরণ এবং পরিসংখ্যান বিশ্লেষণ। তবে পদার্থবিজ্ঞানীরা যেভাবে ডেটা …

3
ব্যবহারিক পিসিএ ডেটা সহ টিউটোরিয়াল
পিসিএ টিউটোরিয়ালটির জন্য ইন্টারনেট অনুসন্ধান করা হাজারো ফলাফল দেয় (এমনকি ভিডিওগুলি)। টিউটোরিয়াল অনেকগুলি খুব ভাল। তবে আমি এমন কোনও ব্যবহারিক উদাহরণ খুঁজে পাচ্ছি না যেখানে পিসিএকে এমন কিছু ডেটা-সেট ব্যবহার করে ব্যাখ্যা করা হয়েছে যা আমি প্রদর্শনের জন্য ব্যবহার করতে পারি। আমার একটি টিউটোরিয়াল দরকার যা কিছু ছোট ডেটা সেট …

14
একটি নাম থেকে আপনি কত তথ্য খনি করতে পারেন?
একটি নাম: প্রথমটি, সম্ভবত একটি মাঝামাঝি এবং উপাধি। আমি প্রকাশ্যে উপলভ্য ডেটাসেট ব্যবহার করে কোনও নাম আপনি কীভাবে বের করতে পারেন তা সম্পর্কে আমি আগ্রহী। আমি জানি যে আপনি মার্কিন আদমশুমারির তথ্য ব্যবহার করে নিম্ন-উচ্চ সম্ভাবনার (ইনপুটটির উপর নির্ভর করে) যে কোনও জায়গার সাথে নিম্নলিখিতটি পেতে পারেন: 1) লিঙ্গ। 2) …

3
একটি বিশাল বাইনারি ডেটাসেটকে কয়েকটি বিভাগে গুচ্ছ করার জন্য আমার কোন অ্যালগরিদম ব্যবহার করা উচিত?
আমার কাছে বাইনারি ডেটার একটি বৃহত (650 কে সারি * 62 কলাম) ম্যাট্রিক্স (কেবলমাত্র 0-1 টি এন্ট্রি) রয়েছে। ম্যাট্রিক্স বেশিরভাগ ক্ষেত্রে বিরল: প্রায় 8% ভরা হয়। আমি এটি 5 টি গ্রুপে ক্লাস্টার করতে চাই - 1 থেকে 5 পর্যন্ত নাম বলুন I আমি শ্রেণিবদ্ধ ক্লাস্টারিং চেষ্টা করেছি এবং এটি আকারটি …

3
ডেটা প্রিপ্রোসেসিং এবং আউটলেট সনাক্তকরণ কৌশলগুলি কভার করে ভাল বই
শিরোনামটি যেমন চলে যায়, কেউ কি কোনও ভাল, আপ টু ডেট বই সম্পর্কে জানেন যা সাধারণ এবং বিশেষত আউটিলার সনাক্তকরণ কৌশলগুলিতে ডেটা প্রিপ্রোসেসিংয়ের তথ্য কভার করে? বইটিতে একচেটিয়াভাবে ফোকাস করার দরকার নেই, তবে এটি পূর্বোক্ত বিষয়গুলিকে নিখুঁতভাবে মোকাবেলা করতে হবে - আমি এমন কোনও বিষয় নিয়ে খুশি হতে পারব না …

4
একটি "ডেটা সেট" বলতে আসলে কী বোঝায়?
এটি কি কেবল ডাটা পয়েন্টের সমষ্টি? অথবা এটি বিভিন্ন ভেরিয়েবলের মানগুলির সাথে সজ্জিত একটি সারণী বিন্যাসে বিভিন্ন উপাদানগুলির জন্য ডেটা পয়েন্টগুলির উপস্থাপনা? এটি কাঁচা ডেটা থেকে কীভাবে আলাদা?

1
ডেটা হ্যান্ডলিং ত্রুটিগুলি ইতিমধ্যে পরিসংখ্যানগত বিশ্লেষণের জন্য 'মূল্যবান' রয়েছে?
ঠিক আছে, ন্যায্য সতর্কতা - এটি একটি দার্শনিক প্রশ্ন যাতে কোনও সংখ্যা জড়িত না। সময়ের সাথে সাথে কীভাবে ডেটা সেটগুলিতে ত্রুটিগুলি কমছে এবং কীভাবে বিশ্লেষকদের দ্বারা এটি আচরণ করা উচিত - বা এটি যদি আদৌ গুরুত্বপূর্ণ হয় তবে সে সম্পর্কে আমি অনেক কিছু ভাবছিলাম? পটভূমির জন্য, আমি একটি দীর্ঘমেয়াদী অধ্যয়নের …
10 dataset  error 

2
ধরণের ডেটা (নামমাত্র / অর্ডিনাল / অন্তর / অনুপাত) কি সত্যই ধরণের ভেরিয়েবল হিসাবে বিবেচনা করা উচিত?
সুতরাং উদাহরণস্বরূপ এখানে সংজ্ঞা আছে যে আমি স্ট্যান্ডার্ড পাঠ্য বই থেকে পেয়েছি পরিবর্তনশীল - জনসংখ্যা বা নমুনার বৈশিষ্ট্য। প্রাক্তন। একটি পরীক্ষায় স্টক বা গ্রেডের দাম ডেটা - প্রকৃত পর্যবেক্ষণ করা মান সুতরাং একটি দুটি কলামের রিপোর্টের জন্য [নাম | আয়] কলামের নামগুলি ভেরিয়েবল এবং আসল পর্যবেক্ষণকৃত মান values ​​ডেভ | …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.