পরিসংখ্যান এবং বড় তথ্য dataset

3

আমি প্রায়শই লোককে সমস্ত উপাদান থেকে মধ্যবর্তীতা সরিয়ে শূন্য-গড়ের একটি ডেটাসেটের একটি মাত্রা / বৈশিষ্ট্য তৈরি করতে দেখি। তবে আমি কখনই বুঝতে পারি নি কেন এমন করব? প্রাকপ্রসেসিং পদক্ষেপ হিসাবে এটি করার প্রভাব কী? এটি শ্রেণিবিন্যাসের পারফরম্যান্সকে উন্নত করে? এটি ডেটাসেট সম্পর্কে কিছু উত্তর দিতে সাহায্য করে? ডেটা বোঝার জন্য …

12 data-mining dataset

2

কিছু লোক কেন তাদের কাঁচা ডেটাতে রিগ্রেশন-জাতীয় মডেল অনুমানগুলি পরীক্ষা করে এবং অন্যান্য লোকেরা তাদের অবশিষ্টাংশে পরীক্ষা করে?

আমি পরীক্ষামূলক মনোবিজ্ঞানের পিএইচডি শিক্ষার্থী এবং আমার ডেটা কীভাবে বিশ্লেষণ করতে হয় তা সম্পর্কে আমার দক্ষতা এবং জ্ঞানের উন্নতি করার জন্য আমি কঠোর চেষ্টা করি। মনোবিজ্ঞানে আমার 5 ম বছর অবধি, আমি ভেবেছিলাম যে রিগ্রেশন-জাতীয় মডেলগুলি (যেমন, আনোভা) নিম্নলিখিত জিনিসগুলি ধরে নিয়েছে: তথ্য স্বাভাবিকতা ডেটা এবং এর জন্য বৈকল্পিক একজাতীয়তা …

12 regression dataset residuals assumptions

4

আর এর মধ্যে পরিসংখ্যান বিশ্লেষণের জন্য সহজেই ডেটা সঞ্চয় করার সর্বোত্তম উপায় [বন্ধ]

বন্ধ থাকে। এই প্রশ্নটি অফ-টপিক । এটি বর্তমানে উত্তর গ্রহণ করছে না। এই প্রশ্নটি উন্নত করতে চান? প্রশ্নটি আপডেট করুন যাতে এটি ক্রস ভ্যালিডেটের জন্য অন-বিষয় । 6 বছর আগে বন্ধ ছিল । আমি কিছু সময়ের জন্য কোনও সমস্যা ছাড়াই আমার ডেটা সংরক্ষণ করতে টেক্সট ফাইলগুলি ব্যবহার করছি। তবে সাম্প্রতিক …

12 r dataset

1

আরআর-তে স্বাধীনতা ডিগ্রিআরসিআরসি মিশ্রিত এবং lme / lmer এর মধ্যে পার্থক্য

দ্রষ্টব্য: এই প্রশ্নটি পুনরায় পোস্ট করা হয়েছে, কারণ আমার আগের প্রশ্নটি আইনি কারণে মুছে ফেলা হয়েছিল। আর- lmeএর nlmeপ্যাকেজ থেকে ফাংশনটির সাথে এসএএস থেকে প্রসকে মিক্সেড তুলনা করার সময় , আমি কিছু বরং বিভ্রান্তিকর পার্থক্যের উপর হোঁচট খেয়েছি। আরও সুনির্দিষ্টভাবে বলা যায় যে বিভিন্ন পরীক্ষায় স্বাধীনতার ডিগ্রিগুলির মধ্যে পার্থক্য রয়েছে …

12 r mixed-model sas degrees-of-freedom pdf unbiased-estimator distance-functions functional-data-analysis hellinger time-series outliers c++ relative-risk absolute-risk rare-events regression t-test multiple-regression survival teaching multiple-regression regression self-study t-distribution machine-learning recommender-system self-study binomial standard-deviation data-visualization r predictive-models pearson-r spearman-rho r regression modeling r categorical-data data-visualization ggplot2 many-categories machine-learning cross-validation weka microarray variance sampling monte-carlo regression cross-validation model-selection feature-selection elastic-net distance-functions information-theory r regression mixed-model random-effects-model fixed-effects-model dataset data-mining

4

পরিসংখ্যান সরঞ্জামগুলির অযাচিত ব্যবহার থেকে ব্যয়বহুল পরিণতির উদাহরণ

আমি সন্দেহ করি যে পরিসংখ্যান সংক্রান্ত সরঞ্জামগুলির বেশিরভাগ ব্যবহারকারী হ'ল আনুষঙ্গিক ব্যবহারকারী (ভক্তরা যাদের পরিসংখ্যান সম্পর্কে কোনও আনুষ্ঠানিক প্রশিক্ষণ ছিল না)। গবেষকরা এবং অন্যান্য পেশাদারদের তাদের উপাত্তগুলিতে পরিসংখ্যানগত পদ্ধতি প্রয়োগ করার জন্য এটি খুব লোভনীয় কারণ তারা পিয়ার-পর্যালোচিত কাগজপত্র, ধূসর সাহিত্যে, ওয়েব বা কোনও সম্মেলনে "এর আগে" দেখেছেন। তবে প্রয়োজনীয় …

12 dataset methodology

2

প্রদত্ত প্রতিক্রিয়া ভেরিয়েবলের সম্মানের সাথে অনুকূল বিনিং

আমি প্রদত্ত প্রতিক্রিয়া (লক্ষ্য) বাইনারি ভেরিয়েবলের সাথে সম্মতি এবং একটি পরামিতি হিসাবে সর্বাধিক সংখ্যার অন্তর সহ একটানা পরিবর্তনশীলের অনুকূল বিনিং পদ্ধতি (বিচক্ষণতা) খুঁজছি। উদাহরণ: আমার কাছে "উচ্চতা" (সংখ্যা অবিচ্ছিন্ন) এবং "has_back_pains" (বাইনারি) ভেরিয়েবলযুক্ত লোকদের পর্যবেক্ষণগুলির একটি সেট রয়েছে। আমি ব্যাক ব্যথার সাথে বিভিন্ন অনুপাতের লোকদের সাথে উচ্চতাটি 3 টি অন্তর …

12 r dataset optimization discrete-data binning

2

'পরিশ্রমী ডেটা' তৈরির জন্য সেরা অভ্যাস

হ্যাডলি উইকহাম বিশ্লেষণ করার জন্য জেএসএসে "পরিশ্রমী ডেটা" ( লিংক ) নামে একটি স্টার্লার আর্টিকেল লিখেছিলেন বিশ্লেষণ করার জন্য ডেটা ম্যানিপুলেশন এবং ডেটাটিকে "অনুকূল" অবস্থাতে নিয়ে আসার বিষয়ে। যাইহোক, আমি ভাবছিলাম যে কোনও কাজের সেটিংয়ে টবুলার ডেটা উপস্থাপনের ক্ষেত্রে সর্বোত্তম অভ্যাসগুলি কী ছিল? ধরা যাক আপনার সহকর্মী আপনাকে তাকে কিছু …

12 dataset tables

2

ডেটাটিকে পরীক্ষা এবং প্রশিক্ষণে বিভক্ত করা কি নিখুঁতভাবে একটি "পরিসংখ্যান" জিনিস সেট করে?

আমি একজন পদার্থবিজ্ঞানের ছাত্র যিনি মেশিন লার্নিং / ডেটা সায়েন্স অধ্যয়ন করে যাচ্ছি তাই আমি এই প্রশ্নটির কোনও বিবাদ শুরু করার অর্থ বোঝাতে চাই না :) যাইহোক, কোনও পদার্থবিজ্ঞানের আন্ডারগ্রাজুয়েট প্রোগ্রামের একটি বড় অংশ ল্যাব / পরীক্ষা-নিরীক্ষা করা, যার অর্থ প্রচুর ডেটা প্রক্রিয়াজাতকরণ এবং পরিসংখ্যান বিশ্লেষণ। তবে পদার্থবিজ্ঞানীরা যেভাবে ডেটা …

11 regression machine-learning cross-validation dataset experiment-design

3

ব্যবহারিক পিসিএ ডেটা সহ টিউটোরিয়াল

পিসিএ টিউটোরিয়ালটির জন্য ইন্টারনেট অনুসন্ধান করা হাজারো ফলাফল দেয় (এমনকি ভিডিওগুলি)। টিউটোরিয়াল অনেকগুলি খুব ভাল। তবে আমি এমন কোনও ব্যবহারিক উদাহরণ খুঁজে পাচ্ছি না যেখানে পিসিএকে এমন কিছু ডেটা-সেট ব্যবহার করে ব্যাখ্যা করা হয়েছে যা আমি প্রদর্শনের জন্য ব্যবহার করতে পারি। আমার একটি টিউটোরিয়াল দরকার যা কিছু ছোট ডেটা সেট …

11 data-visualization dataset pca data-mining

14

একটি নাম থেকে আপনি কত তথ্য খনি করতে পারেন?

একটি নাম: প্রথমটি, সম্ভবত একটি মাঝামাঝি এবং উপাধি। আমি প্রকাশ্যে উপলভ্য ডেটাসেট ব্যবহার করে কোনও নাম আপনি কীভাবে বের করতে পারেন তা সম্পর্কে আমি আগ্রহী। আমি জানি যে আপনি মার্কিন আদমশুমারির তথ্য ব্যবহার করে নিম্ন-উচ্চ সম্ভাবনার (ইনপুটটির উপর নির্ভর করে) যে কোনও জায়গার সাথে নিম্নলিখিতটি পেতে পারেন: 1) লিঙ্গ। 2) …

11 dataset data-mining census

3

একটি বিশাল বাইনারি ডেটাসেটকে কয়েকটি বিভাগে গুচ্ছ করার জন্য আমার কোন অ্যালগরিদম ব্যবহার করা উচিত?

আমার কাছে বাইনারি ডেটার একটি বৃহত (650 কে সারি * 62 কলাম) ম্যাট্রিক্স (কেবলমাত্র 0-1 টি এন্ট্রি) রয়েছে। ম্যাট্রিক্স বেশিরভাগ ক্ষেত্রে বিরল: প্রায় 8% ভরা হয়। আমি এটি 5 টি গ্রুপে ক্লাস্টার করতে চাই - 1 থেকে 5 পর্যন্ত নাম বলুন I আমি শ্রেণিবদ্ধ ক্লাস্টারিং চেষ্টা করেছি এবং এটি আকারটি …

11 clustering dataset k-means binary-data

3

ডেটা প্রিপ্রোসেসিং এবং আউটলেট সনাক্তকরণ কৌশলগুলি কভার করে ভাল বই

শিরোনামটি যেমন চলে যায়, কেউ কি কোনও ভাল, আপ টু ডেট বই সম্পর্কে জানেন যা সাধারণ এবং বিশেষত আউটিলার সনাক্তকরণ কৌশলগুলিতে ডেটা প্রিপ্রোসেসিংয়ের তথ্য কভার করে? বইটিতে একচেটিয়াভাবে ফোকাস করার দরকার নেই, তবে এটি পূর্বোক্ত বিষয়গুলিকে নিখুঁতভাবে মোকাবেলা করতে হবে - আমি এমন কোনও বিষয় নিয়ে খুশি হতে পারব না …

11 dataset data-mining references outliers

4

একটি "ডেটা সেট" বলতে আসলে কী বোঝায়?

এটি কি কেবল ডাটা পয়েন্টের সমষ্টি? অথবা এটি বিভিন্ন ভেরিয়েবলের মানগুলির সাথে সজ্জিত একটি সারণী বিন্যাসে বিভিন্ন উপাদানগুলির জন্য ডেটা পয়েন্টগুলির উপস্থাপনা? এটি কাঁচা ডেটা থেকে কীভাবে আলাদা?

10 dataset terminology definition

1

ডেটা হ্যান্ডলিং ত্রুটিগুলি ইতিমধ্যে পরিসংখ্যানগত বিশ্লেষণের জন্য 'মূল্যবান' রয়েছে?

ঠিক আছে, ন্যায্য সতর্কতা - এটি একটি দার্শনিক প্রশ্ন যাতে কোনও সংখ্যা জড়িত না। সময়ের সাথে সাথে কীভাবে ডেটা সেটগুলিতে ত্রুটিগুলি কমছে এবং কীভাবে বিশ্লেষকদের দ্বারা এটি আচরণ করা উচিত - বা এটি যদি আদৌ গুরুত্বপূর্ণ হয় তবে সে সম্পর্কে আমি অনেক কিছু ভাবছিলাম? পটভূমির জন্য, আমি একটি দীর্ঘমেয়াদী অধ্যয়নের …

10 dataset error

2

ধরণের ডেটা (নামমাত্র / অর্ডিনাল / অন্তর / অনুপাত) কি সত্যই ধরণের ভেরিয়েবল হিসাবে বিবেচনা করা উচিত?

সুতরাং উদাহরণস্বরূপ এখানে সংজ্ঞা আছে যে আমি স্ট্যান্ডার্ড পাঠ্য বই থেকে পেয়েছি পরিবর্তনশীল - জনসংখ্যা বা নমুনার বৈশিষ্ট্য। প্রাক্তন। একটি পরীক্ষায় স্টক বা গ্রেডের দাম ডেটা - প্রকৃত পর্যবেক্ষণ করা মান সুতরাং একটি দুটি কলামের রিপোর্টের জন্য [নাম | আয়] কলামের নামগুলি ভেরিয়েবল এবং আসল পর্যবেক্ষণকৃত মান values ডেভ | …

10 dataset ordinal-data categorical-data ratio

প্রশ্ন ট্যাগ «dataset»