প্রশ্ন ট্যাগ «data-transformation»

গাণিতিক পুনঃপ্রকাশ, প্রায়শই অমূল্য, ডেটা মানগুলির। পরিসংখ্যানের মডেলটির অনুমানগুলি মেটাতে বা বিশ্লেষণের ফলাফলগুলিকে আরও ব্যাখ্যাযোগ্য করে তোলার জন্য ডেটা প্রায়শই রূপান্তরিত হয়।

12
জিরো সহ আমি কীভাবে অ-নেতিবাচক ডেটা রুপান্তর করব?
আমি যদি উচ্চ পজিটিভ ডেটা স্কাই করে থাকি তবে আমি প্রায়শই লগ নিই। তবে জিরোস অন্তর্ভুক্ত অত্যন্ত স্কেলযুক্ত অ-নেতিবাচক ডেটা দিয়ে আমার কী করা উচিত? আমি দুটি রূপান্তর ব্যবহার দেখেছি: লগ ইন করুন( x + 1 )log⁡(x+1)\log(x+1) যার 0 টি 0 টি মানচিত্রের ঝরঝরে বৈশিষ্ট্য রয়েছে। লগ ইন করুন( এক্স …

9
কীভাবে আর-তে গ্রুপ দ্বারা ডেটা সংক্ষিপ্ত করবেন? [বন্ধ]
আমার কাছে আর ডেটা ফ্রেম রয়েছে: age group 1 23.0883 1 2 25.8344 1 3 29.4648 1 4 32.7858 2 5 33.6372 1 6 34.9350 1 7 35.2115 2 8 35.2115 2 9 35.2115 2 10 36.7803 1 ... আমাকে নিম্নলিখিত ফর্মটিতে ডেটা ফ্রেম পাওয়া দরকার: group mean sd 1 …

2
কখন (এবং কেন) আপনার কোনও বিতরণের লগ নেওয়া উচিত (সংখ্যার)?
বলুন আমার কাছে কিছু historicalতিহাসিক ডেটা রয়েছে যেমন, অতীতের শেয়ারের দাম, বিমানের টিকিটের দামের ওঠানামা, সংস্থার অতীতের আর্থিক তথ্য ... এখন কেউ (বা কোনও সূত্র) বরাবর এসে বলে "চলুন বিতরণটির লগটি ব্যবহার করি / ব্যবহার করি" এবং এখানে আমি কেন যাই ? প্রশ্নাবলী: কেন প্রথমে বিতরণটির লগ নেওয়া উচিত? মূল …

8
লিনিয়ার রিগ্রেশন-এ, প্রকৃত মানগুলির পরিবর্তে স্বতন্ত্র ভেরিয়েবলের লগটি ব্যবহার করা কখন উপযুক্ত?
আমি কি প্রশ্নে স্বতন্ত্র ভেরিয়েবলের জন্য আরও ভাল আচরণের বিতরণ খুঁজছি, বা বহিরাগতদের প্রভাব কমাতে বা অন্য কিছু?

1
বর্গমূলের রূপান্তর কেন গণনা ডেটার জন্য সুপারিশ করা হয়?
আপনার কাছে ডেটা গণনা করার সময় প্রায়শই স্কোয়ার রুটটি গ্রহণ করার পরামর্শ দেওয়া হয়। (সিভি কিছু উদাহরণের জন্য, @ HarveyMotulsky এর উত্তর দেখার এখানে , অথবা @ whuber এর উত্তর এখানে ।) অন্যদিকে, যখন একটি প্রতিক্রিয়া পরিবর্তনশীল পইসন হিসাবে বিতরণ করা সহ একটি সাধারণ রৈখিক মডেল ঝুলানো, লগ হয় ক্যানোনিকাল …

5
শূন্যের লগ না এড়াতে কত পরিমাণে একটি পরিমাণ যুক্ত করা উচিত?
আমার ডেটা যেমন আছে তেমন বিশ্লেষণ করেছি। এখন আমি সমস্ত ভেরিয়েবলের লগ নেওয়ার পরে আমার বিশ্লেষণগুলি দেখতে চাই। অনেকগুলি ভেরিয়েবলে অনেকগুলি শূন্য থাকে। সুতরাং আমি শূন্য লগ গ্রহণ এড়াতে একটি স্বল্প পরিমাণ যুক্ত। এখন পর্যন্ত আমি 10 ^ -10 যুক্ত করেছি, সত্যই কোনও যুক্তি ছাড়াই, কারণ আমার মনে হয়েছে যে …

8
ধারাবাহিক তথ্যটিকে অবিচ্ছিন্ন হিসাবে গণ্য করা কি কখনও বুদ্ধিযুক্ত?
পৃথক এবং অবিচ্ছিন্ন ডেটা সম্পর্কে এই প্রশ্নের উত্তর দেওয়ার জন্য আমি গম্ভীরভাবে দৃserted়ভাবে জানিয়েছিলাম যে বিভাগগত তথ্যটিকে ধারাবাহিক হিসাবে গণ্য করা খুব কমই বোধগম্য। এটির মুখটি যা স্বতঃস্ফূর্ত বলে মনে হয় তবে স্বজ্ঞাততা প্রায়শই পরিসংখ্যানগুলির জন্য একটি দুর্বল গাইড বা কমপক্ষে আমার mine তাই এখন আমি ভাবছি: এটা কি সত্য? …

3
লগ আইশ কখন উপযুক্ত?
আমি পড়েছি যে টাইম সিরিজের চার্টে y- অক্ষের মতো নির্দিষ্ট পরিস্থিতিতে যেমন লেখচিত্র / গ্রাফিংয়ের জন্য লগ স্কেল ব্যবহার করা উপযুক্ত। যাইহোক, আমি কেন এটি ক্ষেত্রে, বা কখন এটি উপযুক্ত হবে সে সম্পর্কে একটি নির্দিষ্ট ব্যাখ্যা খুঁজে পাইনি। দয়া করে মনে রাখবেন, আমি কোনও পরিসংখ্যানবিদ নই তাই আমি পয়েন্টটি পুরোপুরি …

3
বাক্স-কক্স স্বাধীন ভেরিয়েবলের রূপান্তরের মতো?
স্বাধীন ভেরিয়েবলগুলির জন্য রূপান্তর করার মতো কোনও বাক্স-কক্স রয়েছে? এটি, এমন একটি রূপান্তর যা পরিবর্তনশীলকে অনুকূল করে তোলে যাতে লিনিয়ার মডেলটির জন্য আরও যুক্তিসঙ্গত ফিট করতে পারে?xxxy~f(x) যদি তাই হয় তবে এটির সাথে কোন অনুষ্ঠান করার আছে R?

1
এক-হট বনাম ডামি এনকোডিং সাইকিট-শিখুন
শ্রেণিবদ্ধ ভেরিয়েবলগুলি এনকোডিংয়ের দুটি ভিন্ন উপায় রয়েছে। বলুন, একটি শ্রেণীবদ্ধ ভেরিয়েবলের n মান রয়েছে। এক-হট এনকোডিং এটিকে এন ভেরিয়েবলে রূপান্তরিত করে , যখন ডামি এনকোডিং এটিকে এন -1 ভেরিয়েবলগুলিতে রূপান্তর করে । আমাদের কাছে যদি k শ্রেণীবদ্ধ ভেরিয়েবল থাকে, যার প্রত্যেকটির এন মান হয়। একটি হট এনকোডিংটি এন ভেরিয়েবলের সাথে …

1
ট্রেনিং-এবং টেস্টসেটের মান নির্ধারণ / নরমালাইজেশন কীভাবে প্রয়োগ করতে হবে যদি ভবিষ্যদ্বাণী করা লক্ষ্য হয়?
আমি কি একই সাথে আমার সমস্ত ডেটা বা ফোল্ডগুলি (যদি সিভি প্রয়োগ করা হয়) রূপান্তর করি? যেমন (allData - mean(allData)) / sd(allData) আমি কি ট্রেনসেট এবং টেস্টসেটকে আলাদাভাবে রূপান্তর করব? যেমন (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) অথবা আমি ট্রেনসেটটি রূপান্তর করব এবং টেস্টসেটে গণনাগুলি ব্যবহার …

3
লগের রূপান্তরিত ভবিষ্যদ্বাণী এবং / অথবা প্রতিক্রিয়ার ব্যাখ্যা
আমি ভাবছি কিনা এটির ব্যাখ্যায় কোনও পার্থক্য রয়েছে কিনা কেবল নির্ভরশীল, নির্ভরশীল এবং স্বতন্ত্র বা কেবলমাত্র স্বাধীন ভেরিয়েবলগুলি লগ রূপান্তরিত কিনা। ক্ষেত্রে বিবেচনা করুন log(DV) = Intercept + B1*IV + Error আমি আইভিটি শতাংশ বৃদ্ধি হিসাবে ব্যাখ্যা করতে পারি তবে আমার যখন কীভাবে এই পরিবর্তন হয় log(DV) = Intercept + …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
সাধারণীকরণ বনাম স্কেলিং
ডেটা 'নরমালাইজেশন' এবং ডেটা 'স্কেলিং' এর মধ্যে পার্থক্য কী? এখনও অবধি আমি ভেবেছিলাম উভয় পদই একই প্রক্রিয়াটিকে বোঝায় তবে এখন বুঝতে পারলাম এর বাইরে আরও কিছু আছে যা আমি জানি / বুঝতে পারি না। এছাড়াও যদি নরমালাইজেশন এবং স্কেলিংয়ের মধ্যে পার্থক্য থাকে তবে কখন আমরা নরমালাইজেশন ব্যবহার করব তবে স্কেলিং …

1
রিগ্রেশন: পরিবর্তনশীল রূপান্তর
ভেরিয়েবলগুলি রূপান্তর করার সময়, আপনাকে কি একই রূপান্তরগুলির সবগুলি ব্যবহার করতে হবে? উদাহরণস্বরূপ, আমি কি আলাদা আলাদা রূপান্তরিত ভেরিয়েবলগুলি বাছাই বা বেছে নিতে পারি, যেমন: , বয়সের বয়স, কর্মসংস্থানের দৈর্ঘ্য, আবাসের দৈর্ঘ্য এবং আয় হতে দিন।x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) বা, আপনার অবশ্যই আপনার রূপান্তরগুলির সাথে সামঞ্জস্য …

1
ভিন্ন ভিন্ন উপাত্তের ডেটাগুলির জন্য একমুখী আনোভা বিকল্প
শৈবাল বায়োমাসের তিনটি গোষ্ঠীর ( একজনএকজনA , বিবিB , সিসিC ) ডেটা রয়েছে যার মধ্যে অসম নমুনার আকার রয়েছে ( এনএকজন= 15এনএকজন=15n_A=15 , এনবি= 13এনবি=13n_B=13 , এনসি= 12এনসি=12n_C=12 ) এবং আমি যদি এই গোষ্ঠীগুলি একই জনসংখ্যার থেকে থাকে তবে আমি তুলনা করতে চাই । একমুখী আনোভা অবশ্যই যাওয়ার উপায় হবে, …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.