পরিসংখ্যান শাখা কি?


30

গণিতে, বীজগণিত, বিশ্লেষণ, টপোলজি ইত্যাদির মতো শাখা রয়েছে। মেশিন লার্নিংয়ে তদারকি করা হয়, নিরীক্ষণ করা হয় না এবং শক্তিবৃদ্ধি শেখানো হয়। এই শাখাগুলির প্রত্যেকটির মধ্যেই সূক্ষ্ম শাখা রয়েছে যা আরও পদ্ধতিগুলিকে বিভক্ত করে।

পরিসংখ্যানের সাথে সমান্তরাল আঁকতে আমার সমস্যা হচ্ছে। পরিসংখ্যানের প্রধান শাখা (এবং উপ-শাখা) কী হবে? একটি নিখুঁত পার্টিশন সম্ভবত সম্ভব নয়, তবে বড় ফাঁকা মানচিত্রের চেয়ে ভাল কিছু।

ভিজ্যুয়াল উদাহরণ: এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন


6
প্রস্তাব এখনও অন্য কারণে এই প্রশ্নের উত্তর দেওয়া যায় না (এবং কেন, সম্ভবত প্রতিজ্ঞা misplaced হয়): এটা দুর্বল বোঝা হল যে কঠিন, তাত্ত্বিক বিজ্ঞান (গণিত মত) উদ্দেশ্য থেকে সাধারণের চেয়ে থেকে বিশেষজ্ঞ । সুতরাং যদি আমরা এই ক্ষেত্রটিতে একটি সফল তদন্তের গতিপথটি কল্পনা করতে পারি তবে আমরা এটিকে ছোট, আরও পরিশ্রুত শাখাগুলির মতো শাখা হিসাবে দেখব না, বরং একটি লেন্স আরও বিমূর্ত ধারণা এবং চিন্তাধারায় প্রসারিত হতে চলেছে।
আদমো

@ রব হ্যান্ডম্যানের উত্তর এখনও আমার মনে হয়েছে। আমি এখানে কোনও শ্রেণিবিন্যাস সম্পর্কে অত্যন্ত সন্দেহবাদী। তদ্ব্যতীত, এটি পতাকাঙ্কিত করার মতো যেকোন জায়গা হিসাবে ভাল যে কারওর জন্য ঘটে যাওয়া বিষয়গুলির একটি তালিকা আ গাছ ভিত্তিক শ্রেণিবিন্যাসের তুলনায় খুব কমই পড়ে। এবং যদিও ডেনড্রোগ্রাম বা হেয়ারবলের উপস্থাপনাগুলি মৃদুভাবে আগ্রহী, তারা ক্ষেত্রের বহুগুণ প্রকৃতির প্রদর্শন করার বাইরে কোন প্রকৃত ব্যবহার বা আগ্রহের পরিচয় দেয়?
নিক কক্স

উত্তর:


52

আমি এই শ্রেণিবিন্যাস সিস্টেমগুলিকে অত্যন্ত অসহায় এবং বিপরীতমুখী মনে করি। উদাহরণ স্বরূপ:

  • নিউরাল নেটওয়ার্কগুলি তত্ত্বাবধানে শেখার একটি ফর্ম is
  • ক্যালকুলাস ডিফারেনশিয়াল জ্যামিতিতে ব্যবহৃত হয়
  • সম্ভাব্য তত্ত্ব সেট তত্ত্বের অংশ হিসাবে আনুষ্ঠানিকভাবে করা যেতে পারে

ইত্যাদি। গণিতের কোনও দ্ব্যর্থহীন "শাখা" নেই এবং পরিসংখ্যানও হওয়া উচিত নয়।


11
"নিউরাল নেটওয়ার্কগুলি তত্ত্বাবধানে শেখার একটি ফর্ম"। এটিও পুরোপুরি সত্য নয়, তাই না? আমার অর্থ, তত্ত্বাবধানে পড়াশোনা, নিরীক্ষণযোগ্য শেখার এমনকি এমনকি শক্তিবৃদ্ধি শেখার ক্ষেত্রেও এনএন ব্যবহার করতে পারে (এবং ব্যবহার করে)! কমপক্ষে স্নায়বিক নেটওয়ার্কগুলির ধারণাটি (এটি কেবল একটি বিশাল ননলাইনার ফাংশন যা বিভিন্ন অপ্টিমাইজেশন পদ্ধতির মাধ্যমে অনুকূলিত হতে পারে, তাদের মধ্যে এসএল, ইউএল এবং আরএল)। তবে সম্ভবত আপনি যেভাবে এটি ব্যবহার করছেন তা এই শব্দটির জন্য সহজভাবে ব্যবহৃত হয়েছে, সেই ক্ষেত্রে .. যে কেউ সঠিক হতে পারে।
ব্লুরাইন এস

7
অবশ্যই, এর সত্যতা নেই, তবে এটি সত্যই কার্যকর নয়। এমন কোনও মডেল আছে যা ওপির চাহিদা পূরণ করে?
জে শাইলার র‌্যাড

3
রব ঠিক আছে। সিদ্ধান্ত গাছগুলি রিগ্রেশনে ব্যবহৃত হয় এবং অ্যাডাবোস্ট একটি শ্রেণিবদ্ধকরণ পদ্ধতি, তবে মানচিত্রটি এটি দেখায় না।
জেন

4
আমি স্বীকার করি আমি এই দৃষ্টিকোণটি সত্যই বুঝতে পারি না। একটি পরিসংখ্যান পাঠ্যপুস্তকের অবশ্যই অবশ্যই তার অধ্যায়গুলির ক্রমটি কোনওভাবে সজ্জিত থাকতে হবে এবং এর বিষয়বস্তুর পৃষ্ঠাটি সেই সংস্থাকে প্রতিফলিত করে। বিষয়বস্তুর পৃষ্ঠার কাঠামোটি ক্ষেত্রের ধারণাগুলি কীভাবে সংগঠিত হয়েছে সে সম্পর্কে কমপক্ষে কিছু তথ্য সরবরাহ করে এবং এটি ভিজ্যুয়ালাইজেশনের অনুমতি দেওয়ার চেয়ে অনেক সীমিত উপায়ে এটি করে। ক্ষেত্রের জটিলতা ক্যাপচার না করেও যদি কারও কাছে পাঠ্যপুস্তকের বিষয়বস্তু পৃষ্ঠাগুলির অস্তিত্ব নিয়ে সমস্যা না থাকে তবে আমি দেখতে পাচ্ছি না যে ওপি যেমন প্রত্যাশা করছে তার মতো ভিজ্যুয়ালাইজেশনে কেন আপত্তি করবে।
এমকেটি - মনিকা পুনরায় স্থাপন করুন

4
পাঠ্যপুস্তকগুলি শ্রেণিবদ্ধভাবে কাঠামোগত হয় না, সেগুলি রৈখিকভাবে কাঠামোগত হয়। বইয়ের পরে, প্রাথমিক অধ্যায়গুলির মধ্যে লিঙ্কগুলি প্রায়শই বিকাশ করা হয় যা দেখায় যে পূর্বে পৃথকভাবে প্রবর্তিত বিষয়গুলি আসলে লিঙ্কযুক্ত। উদাহরণস্বরূপ, পূর্বাভাসের জন্য আমার নিজস্ব পাঠ্যপুস্তিকা যেখানে আমরা পরবর্তী অধ্যায়ে গতিশীল রিগ্রেশন মডেলগুলি প্রবর্তন করি, পূর্বে প্রবর্তিত রিগ্রেশন এবং আরিমা মডেলগুলিকে সংযুক্ত করে।
রব হ্যান্ডম্যান

29

রব হ্যান্ডম্যানের উত্তরের এটি একটি সামান্য পাল্টা পয়েন্ট। এটি একটি মন্তব্য হিসাবে শুরু হয়েছিল এবং তারপরে একটির পক্ষে খুব জটিল হয়ে ওঠে। এটি যদি মূল প্রশ্নের সমাধান করা থেকে দূরে থাকে তবে আমি ক্ষমা চাই এবং এটি মুছে ফেলব।


জীববিজ্ঞান ডারউইনের প্রথম ডুডলের অনেক আগে থেকেই শ্রেণিবদ্ধ সম্পর্ককে চিত্রিত করে আসছে (একটি লিঙ্কের জন্য নিক কক্সের মন্তব্য দেখুন)। বেশিরভাগ বিবর্তনীয় সম্পর্ক এখনও এই ধরণের সুন্দর, পরিষ্কার, শাখা-প্রশাখা 'ফাইলোজেনেটিক ট্রি' দিয়ে দেখানো হয়:

এখানে চিত্র বর্ণনা লিখুন যাইহোক, আমরা শেষ পর্যন্ত উপলব্ধি করেছিলাম যে এর চেয়ে জীববিজ্ঞান আরও মেসেজযুক্ত। মাঝে মাঝে গাছের এক অংশে 'লাফানো' গাছের এক অংশে উপস্থিত স্বতন্ত্র প্রজাতি এবং জিনের মধ্যে জিনগত আদান প্রদান হয় (আন্তঃজাতি এবং অন্যান্য প্রক্রিয়াগুলির মাধ্যমে)। অনুভূমিক জিন স্থানান্তর জিনকে এমনভাবে ঘুরিয়ে দেয় যা সাধারণ গাছের চিত্রাকে ভুলের উপরে তোলে। তবে, আমরা গাছগুলি ত্যাগ করি নি, তবে কেবল এই ধরণের ভিজ্যুয়ালাইজেশনের পরিবর্তন সাধিত করেছি:

পূর্ববর্তী চিত্র হিসাবে একই, তবে শাখা জুড়ে জিন স্থানান্তর সহ

এটি অনুসরণ করা শক্ত, তবে এটি বাস্তবের আরও সঠিক চিত্র প্রকাশ করে con

আরেকটি উদাহরণ:

এখানে চিত্র বর্ণনা লিখুন

যাইহোক, আমরা আরম্ভ করার জন্য এই আরও জটিল পরিসংখ্যানকে কখনই প্রবর্তন করি না, কারণ তারা প্রাথমিক ধারণাটি না বুঝে বুঝতে পারা শক্ত। পরিবর্তে, আমরা সাধারণ চিত্রটি দিয়ে প্রাথমিক ধারণাটি শিখি এবং তারপরে এগুলি আরও জটিল চিত্র এবং গল্পে আরও নতুন জটিলতার সাথে উপস্থাপন করি।

পরিসংখ্যানগুলির যে কোনও 'মানচিত্র' একইভাবে ভুল এবং মূল্যবান শিক্ষণীয় সরঞ্জাম উভয়ই হইবে। ওপি প্রস্তাবিত ফর্মটির ভিজ্যুয়ালাইজেশন শিক্ষার্থীদের জন্য খুব দরকারী এবং কেবল এগুলি মোটে বাস্তবতা অর্জন করতে ব্যর্থ হওয়ার কারণে এড়ানো উচিত নয়। ছবিটির স্থলভাগের কাঠামো তৈরি হয়ে গেলে আমরা আরও জটিলতা যুক্ত করতে পারি।


4
এফডাব্লুআইডাব্লু, জীবের মধ্যে সম্পর্কের গাছের উপস্থাপনা ডারউইনের দীর্ঘকাল ধরে রয়েছে। আমি পরে একটি রেফারেন্স যুক্ত করব।
নিক কক্স

2
jhupbooks.press.jhu.edu/title/tree-- জীবন পণ্ডিত এখনও আবেদনময়ী।
নিক কক্স

3
সমর্থনকারী যুক্তির চেয়ে পাল্টা পয়েন্ট নয়: গাছগুলির বৈধতা নিয়ে প্রশ্ন calling কমপক্ষে, ফাইলোজিনি সহ, আমরা এই জাতীয় কাঠামো তৈরি করতে ডেটা ব্যবহার করি , এটি জীবাশ্ম রেকর্ড, জিনের প্রকাশ, যে কোনও কিছু হোক। ডেটা ব্যতীত, আমরা গুরুত্ব সহকারে জিজ্ঞাসা করি যে ভুল তথ্য ছড়িয়ে দেয় এমন ব্লক এবং তীরগুলি বেছে নেওয়ার ক্ষমতা
কার কাছে রয়েছে

2
@ অ্যাডামো আমি একক সার্বজনীন পরিসংখ্যান 'মানচিত্রের' উপস্থিতি আশা করি না। দুটি ব্যক্তির পক্ষে বিভিন্ন কাঠামো এবং বিভিন্ন সংযোগের বিভিন্ন সেট ব্যবহার করা একেবারে যুক্তিযুক্ত, যদিও বিস্তৃত কাঠামোটি যথাযথভাবে শক্তিশালী হওয়ার প্রত্যাশা করে (একই ডেটাসেট থেকে নির্মিত ফাইলেজেনেটিক গাছগুলির মধ্যে নিম্ন স্তরের পার্থক্যও দেখা দেয়, যদিও এই সময়ে আমরা রূপকটি খুব দূরে প্রসারিত করা)। আমি বলব যে বিশেষজ্ঞরা (মুহুর্তের জন্য কর্তৃত্বের ধারণাগুলি আলাদা করে রাখা) এমন অনেক লোকের মধ্যে বিদ্যমান যারা সাধারণ পরিসংখ্যানের পাঠ্যপুস্তক লিখেছেন বা এমনকি সাধারণ পরিসংখ্যানও শিখিয়েছেন।
এমকেটি - মনিকা পুনরায় ইনস্টল করুন :

2
আমি এখানে ডায়াগ্রামগুলি এটির পক্ষে যথেষ্ট বলেছি, তবে এটি আসলে প্রশ্নের উত্তর দেয় না।
নিক কক্স

24

আপনি ক্রস ভ্যালিডেটেড ওয়েবসাইটের কীওয়ার্ড / ট্যাগগুলিতে সন্ধান করতে পারেন ।


একটি নেটওয়ার্ক হিসাবে শাখা

এটি করার একটি উপায় হ'ল কীওয়ার্ডগুলির মধ্যে সম্পর্কের ভিত্তিতে একটি নেটওয়ার্ক হিসাবে এটির পরিকল্পনা করা (তারা প্রায়শই একই পোস্টে মিলিত হয়)।

আপনি যখন এই স্কেল-স্ক্রিপ্টটি ব্যবহার করেন সাইট থেকে ডেটা পাওয়ার জন্য (data.stackexchange.com/stats/query/edit/1122036)

select Tags from Posts where PostTypeId = 1 and Score >2

তারপরে আপনি 2 বা ততোধিক স্কোর সহ সমস্ত প্রশ্নের জন্য কীওয়ার্ডগুলির একটি তালিকা পাবেন।

আপনি নীচের মতো কিছু ষড়যন্ত্র করে সেই তালিকাটি অন্বেষণ করতে পারেন:

ট্যাগ মধ্যে সম্পর্ক

আপডেট: রঙের সাথে একই (সম্পর্কের ম্যাট্রিক্সের ইগেনভেেক্টরগুলির উপর ভিত্তি করে) এবং স্ব-অধ্যয়ন ট্যাগ ছাড়াই

ট্যাগ মধ্যে সম্পর্ক

আপনি এই গ্রাফটি আরও কিছুটা পরিষ্কার করতে পারেন (উদাহরণস্বরূপ, উপরের গ্রাফটিতে এটি 'আর' ট্যাগের জন্য সম্পন্ন হয়েছে এমন সফ্টওয়্যার ট্যাগগুলির মতো পরিসংখ্যানগত ধারণার সাথে সম্পর্কিত নয় এমন ট্যাগগুলি নিয়ে যান) এবং ভিজ্যুয়াল উপস্থাপনাটি উন্নত করতে পারেন তবে আমার ধারণা উপরের এই চিত্রটি ইতিমধ্যে একটি দুর্দান্ত সূচনা পয়েন্ট দেখায়।

আর-কোড:

#the sql-script saved like an sql file
network <- read.csv("~/../Desktop/network.csv", stringsAsFactors = 0)
#it looks like this:
> network[1][1:5,]
 [1] "<r><biostatistics><bioinformatics>"                                 
 [2] "<hypothesis-testing><nonlinear-regression><regression-coefficients>"
 [3] "<aic>"                                                              
 [4] "<regression><nonparametric><kernel-smoothing>"                      
 [5] "<r><regression><experiment-design><simulation><random-generation>"  

l <- length(network[,1])
nk <- 1
keywords <- c("<r>")
M <- matrix(0,1)

for (j in 1:l) {                              # loop all lines in the text file
  s <- stringr::str_match_all(network[j,],"<.*?>")           # extract keywords
  m <- c(0)                                             
  for (is in s[[1]]) {
    if (sum(keywords == is) == 0) {           # check if there is a new keyword
      keywords <- c(keywords,is)              # add to the keywords table
      nk<-nk+1
      M <- cbind(M,rep(0,nk-1))               # expand the relation matrix with zero's
      M <- rbind(M,rep(0,nk))
    }
    m <- c(m, which(keywords == is))
    lm <- length(m)
    if (lm>2) {                               # for keywords >2 add +1 to the relations
      for (mi in m[-c(1,lm)]) {
        M[mi,m[lm]] <- M[mi,m[lm]]+1
        M[m[lm],mi] <- M[m[lm],mi]+1
      }
    }
  }
}


#getting rid of <  >
skeywords <- sub(c("<"),"",keywords)
skeywords <- sub(c(">"),"",skeywords) 


# plotting connections 

library(igraph)
library("visNetwork")

# reduces nodes and edges
Ms<-M[-1,-1]             # -1,-1 elliminates the 'r' tag which offsets the graph
Ms[which(Ms<50)] <- 0
ww <- colSums(Ms)
el <- which(ww==0)

# convert to data object for VisNetwork function
g <- graph.adjacency(Ms[-el,-el], weighted=TRUE, mode = "undirected")
data <- toVisNetworkData(g)

# adjust some plotting parameters some 
data$nodes['label'] <- skeywords[-1][-el]
data$nodes['title'] <- skeywords[-1][-el]
data$nodes['value'] <- colSums(Ms)[-el]
data$edges['width'] <- sqrt(data$edges['weight'])*1
data$nodes['font.size'] <- 20+log(ww[-el])*6
data$edges['color'] <- "#eeeeff"

#plot
visNetwork(nodes = data$nodes, edges = data$edges) %>%
visPhysics(solver = "forceAtlas2Based", stabilization = TRUE,
           forceAtlas2Based = list(nodeDistance=70, springConstant = 0.04,
                                   springLength = 50,
                                   avoidOverlap =1)
           )

শ্রেণিবদ্ধ শাখা

আমি বিশ্বাস করি যে এই ধরণের নেটওয়ার্ক গ্রাফগুলি উপরের খাঁটি শাখাগত শ্রেণিবদ্ধ কাঠামো সম্পর্কিত কিছু সমালোচনার সাথে সম্পর্কিত। আপনি যদি পছন্দ করেন তবে আমি অনুমান করি যে আপনি এটিকে শ্রেণিবদ্ধ কাঠামোতে বাধ্য করার জন্য একটি শ্রেণিবিন্যাস-ক্লাস্টারিং করতে পারেন।

নীচে যেমন শ্রেণিবদ্ধ মডেলের উদাহরণ দেওয়া আছে। বিভিন্ন ক্লাস্টারের জন্য এখনও একটির জন্য সঠিক গ্রুপের নাম সন্ধান করা প্রয়োজন (তবে, আমি মনে করি না যে এই শ্রেণিবদ্ধ ক্লাস্টারিংটি ভাল দিক, সুতরাং আমি এটি উন্মুক্ত রেখেছি)।

শ্রেণিবদ্ধ ক্লাস্টারিং

ক্লাস্টারিংয়ের জন্য দূরত্বের পরিমাপটি পরীক্ষা এবং ত্রুটির দ্বারা পাওয়া গেছে (ক্লাস্টারগুলি সুন্দর না হওয়া পর্যন্ত সামঞ্জস্য করা।

#####
#####  cluster

library(cluster)

Ms<-M[-1,-1]
Ms[which(Ms<50)] <- 0
ww <- colSums(Ms)
el <- which(ww==0)

Ms<-M[-1,-1]
R <- (keycount[-1]^-1) %*% t(keycount[-1]^-1)
Ms <- log(Ms*R+0.00000001)

Mc <- Ms[-el,-el]
colnames(Mc) <- skeywords[-1][-el]

cmod <- agnes(-Mc, diss = TRUE)

plot(as.hclust(cmod), cex = 0.65, hang=-1, xlab = "", ylab ="")

লিখেছেন স্ট্যাকএক্সচেঞ্জ স্ট্রাইক


2
গ্রাফগুলি আরও ঝরঝরে করে তুলতে আমি কিছু কাজ করব। এই ওয়েবসাইটটিতে বিষয়গুলি ম্যাপ করার জন্য কিছু স্পষ্ট গ্রাফ পাওয়া ভাল লাগবে।
সেক্সটাস এম্পেরিকাস

1
এটি একটি দুর্দান্ত পদ্ধতির! সুন্দরভাবে সম্পন্ন.
অ্যান্ড্রু ব্রাজা

আপনার রঙিন গ্রাফ থেকে, তিনটি বড় ক্ষেত্র হ'ল সম্ভাবনা, রিগ্রেশন এবং মেশিন লার্নিং।
ম্যাট এফ।

@MattF। গ্রাফটি আসলে কিছুটা সমস্যাযুক্ত এবং ব্যবহারের ফ্রিকোয়েন্সিটির সাথে আরও মিলিয়ে যায়। আমি ফ্রিকোয়েন্সি দ্বারা ম্যাট্রিক্সকে স্কেল করার চেষ্টা করেছি (যেমন কোভারিয়েন্স ম্যাট্রিক্স থেকে পরস্পর সম্পর্ক ম্যাট্রিক্সে স্যুইচ করা), তবে এটি খুব বেশি পরিবর্তন হয়নি। 2 ডি গ্রাফটি কাঠামোটি খুব সুন্দরভাবে প্রদর্শন করে না এবং শারীরিক মডেল, যা পাথগুলিকে স্ট্রিং হিসাবে বিবেচনা করে, নোডগুলি একটি ষড়্ভুজ / ত্রিভুজাকার আকারে রাখে (যা সবচেয়ে কার্যকর)।
সেক্সটাস এম্পেরিকাস

1
আমি বলব স্ট্যাকওভারফ্লোতে এটি পাঁচটি প্রধান বিভাগ: সম্ভাবনা, রিগ্রেশন, মেশিন লার্নিং, তবে হাইপোথিসিস টেস্টিং এবং টাইম-সিরিজ।
সেক্সটাস এম্পেরিকাস

9

আপনার প্রশ্নের উত্তর দেওয়ার সহজ উপায় হ'ল সাধারণ শ্রেণিবদ্ধকরণ সারণীগুলি সন্ধান করা। উদাহরণস্বরূপ, ২০১০ গণিতের বিষয় শ্রেণীবদ্ধকরণ কাগজগুলির শ্রেণিবদ্ধকরণের জন্য কিছু প্রকাশনা ব্যবহার করে। এগুলি প্রাসঙ্গিক কারণ এ কারণেই অনেক লেখক তাদের নিজস্ব কাগজপত্রকে শ্রেণিবদ্ধ করেন। এখানে চিত্র বর্ণনা লিখুন

অনুরূপ শ্রেণিবিন্যাসের অনেকগুলি উদাহরণ রয়েছে, উদাহরণস্বরূপ আর্কসিভের শ্রেণিবদ্ধকরণ বা রাশিয়ান শিক্ষা মন্ত্রকের ইউডিকে (সর্বজনীন দশমিক শ্রেণিবদ্ধ) যা সমস্ত প্রকাশনা এবং গবেষণার জন্য ব্যাপকভাবে ব্যবহৃত হয়।

এখানে চিত্র বর্ণনা লিখুন

আর একটি উদাহরণ আমেরিকান অর্থনৈতিক অ্যাসোসিয়েশনের জেএল ক্ল্যাসিফিকেশন সিস্টেম । রব হ্যান্ডম্যানের কাগজ " স্বয়ংক্রিয় সময় সিরিজের পূর্বাভাস: আর এর জন্য পূর্বাভাস প্যাকেজ " " এটি জেএল অনুযায়ী সি 53, সি 22, সি 52 হিসাবে শ্রেণিবদ্ধ করা হয়েছে। হাইডম্যান গাছের শ্রেণিবিন্যাসের সমালোচনা করার ক্ষেত্রে একটি বিষয় রয়েছে। আরও ভাল পদ্ধতির ট্যাগিং হতে পারে, উদাহরণস্বরূপ তাঁর গবেষণাপত্রের মূলশব্দগুলি হ'ল: "এআরআইএমএ মডেল, স্বয়ংক্রিয় পূর্বাভাস, এক্সফোনেনশিয়াল স্মুথিং, প্রেডিকেশন ইন্টারভেলস, স্টেট স্পেস মডেলস, টাইম সিরিজ, আর।" কেউ যুক্তি দিতে পারেন যে এগুলি কাগজগুলি শ্রেণিবদ্ধ করার সর্বোত্তম উপায়, কারণ এগুলি শ্রেণিবদ্ধ নয় এবং একাধিক স্তরক্রমও তৈরি করা যেতে পারে।

@ হুবার একটি ভাল বক্তব্য রেখেছিল যে মেশিন লার্নিংয়ের মতো কয়েকটি সাম্প্রতিক অগ্রগতি বর্তমান শ্রেণিবিন্যাসের পরিসংখ্যানের অধীনে থাকবে না। উদাহরণস্বরূপ, ক্যাথরিন এফ। হিগাম, ডেসমন্ড জে হিহামের " ডিপ লার্নিং: এন্টারড্রাকশন ফর অ্যাপ্লাইড ম্যাথেমেটিকিয়ানস " পত্রিকায় একবার দেখুন । তারা তাদের কাগজটি উল্লিখিত এমএসসির আওতায় 97R40, 68T01, 65K10, 62M45 হিসাবে শ্রেণিবদ্ধ করেছে। এগুলি পরিসংখ্যান ছাড়াও কম্পিউটার বিজ্ঞান, গণিত শিক্ষা এবং সংখ্যা বিশ্লেষণের অধীনে


3
আমি মনে করি এটি বলা আরও সঠিক হবে যেভাবে অনেক লেখককে তাদের কাগজপত্র শ্রেণিবদ্ধ করতে বলা হয়। আমি জানি আমার কাজের ক্ষেত্রে এ জাতীয় অগ্রাধিকার বিভাগগুলিতে নিয়োগ করার কথা বললে আমি কখনই যথেষ্ট সন্তুষ্ট নই ।
অ্যালেক্সিস

6
এটি গাণিতিক পরিসংখ্যানগুলির শাখা সনাক্ত করার জন্য একটি ভাল ভিত্তি এটি জানা আমাদের কী বাদ পড়েছে তা সনাক্ত করতে সহায়তা করে, যার মধ্যে মেশিন লার্নিংয়ের অনেকগুলি অংশ রয়েছে। প্রকৃতপক্ষে, "১৯৫০ সালের পরিসংখ্যান" বর্ণনা করে 2010 গণিতের বিষয়শ্রেণীতে শ্রেণিবদ্ধ হওয়া এবং তারপরে উত্থিত সমস্ত কিছু যেমন ভূ-তাত্ত্বিকতা, জিনোমিক্স, বুটস্ট্র্যাপিং ইত্যাদিতে নিক্ষেপ করা ন্যায়সঙ্গত হতে পারে (যার মধ্যে কিছুগুলি সেই পুরানোগুলির অধীনে পড়তে পারে) বিভাগগুলি, সম্ভবত)।
whuber

4

সমস্যার কাছে যাওয়ার একটি উপায় হ'ল পরিসংখ্যান জার্নালে প্রশংসাপত্র এবং সহ-লেখক নেটওয়ার্কগুলির দিকে নজর দেওয়া, যেমন পরিসংখ্যানগুলির অ্যানালালস, বায়োমেট্রিকা, জাসা এবং জেআরএসএস-বি। এটি দ্বারা করা হয়েছিল:

জি, পি।, এবং জিন, জে (2016)) পরিসংখ্যানবিদদের জন্য সহশক্তি ও উদ্ধৃতি নেটওয়ার্ক। ফলিত পরিসংখ্যানগুলির অ্যানালস, 10 (4), 1779-1812।

তারা পরিসংখ্যানবিদদের সম্প্রদায়গুলি চিহ্নিত করেছে এবং সম্প্রদায়গুলিকে লেবেল হিসাবে তাদের ডোমেন বোঝাপড়াটি ব্যবহার করেছে:

  • উচ্চ মাত্রিক তথ্য বিশ্লেষণ (এইচডিডিএ-কোউ-এ)
  • তাত্ত্বিক মেশিন লার্নিং
  • মাত্রা হ্রাস
  • জন হপকিন্স
  • সর্দার
  • স্ট্যানফোর্ড
  • কোয়ান্টাইল রিগ্রেশন
  • পরীক্ষামূলক অলঙ্করণ
  • উদ্দেশ্য বায়েস
  • জৈব পরিসংখ্যান
  • উচ্চ-মাত্রিক তথ্য বিশ্লেষণ (এইচডিডিএ-কোউ-বি)
  • বৃহত্তর স্কেল একাধিক পরীক্ষা
  • পরিবর্তনশীল নির্বাচন
  • স্থানিক এবং আধা-প্যারামেট্রিক / নন-প্যারাম্যাট্রিক পরিসংখ্যান

এই গবেষণাপত্রে সম্প্রদায়ের একটি বিস্তৃত আলোচনার পাশাপাশি বৃহত্তরদের আরও ক্ষয়িষ্ণুগুলির মধ্যে ক্ষয় করার বিষয়টি অন্তর্ভুক্ত রয়েছে।

এটি পুরোপুরি প্রশ্নের উত্তর দিতে পারে না, কারণ এটি পরিসংখ্যানবিদদের গবেষণার ক্ষেত্রগুলির চেয়ে সমস্ত ক্ষেত্রের চেয়ে গবেষণা করে যা এখন আর সক্রিয় নয় including আশা করি তবুও এটি সহায়ক। অবশ্যই, অন্যান্য সাবধানবাণী রয়েছে (যেমন কেবলমাত্র এই চারটি জার্নাল বিবেচনা করে) যা কাগজে আরও আলোচনা করা হয়েছে।


2
আমি এই ওয়েবসাইটের জন্য এটি করার কথা ভাবছিলাম। "সহ-লেখকতা" সংজ্ঞায়িত করা ব্যক্তি হিসাবে একই প্রশ্নের উত্তর / উত্তর দেয়।
সেক্সটাস এম্পেরিকাস


2

আমি অনেক আশ্চর্যজনক উত্তর দেখতে পাচ্ছি, এবং আমি জানি না কীভাবে একটি নম্র স্ব-নির্মিত শ্রেণিবদ্ধতা পাওয়া যেতে পারে, তবে সংক্ষিপ্তসারটি দেখানোর জন্য আমি সমস্ত পরিসংখ্যানের কোনও সর্ব-প্রশংসিত বই জানি না এবং আমি মনে করি @ এমকেটি তীব্রভাবে মন্তব্য করেছে, একটি অধ্যয়নের ক্ষেত্রের শ্রেণিবিন্যাস কার্যকর হতে পারে। তো, আমার শটটি এখানে:

  • বর্ণনামূলক পরিসংখ্যান
    • সাধারণ অনুমান
      • সাধারণ অনুমান পরীক্ষা
    • প্লট / ডেটা ভিজ্যুয়ালাইজেশন
  • নমুনা নকশা
    • পরীক্ষামূলক অলঙ্করণ
    • জরিপ নকশা
  • বহুসংখ্যক পরিসংখ্যান (নিরীক্ষণ)
    • থলোথলো
    • উপাদান বিশ্লেষণ
    • সুপ্ত ভেরিয়েবল মডেল
  • রৈখিক মডেল (যা আসলে পাশাপাশি বহুবিচিত্র হয়)
    • সাধারণ লিস্ট স্কোয়ার
    • সাধারণ রৈখিক মডেল
      • লগিট মডেল
    • অন্যান্য রৈখিক মডেল
      • কক্স মডেল
      • কোয়ান্টাইল রিগ্রেশন
    • মাল্টিভারিয়েট অনুমান
      • একাধিক অনুমান পরীক্ষা
      • সমন্বিত হাইপোথিসিস পরীক্ষা
    • কাঠামোগত তথ্য জন্য মডেল
      • মিশ্র প্রভাব মডেল
      • স্পেসিয়াল মডেল
      • সময় সিরিজ মডেল
    • অ লিনিয়ার এক্সটেনশনগুলি
      • সাধারণীকরণযোগ্য মডেল
  • বায়সিয়ান পরিসংখ্যান (আমি ইতিমধ্যে তালিকাভুক্ত অনেক কিছুর জন্য বেইসিয়ান পদ্ধতি বিদ্যমান)
  • অ প্যারাম্যাট্রিক রেগ্রেশন এবং শ্রেণিবিন্যাস
    • অনেক মেশিন শেখার পদ্ধতি এখানে ফিট করে fit

অবশ্যই এটি অতি-সরলবাদী, এটি কেবল এমন কাউকেই কিছু ধারণা পাওয়ার জন্য যা এই ক্ষেত্রটি সবেই জানে, আমাদের প্রত্যেকে অবশ্যই নিশ্চিতভাবে জানতে পারে যে এখানে বিভাগগুলির মধ্যে অনেকগুলি পদ্ধতি রয়েছে, আমি অনেকেই করি নি ' t তালিকা কারণ তারা কম বিখ্যাত বা আমি সহজেই ভুলে গেছি। আশা করি এটা আপনার ভালো লেগেছে.


1

এই তথ্যটি সংগঠিত করার একটি উপায় হ'ল একটি ভাল বই খুঁজে পাওয়া এবং বিষয়বস্তুর সারণীতে সন্ধান করা। এটি একটি বিপরীতমুখী কারণ আপনি বিশেষভাবে পরিসংখ্যান সম্পর্কে জিজ্ঞাসা করেছিলেন , তবে বেশিরভাগ বিষয়ের উপর প্রাথমিক গ্র্যাজুয়েট স্তরের পাঠ্যগুলি পরিসংখ্যান এবং সম্ভাবনা তত্ত্বের জন্য একসাথে। আমি যে বইটিতে রিগ্রেশন নিয়ে পড়ছি তার এখন নিম্নলিখিত টিওসি রয়েছে:

  • ঘনঘটিত অনুমিতি ference
  • বায়েশিয়ান অনুমান
  • হাইপোথিসিস টেস্টিং এবং ভেরিয়েবল সিলেকশন
  • লিনিয়ার মডেল
  • জেনারেল রিগ্রেশন মডেল
  • বাইনারি ডেটা মডেল

  • জেনারেল রিগ্রেশন মডেল

  • ননপ্যারামেট্রিক রিগ্রেশন [প্রাথমিকের ...]
  • স্প্লাইন এবং কার্নেল পদ্ধতি
  • একাধিক ভবিষ্যদ্বাণীযুক্ত ননপ্যারামেট্রিক রিগ্রেশন

(বাকি বিভাগগুলি গণিত এবং সম্ভাব্য তত্ত্বকে সমর্থন করছে)

  • ম্যাট্রিক্স এক্সপ্রেশনগুলির পার্থক্য
  • ম্যাট্রিক্স ফলাফল
  • কিছু লিনিয়ার বীজগণিত
  • সম্ভাব্য বন্টন এবং উত্পাদনের কার্যাদি
  • সাধারণ র্যান্ডম ভেরিয়েবলের কাজগুলি
  • শাস্ত্রীয় পরিসংখ্যান থেকে কিছু ফলাফল
  • বেসিক বৃহত নমুনা তত্ত্ব

2
এক বহন করা যেমন একটি বই বিবেচনা করতে পারেন একটি অংশ এর এক শাখা একটি শৃঙ্খলা। যদিও এটি সমস্ত পরিসংখ্যানের একটি এনসাইক্লোপেডিক জরিপ হওয়ার পরিকল্পনা করে না, যদিও এর অধ্যায় শিরোনামগুলি খুব কমই ক্ষেত্রের প্রধান শাখা হিসাবে বিবেচনা করা যেতে পারে!
whuber

3
@ শুভ রাজি। বইটি রিগ্রেশন সম্পর্কিত ছিল তা উল্লেখ করার জন্য আমি যত্নবান ছিলাম এবং "পরিসংখ্যান" বিষয়ক কোনও বই আমি সাধারণ পর্যাপ্ত বলে মনে করি না বা কোনও পরিসংখ্যানবিদকে উপযুক্ত পর্যায়ে পর্যাপ্ত বলে বিবেচনা করার জন্য উপযুক্ত পর্যায়ে বিবেচনা করি না। এই সুনির্দিষ্ট উদাহরণটি ওয়েকফিল্ডের পাঠ্য থেকে পাওয়া এবং একটি উল্লেখযোগ্য সাধারণ চিকিত্সা (উদাহরণস্বরূপ, বাইনারি কোভারিয়েট এবং দৃust় ত্রুটি অনুমানের সাথে লিনিয়ার রিগ্রেশন সম্পর্কিত প্রসঙ্গে অসম বৈকল্পিক অনুমানের সাথে টি-টেস্ট আলোচনা করা হয়)।
আদম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.