ডেটা নির্বাচন করুন / বরাদ্দ করুন। যখন ভেরিয়েবলের নাম একটি অক্ষর ভেক্টরে সংরক্ষণ করা হয় তখন সারণি

Question 1

data.tableযদি ভেরিয়েবলের নাম একটি অক্ষর ভেক্টরে সংরক্ষণ করা হয় তবে আপনি কীভাবে ভেরিয়েবলগুলি উল্লেখ করবেন ? উদাহরণস্বরূপ, এটি একটির জন্য কাজ করে data.frame:

df <- data.frame(col1 = 1:3)
colname <- "col1"
df[colname] <- 4:6
df
#   col1
# 1    4
# 2    5
# 3    6

চিহ্নিতকরণ সহ বা ছাড়াই আমি কীভাবে এই একই অপারেশনটি ডেটা টেবিলের জন্য সম্পাদন করতে পারি :=? এর সুস্পষ্ট জিনিসটি dt[ , list(colname)]কাজ করে না (বা আমি এটি আশাও করিনি)।

Question 2

প্রোগ্রাম্যালি ভেরিয়েবল (গুলি) নির্বাচন করার দুটি উপায় :

with = FALSE:

 DT = data.table(col1 = 1:3)
 colname = "col1"
 DT[, colname, with = FALSE] 
 #    col1
 # 1:    1
 # 2:    2
 # 3:    3

'ডট ডট' ( ..) উপসর্গ:

 DT[, ..colname]    
 #    col1
 # 1:    1
 # 2:    2
 # 3:    3

'ডট ডট' ( ..) স্বরলিপিটির আরও বিবরণের জন্য , 1.10.2 এ নতুন বৈশিষ্ট্যগুলি দেখুন (এটি বর্তমানে সহায়তা পাঠ্যে বর্ণিত নয়)।

করার দায়িত্ব অর্পণ পরিবর্তনশীল (গুলি), এর LHS মোড়ানো :=বন্ধনীর মধ্যে:

DT[, (colname) := 4:6]    
#    col1
# 1:    4
# 2:    5
# 3:    6

পরেরটি একটি কলাম চূড়া হিসাবে পরিচিত , কারণ আপনি রেফারেন্স দ্বারা পুরো কলাম ভেক্টর প্রতিস্থাপন। যদি কোনও উপসেট iউপস্থিত থাকে, তবে এটি রেফারেন্স সহ সাবসাইন করবে। ডান বন্ধনী কাছাকাছি (colname)একটি সাঁটে লেখার Cran অক্টোবর সংস্করণটি v1.9.4 চালু হয় 2014. এখানে সংবাদ আইটেম :

ব্যবহার with = FALSEসঙ্গে :=এখন সব ক্ষেত্রে নিন্দা করা হয়েছে, দেওয়া যে LHS মোড়কে :=বন্ধনী সহ কিছু সময়ের জন্য পছন্দসই হয়েছে।

colVar = "col1"

DT[, (colVar) := 1]                             # please change to this
DT[, c("col1", "col2") := 1]                    # no change
DT[, 2:4 := 1]                                  # no change
DT[, c("col1","col2") := list(sum(a), mean(b))]  # no change
DT[, `:=`(...), by = ...]                       # no change

বিস্তারিত বিভাগেও দেখুন ?`:=`:

DT[i, (colnamevector) := value]
# [...] The parens are enough to stop the LHS being a symbol

এবং মন্তব্যে আরও প্রশ্নের উত্তর দেওয়ার জন্য, এখানে একটি উপায় (যথারীতি অনেকগুলি উপায় রয়েছে):

DT[, colname := cumsum(get(colname)), with = FALSE]
#    col1
# 1:    4
# 2:    9
# 3:   15

বা, আপনি সহজে পড়তে পারে, লিখুন এবং শুধু ডিবাগ evalএকটি paste, একটি গতিশীল SQL বক্তব্য নির্মাণের একটি সার্ভারে পাঠাতে অনুরূপ:

expr = paste0("DT[,",colname,":=cumsum(",colname,")]")
expr
# [1] "DT[,col1:=cumsum(col1)]"

eval(parse(text=expr))
#    col1
# 1:    4
# 2:   13
# 3:   28

যদি আপনি এটি অনেক কিছু করেন তবে আপনি কোনও সহায়ক ফাংশন সংজ্ঞায়িত করতে পারেন EVAL:

EVAL = function(...)eval(parse(text=paste0(...)),envir=parent.frame(2))

EVAL("DT[,",colname,":=cumsum(",colname,")]")
#    col1
# 1:    4
# 2:   17
# 3:   45

এখন যে data.table1.8.2 স্বয়ংক্রিয়ভাবে jদক্ষতার জন্য অনুকূলিত হয়েছে, এটি evalপদ্ধতিটি ব্যবহার করা ভাল । get()মধ্যে j, কিছু অপ্টিমাইজেশন বাধা দেয় উদাহরণস্বরূপ।

বা, আছে set()। একটি নিম্ন ওভারহেড, এর কার্যকরী ফর্ম :=, যা এখানে ঠিক থাকবে। দেখুন ?set।

set(DT, j = colname, value = cumsum(DT[[colname]]))
DT
#    col1
# 1:    4
# 2:   21
# 3:   66

Question 3

* এটি সত্যই কোনও উত্তর নয়, তবে আমার কাছে মন্তব্য পোস্ট করার মতো স্ট্রিট ক্রেডিট নেই: /

যাইহোক, যে কেউ ভেরিয়েবলের মধ্যে সংরক্ষিত নাম সহ একটি ডেটা টেবিলের মধ্যে একটি নতুন কলাম তৈরি করতে চাইছেন, তাদের জন্য আমার নিম্নলিখিত কাজগুলি করতে হবে। এর পারফরম্যান্স সম্পর্কে আমার কোনও ধারণা নেই। উন্নতির জন্য কোন পরামর্শ? কোনও নামহীন নতুন কলামটি সর্বদা ভি 1 নাম দেওয়া হবে তা ধরে নেওয়া কি নিরাপদ?

colname <- as.name("users")
# Google Analytics query is run with chosen metric and resulting data is assigned to DT
DT2 <- DT[, sum(eval(colname, .SD)), by = country]
setnames(DT2, "V1", as.character(colname))

নোটিশ আমি এটিকে সামান্য পরিমাণে সূক্ষ্মভাবে উল্লেখ করতে পারি () তবে একই ধাপে এটি অর্পণ করার জন্য এটি পেতে পারে বলে মনে হয় না। বিটিডাব্লু, আমার যে কারণটি করা দরকার তা হ'ল কলম নামটি চকচকে অ্যাপ্লিকেশনটিতে ব্যবহারকারীর ইনপুট ভিত্তিক হবে।

Question 4

একাধিক কলাম এবং কলাম মানগুলিতে প্রয়োগ একটি ফাংশন জন্য।

কোনও ফাংশন থেকে মানগুলি আপডেট করার সময়, আরএইচএস অবশ্যই একটি লিস্ট অবজেক্ট হতে হবে, সুতরাং এর .SDসাথে একটি লুপ ব্যবহার করা lapplyকৌশলটি করবে।

নীচের উদাহরণটি সংখ্যার কলামগুলিতে পূর্ণসংখ্যা কলামগুলিকে রূপান্তর করে

a1 <- data.table(a=1:5, b=6:10, c1=letters[1:5])
sapply(a1, class)  # show classes of columns
#         a           b          c1 
# "integer"   "integer" "character" 

# column name character vector
nm <- c("a", "b")

# Convert columns a and b to numeric type
a1[, j = (nm) := lapply(.SD, as.numeric ), .SDcols = nm ]

sapply(a1, class)
#         a           b          c1 
# "numeric"   "numeric" "character"

Question 5

ভেরিয়েবল বা ফাংশনের মাধ্যমে ডেটা থেকে একাধিক কলাম পুনরুদ্ধার করুন: টেবিল:

library(data.table)

x <- data.table(this=1:2,that=1:2,whatever=1:2)

# === explicit call
x[, .(that, whatever)]
x[, c('that', 'whatever')]

# === indirect via  variable
# ... direct assignment
mycols <- c('that','whatever')
# ... same as result of a function call
mycols <- grep('a', colnames(x), value=TRUE)

x[, ..mycols]
x[, .SD, .SDcols=mycols]

# === direct 1-liner usage
x[, .SD, .SDcols=c('that','whatever')]
x[, .SD, .SDcols=grep('a', colnames(x), value=TRUE)]

যা সব ফলন

   that whatever
1:    1        1
2:    2        2

আমি .SDcolsসবচেয়ে মার্জিত উপায় খুঁজে ।

Question 6

আপনি এটি চেষ্টা করতে পারে

কলাম <- as.name ("COL_NAME")

ডিটি 2 <- ডিটি [, তালিকা (COL_SUM = যোগফল (ইওওয়াল (কল্পনা, .এসডি))), = গ (গ্রুপ)] দ্বারা