আইসোমেট্রিক লগ-অনুপাতের রূপান্তর কীভাবে সম্পাদন করবেন


18

আমার কাছে চলাচলমূলক আচরণের সময়গুলি (ঘুমিয়ে যাওয়া, বেদমী এবং শারীরিক ক্রিয়াকলাপে ব্যয় করা সময়) সম্পর্কিত ডেটা রয়েছে যা প্রায় 24 এর সমান (প্রতিদিন প্রতি ঘন্টা হিসাবে)। আমি একটি পরিবর্তনশীল তৈরি করতে চাই যা এই প্রতিটি আচরণে ব্যয় করা আপেক্ষিক সময়কে ক্যাপচার করে - আমাকে বলা হয়েছে যে একটি আইসোমেট্রিক লগ-রেশিও রূপান্তর এটি সম্পাদন করবে।

দেখে মনে হচ্ছে আমার আর-তে আইল ফাংশনটি ব্যবহার করা উচিত তবে কোড সহ কোনও প্রকৃত উদাহরণ খুঁজে পাচ্ছি না। আমি কোথা থেকে শুরু করব?

আমার যে ভেরিয়েবলগুলি রয়েছে তা হ'ল সময় ঘুমানোর সময়, গড় পালক সময়, গড় গড় হালকা শারীরিক ক্রিয়াকলাপ, গড় মাঝারি শারীরিক ক্রিয়াকলাপ এবং গড় জোরালো শারীরিক ক্রিয়াকলাপ। ঘুম স্ব-প্রতিবেদন করা হয়েছিল, অন্যদিকে অ্যাক্সিলোমিটার ডেটার বৈধ দিনগুলি থেকে গড়। সুতরাং এই ভেরিয়েবলের ক্ষেত্রে কেসগুলি ঠিক 24 এর সমষ্টি হয় না।

আমার অনুমান: আমি এসএএস-এ কাজ করছি, তবে দেখে মনে হচ্ছে আর এই অংশটির জন্য ব্যবহার করা আরও সহজ হবে। সুতরাং প্রথম আগ্রহের ভেরিয়েবলগুলি সহ ডেটা আমদানি করুন। তারপরে অ্যাকম্প () ফাংশনটি ব্যবহার করুন। তারপরে আমি আইআর () ফাংশনের জন্য সিনট্যাক্সটি বের করতে পারি না। কোন সাহায্যের অনেক প্রশংসা হবে।

উত্তর:


21

আইএলআর (আইসোমেট্রিক লগ-অনুপাত) রূপান্তরটি কম্পোজিশনাল ডেটা বিশ্লেষণে ব্যবহৃত হয়। যে কোনও প্রদত্ত পর্যবেক্ষণ হ'ল unityক্যের সমষ্টিগত ধনাত্মক মানের একটি সেট, যেমন মিশ্রণে রাসায়নিকগুলির অনুপাত বা বিভিন্ন কার্যক্রমে ব্যয়িত মোট সময়ের অনুপাত। সম-থেকে-unityক্য আক্রমনকারী সূচিত করে যে প্রতিটি পর্যবেক্ষণে 2 উপাদান থাকতে পারে তবে কেবলমাত্র -1 কার্যত স্বাধীন মান রয়েছে। (জ্যামিতিক, পর্যবেক্ষণ একটি শুয়ে -1 -dimensional সিমপ্লেক্স মধ্যে -dimensional ইউক্লিডিয় স্থান আর। এই সরল প্রকৃতিটি নীচে প্রদর্শিত সিমুলেটেড ডেটার স্ক্যাটারপ্লটগুলির ত্রিভুজাকার আকারগুলিতে প্রকাশিত হয়।)

সাধারণত, লগের রূপান্তরিত হলে উপাদানগুলির বিতরণগুলি "ভাল" হয়ে যায়। এই রূপান্তরটি লগগুলি নেওয়ার আগে তাদের জ্যামিতিক গড় দ্বারা একটি পর্যবেক্ষণে সমস্ত মানকে ভাগ করে নেওয়া যায়। (সমানভাবে, যে কোনও পর্যবেক্ষণে ডেটাগুলির লগগুলি তাদের গড় বিয়োগ করে কেন্দ্রিক হয় This) এটি "কেন্দ্রের লগ-অনুপাত" রূপান্তর বা সিএলআর হিসাবে পরিচিত। ফলস্বরূপ মানগুলি আর একটি হাইপারপ্লেনের মধ্যেই রয়েছে , কারণ স্কেলিংয়ের ফলে লগগুলির যোগফল শূন্য হয়। আইএলআর এই হাইপারপ্লেনের জন্য যে কোনও অরথনরমাল ভিত্তি বেছে নিয়ে গঠিত: প্রতিটি রূপান্তরিত পর্যবেক্ষণের -1 স্থানাঙ্ক তার নতুন ডেটা হয়ে যায় become সমতুল্যভাবে, hyperplane অন্তর্ধান সঙ্গে সমতল সঙ্গে কাকতালীয়ভাবে আবর্তিত (বা প্রতিফলিত) স্থানাঙ্ক এবং এক প্রথম-1 স্থানাঙ্কব্যবহার করে। (কারণ ঘূর্ণন এবং প্রতিচ্ছবি দূরত্ব সংরক্ষণ করে তারাআইসোমেট্রি, যেহেতু এই পদ্ধতির নাম))

তাসগ্রিস, প্রেস্টন এবং উড বলে যে " হেলমার্ট ম্যাট্রিক্স থেকে প্রথম সারিতে সরিয়ে হেলমার্ট সাব-ম্যাট্রিক্স হ'ল [ঘূর্ণন ম্যাট্রিক্স] এইচ এর একটি মানক পছন্দ choice "

অর্ডার এর হেলমার্ট ম্যাট্রিক্স একটি সহজ পদ্ধতিতে নির্মিত হয়েছে (উদাহরণস্বরূপ হার্ভিলির পৃষ্ঠা 86 দেখুন)। এর প্রথম সারিটি সমস্ত 1 টি। পরের সারিটি সবচেয়ে সহজ সরল যা প্রথম সারিতে অর্থোথোনাল তৈরি করা যেতে পারে, যথা (1,-1,0,...,0) । পূর্ববর্তী সমস্ত সারিগুলির মধ্যে সারি সর্বাধিক সরলতমর মধ্যে রয়েছে: এর প্রথম j1 এন্ট্রিগুলি 1 গুলি, যা গ্যারান্টি দেয় যে এটি 2 , 3 , , জে - 1 সারিগুলিতে অরথগোনাল is2,3,...,-1 , এবং তার এন্ট্রি 1 সেট করা হয়1-প্রথম সারির অরথগোনাল করতে - জে(এটির জন্য এন্ট্রিগুলি শূন্যের সমষ্টি হতে হবে)। এরপরে সমস্ত সারি ইউনিট দৈর্ঘ্যে পুনরুদ্ধার করা হয়।

এখানে, নিদর্শনটি চিত্রিত করার জন্য, এর সারিগুলি পুনরুদ্ধার করার আগে হেলমার্ট ম্যাট্রিক্সটি 4×4 :

(1111110011201113).

(আগস্ট আগস্ট 2017 এডিট করুন) এই "বিপরীতে" এর একটি বিশেষ করে সুন্দর দিক (যা সারি সারি পাঠ্য হয়) তাদের ব্যাখ্যাযোগ্যতা। ডেটা উপস্থাপনের জন্য k1 টি সারি রেখে প্রথম সারিটি ফেলে দেওয়া হয়েছে । দ্বিতীয় সারিটি দ্বিতীয় ভেরিয়েবল এবং প্রথমটির মধ্যে পার্থক্যের সমানুপাতিক। তৃতীয় সারিটি তৃতীয় ভেরিয়েবল এবং প্রথম দুটি মধ্যে পার্থক্যের সমানুপাতিক। সাধারণত, সারি j ( 2jk ) ভেরিয়েবল j এবং এর আগে যে সমস্তগুলি, ভেরিয়েবল 1 , 2 , , জে - 1 এর মধ্যে পার্থক্য প্রতিফলিত করে1,2,,j1। এটি সমস্ত বৈপরীত্যের জন্য "বেস" হিসাবে প্রথম পরিবর্তনশীল j=1 ছেড়ে দেয় । প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস (পিসিএ) দ্বারা আইএলআর অনুসরণ করার সময় আমি এই ব্যাখ্যাগুলি সহায়ক বলে খুঁজে পেয়েছি: এটি মূল ভেরিয়েবলগুলির মধ্যে তুলনার ক্ষেত্রে লোডিংগুলিকে কমপক্ষে মোটামুটি ব্যাখ্যা করতে সক্ষম করে। আমি নীচের Rপ্রয়োগের জন্য একটি লাইন প্রবেশ করিয়েছি ilrযা এই ব্যাখ্যাটির সাথে সহায়তা করার জন্য আউটপুট ভেরিয়েবলগুলিকে উপযুক্ত নাম দেয়। (সম্পাদনার সমাপ্তি)

যেহেতু এই জাতীয় ম্যাট্রিক তৈরি করতে Rএকটি ফাংশন সরবরাহ contr.helmertকরে (যদিও স্কেলিং ছাড়াই, এবং সারি এবং কলামগুলি উপেক্ষিত এবং স্থানান্তরিত করা হয়), আপনাকে এটি করার জন্য (সরল) কোডও লিখতে হবে না। এটি ব্যবহার করে, আমি আইএলআর বাস্তবায়ন করেছি (নীচে দেখুন)। এটি অনুশীলন এবং পরীক্ষা করার জন্য, আমি একটি ডিরিচলেট বিতরণ থেকে ( 1000, 1,2,3,4 পরামিতি ) স্বাধীন অঙ্কন তৈরি করেছিলাম এবং তাদের স্ক্র্যাপপ্লট ম্যাট্রিক্সের প্লট করেছি। এখানে, k=4

চিত্র 1

পয়েন্টগুলি নীচের বাম কোণগুলির কাছাকাছি সমস্ত ঝাঁকুনি নির্দেশ করে এবং তাদের চক্রান্ত ক্ষেত্রগুলির ত্রিভুজাকার প্যাচগুলি পূরণ করে, যেমন রচনাগত তথ্যের বৈশিষ্ট্য।

তাদের আইএলআরটিতে মাত্র তিনটি ভেরিয়েবল রয়েছে, আবার স্ক্র্যাটারপ্লোট ম্যাট্রিক্স হিসাবে প্লট করা হয়েছে:

চিত্র ২

এটি প্রকৃতপক্ষে আরও সুন্দর দেখাচ্ছে: স্ক্র্যাটারপ্লটগুলি আরও বেশি বৈশিষ্ট্যযুক্ত "উপবৃত্তাকার মেঘ" আকারগুলি অর্জন করেছে, লিনিয়ার রিগ্রেশন এবং পিসিএ-র মতো দ্বিতীয়-ক্রমের বিশ্লেষণের পক্ষে আরও ভালভাবে উপযুক্ত।

01/2

Figure_3

1/2


এই জেনারালাইজেশন ilrনীচের ফাংশনে প্রয়োগ করা হয় । এই "জেড" ভেরিয়েবলগুলি উত্পাদন করার কমান্ডটি সহজ ছিল

z <- ilr(x, 1/2)

বক্স-কক্স রূপান্তরের একটি সুবিধা হ'ল সত্য জিরোগুলি অন্তর্ভুক্ত পর্যবেক্ষণগুলিতে এটির প্রয়োগযোগ্যতা: প্যারামিটারটি ইতিবাচক হলে এটি এখনও সংজ্ঞায়িত।

তথ্যসূত্র

মিশেল টি.সাগ্রিস, সাইমন প্রেস্টন এবং অ্যান্ড্রু টিএ উড, কাঠামোগত তথ্যের জন্য ডেটা ভিত্তিক পাওয়ার ট্রান্সফর্মেশনআরএক্সিভ: 1106.1451v2 [stat.ME] 16 জুন 2011।

ডেভিড এ। হারভিলে, স্ট্যাটাসিকের দৃষ্টিভঙ্গি থেকে ম্যাট্রিক্স বীজগণিত । স্প্রিঞ্জার সায়েন্স অ্যান্ড বিজনেস মিডিয়া, জুন 27, 2008


Rকোডটি এখানে ।

#
# ILR (Isometric log-ratio) transformation.
# `x` is an `n` by `k` matrix of positive observations with k >= 2.
#
ilr <- function(x, p=0) {
  y <- log(x)
  if (p != 0) y <- (exp(p * y) - 1) / p       # Box-Cox transformation
  y <- y - rowMeans(y, na.rm=TRUE)            # Recentered values
  k <- dim(y)[2]
  H <- contr.helmert(k)                       # Dimensions k by k-1
  H <- t(H) / sqrt((2:k)*(2:k-1))             # Dimensions k-1 by k
  if(!is.null(colnames(x)))                   # (Helps with interpreting output)
    colnames(z) <- paste0(colnames(x)[-1], ".ILR")
  return(y %*% t(H))                          # Rotated/reflected values
}
#
# Specify a Dirichlet(alpha) distribution for testing.
#
alpha <- c(1,2,3,4)
#
# Simulate and plot compositional data.
#
n <- 1000
k <- length(alpha)
x <- matrix(rgamma(n*k, alpha), nrow=n, byrow=TRUE)
x <- x / rowSums(x)
colnames(x) <- paste0("X.", 1:k)
pairs(x, pch=19, col="#00000040", cex=0.6)
#
# Obtain the ILR.
#
y <- ilr(x)
colnames(y) <- paste0("Y.", 1:(k-1))
#
# Plot the ILR.
#
pairs(y, pch=19, col="#00000040", cex=0.6)

1
@ অ্যালেক্স আমি "উত্সাহী" পারস্পরিক সম্পর্ক বলতে কী বোঝাতে চাইছি তা বুঝতে পারছি না। হ্যাঁ, ভেরিয়েবলগুলি অবশ্যই নির্ভরশীল - তবে পিসিএর কাজটি আপনাকে সেই নির্ভরতাগুলি চিহ্নিত করতে এবং তাদের পরিমাণ নির্ধারণ করতে সহায়তা করা। দ্রষ্টব্য, এও যে, সিএলআরগুলির যোগফল স্থির নয় (যদিও সিএলআরগুলি valuesক্যের মানগুলির উপর ভিত্তি করে)।
শুক্র

1
@ অ্যালেক্স কেন শুধু পিসিএ আউটপুট অধ্যয়ন করবেন না? যদি এটি জটিল হয় এবং আপনি মাত্র দুটি ভেরিয়েবলের দিকে মনোনিবেশ করতে চান তবে সেই দুটি ভেরিয়েবলের পিসিএ করুন। এগুলির একটি স্ক্র্যাপপ্লট কোনও প্রান্তরেখার প্রকৃতি এবং ব্যাপ্তি প্রকাশ করবে।
whuber

1
@ অ্যালেক্স শিওর - এজন্য আইএলআর বর্ণনা করার জন্য আমি এই উত্তরে স্ক্রেটারপ্লট ব্যবহার করি!
হোবার

2
@ অ্যালেক্স এটি একটি আকর্ষণীয় উদ্ধৃতি। এটি ইডিএ (অন্যান্য জিনিসের মধ্যে) এর মুখে উড়ে এমন দর্শনের প্রতিফলন ঘটায়, যা প্রস্তাব দেয় যে যখন কেউ কার্যকর বা তথ্যবহুল সম্পর্ক তৈরি করে এমন ভেরিয়েবলগুলির পুনরায় প্রকাশ পেতে পারে, তবে এটি একটি ভাল জিনিস নয়, সমস্যা নয়। ইডিএর প্রবক্তারা (জন টুকির মতো) যুক্তি দেখান যে যে ফর্মটিতে ডেটাটি মূলত প্রকাশ করা হয় সেগুলি অগত্যা যে ফর্মটিতে তাদের বিশ্লেষণ করা উচিত নয়, অন্যদিকে এই উদ্ধৃতিটি স্পষ্টভাবে একেবারে বিপরীতভাবে অনুমান করে। আরও কার্যকর পন্থা কোনটি তা স্থির করতে আমি এটি আপনার কাছে রেখে দেব।
হোবার

1
@ এলি এই মন্তব্যটি সাধারণীকরণ করা সিএলআরকে নির্দেশ করার উদ্দেশ্যে করা হয়েছিল। আমি এই উত্তরের শৃঙ্খলে যেমন লিখেছি, "স্কেলিংয়ের ফলে লগগুলির যোগফল শূন্য হয়।"
হোবার

5

আপনার ব্যবহারের ক্ষেত্রে, সম্ভবত সমস্ত কিছু একে একে স্কেল করা ভাল। সংখ্যাগুলি হুবহু 24-তে যোগ করে না এমন তথ্য ডেটাতে কিছুটা বাড়তি শোরগোল যোগ করবে, তবে বিষয়গুলিকে খুব বেশি গোলমাল করা উচিত নয়।

@ শুভর যেমনটি সঠিকভাবে বলেছে, যেহেতু আমরা অনুপাতগুলি নিয়ে কাজ করছি, আমাদের ভেরিয়েবলগুলির মধ্যে নির্ভরতার জন্য অ্যাকাউন্ট করতে হবে (যেহেতু তারা এক যোগ করে)। ইলার রূপান্তরটি যথাযথভাবে এটির সাথে ডিল করে, যেহেতু এটি ভেরিয়েবলগুলিকে রূপান্তর করেআরডি-1ডি অনুপাতের ।

প্রযুক্তিগত সমস্ত বিবরণ একদিকে রেখে, আইল ট্রান্সফর্মড ডেটা কীভাবে সঠিকভাবে ব্যাখ্যা করতে হয় তা জানা গুরুত্বপূর্ণ। শেষ পর্যন্ত, আইল ট্রান্সফর্মটি কেবলমাত্র গ্রুপের লগ অনুপাতকে বোঝায়। তবে এটি এটি পূর্বনির্ধারিত কিছু শ্রেণিবিন্যাসের সাথে শ্রদ্ধার সাথে সংজ্ঞায়িত করে। আপনি যদি নীচের মত একটি শ্রেণিবিন্যাস সংজ্ঞায়িত করেন

এখানে চিত্র বর্ণনা লিখুন

প্রতিটি রূপান্তরিত ভেরিয়েবল হিসাবে গণনা করা যেতে পারে

আমি=RগুলিR+ +গুলিLn(আরআমি)(এসআমি)

আমিআরআমি এর সাথে সম্পর্কিত ভেরিয়েবলের একটি পার্টিশন নির্ধারণ করে আমি, এসআমি এর সাথে সম্পর্কিত ভেরিয়েবলের অন্যান্য বিভাজনকে সংজ্ঞায়িত করে আমি এবং ()জ্যামিতিক গড় বোঝায়। এই রূপান্তরিত ভেরিয়েবলগুলি ব্যালেন্স হিসাবেও পরিচিত।

সুতরাং পরের প্রশ্নটি হল, আপনি কীভাবে আপনার ভেরিয়েবলের শ্রেণিবিন্যাসকে সংজ্ঞায়িত করবেন? এটি সত্যিই আপনার উপর নির্ভর করে তবে আপনার যদি তিনটি ভেরিয়েবল থাকে তবে গণ্ডগোলের জন্য খুব বেশি সংমিশ্রণ নেই। উদাহরণস্বরূপ, আপনি কেবল শ্রেণিবিন্যাসকে সংজ্ঞায়িত করতে পারেন

                        /-A
            /(A|B)-----|
-(AB|C)----|            \-B
           |
            \-C

যেখানে Aঘুমানোর সময়কে প্রতিনিধিত্ব করে, બેઠার সাথে কাটানো সময়কে প্রতিনিধিত্ব করে B, Cশারীরিক ক্রিয়াকলাপে ব্যয় করা সময়কে (A|B)মধ্যকার স্বাভাবিক লগ অনুপাতকে উপস্থাপন করেএকজন বি (অর্থাত 12Lnএকজনবি ), এবং (একজনবি|সি) এর মধ্যে স্বাভাবিক লগ অনুপাত বোঝায় একজন, বি এবং সি (অর্থাত 23Lnএকজনবিসি)। যদি অনেকগুলি ভেরিয়েবল থাকে তবে আমি প্রধান ব্যালেন্স দিয়ে কিছু কাজ পরীক্ষা করে দেখি

তবে আপনার মূল প্রশ্নে ফিরে যাওয়া, আপনি কীভাবে এই তথ্যটি আসলে আইল ট্রান্সফর্মেশন সম্পাদন করতে পারেন?

আপনি যদি আর ব্যবহার করেন তবে আমি রচনাগুলি প্যাকেজটি চেকআউট করব

এই প্যাকেজটি ব্যবহার করার জন্য, আপনাকে বুঝতে হবে যে কীভাবে একটি ক্রমবর্ধমান বাইনারি পার্টিশন (এসবিপি) তৈরি করতে হয়, যা আপনি কিভাবে স্তরক্রমকে সংজ্ঞায়িত করেন। উপরে বর্ণিত শ্রেণিবিন্যাসের জন্য, আপনি নিম্নলিখিত ম্যাট্রিক্সের সাথে এসবিপি উপস্থাপন করতে পারেন।

        A  B  C
(A|B)   1 -1  0
(AB|C)  1  1 -1

যেখানে ধনাত্মক মানগুলি সংখ্যার মধ্যে পরিবর্তনশীলকে প্রতিনিধিত্ব করে, নেতিবাচক মানগুলি ডিনোমিনেটরে ভেরিয়েবলকে উপস্থাপন করে এবং শূন্যগুলি ভারসাম্যের মধ্যে এই পরিবর্তনশীলের অনুপস্থিতি উপস্থাপন করে। আপনি balanceBaseযে সংজ্ঞাটি সংজ্ঞায়িত করেছেন তা থেকে আপনি অরনরমাল ভিত্তি তৈরি করতে পারেন ।
একবার আপনার এটি হয়ে গেলে আপনি উপরের গণনাটির ভিত্তিতে আপনার অনুপাতের টেবিলে পাস করতে সক্ষম হন।

ব্যালেন্সের মূল সংজ্ঞা জন্য আমি এই রেফারেন্সটি যাচাই করতাম


4

উপরে পোস্ট কিভাবে গঠন করা সম্পর্কে প্রশ্নের উত্তর একটি আইএলআর ভিত্তিতে এবং আপনার আইএলআর ভারসাম্যকে পেতে। এটি যুক্ত করার জন্য, কোন ভিত্তিতে পছন্দ আপনার ফলাফলের ব্যাখ্যা সহজ করতে পারে।

নিম্নলিখিত পার্টিশনটিতে আপনার আগ্রহ থাকতে পারে:

(1) (ঘুমন্ত, બેઠাবল | শারীরিক_অ্যাক্টিভিটি) (2) (ঘুমন্ত | আসীন)।

আপনার রচনাতে আপনার তিনটি অংশ রয়েছে তাই বিশ্লেষণের জন্য আপনি দুটি আইএলআর ব্যালেন্স পাবেন। উপরের মত পার্টিশন স্থাপন করে, আপনি "সক্রিয় বা না" (1) এবং "কোন ধরনের নিষ্ক্রিয়তার ফর্ম" (2) এর সাথে সামঞ্জস্য রেখে তা পেতে পারেন।

যদি আপনি প্রতিটি আইএলআর ভারসাম্য পৃথকভাবে বিশ্লেষণ করেন, উদাহরণস্বরূপ দিনের সাথে বা বছরের যে সময়ের মধ্যে কিছু পরিবর্তন আছে কিনা তা প্রতিরোধ করার জন্য, আপনি "সক্রিয় বা না" এবং পরিবর্তনের ক্ষেত্রে ফলাফলের ব্যাখ্যা দিতে পারেন "যা নিষ্ক্রিয়তার ফর্ম"।

অন্যদিকে, আপনি পিসিএর মতো কৌশলগুলি সম্পাদন করেন যা আইএলআর স্পেসে নতুন ভিত্তি অর্জন করে, আপনার ফলাফলগুলি আপনার বিভাজন বাছাইয়ের উপর নির্ভর করবে না। এটি আপনার সিএলআর-স্পেসে উপস্থিত থাকার কারণে, এক-ভেক্টরের ডি -১ প্লেন অরথোগোনাল এবং আইএলআর ব্যালেন্সগুলি সিএলআর বিমানে ডেটার অবস্থান বর্ণনা করার জন্য ইউনিট-আদর্শ অক্ষের বিভিন্ন পছন্দ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.