কীভাবে একটি বিরাট স্পার্স কন্টিনজেন্সি টেবিলটি কল্পনা করা যায়?


24

আমার দুটি ভেরিয়েবল রয়েছে: ড্রাগ নেম (ডিএন) এবং সংশ্লিষ্ট অ্যাডওয়ার্স ইভেন্টস (এই), যা বহু-বহু-সম্পর্কের মধ্যে দাঁড়িয়ে। 33,556 ড্রাগ নাম এবং 9,516 বিরূপ ইভেন্ট রয়েছে। নমুনা আকার প্রায় 5.8 মিলিয়ন পর্যবেক্ষণ।

আমি ডিএন এবং এই এর মধ্যে সমিতি / সম্পর্ক অধ্যয়ন করতে এবং বুঝতে চাই। আমি আর এই সেটটি ভিজ্যুয়ালাইজ করার একটি উপায় সম্পর্কে ভাবছি যেহেতু ছবিগুলি দেখার চেয়ে এটি ভাল। আমি কীভাবে এটি যেতে পারি তা নিশ্চিত নই ...


3
(+1) এই মন্তব্যে উপস্থাপন করা অতিরিক্ত তথ্যের আলোকে (যেহেতু মুছে ফেলা হয়েছে, কারণ তথ্যটি এখনই প্রশ্নটিতে প্রদর্শিত হয়), এটি একটি আকর্ষণীয় এবং চ্যালেঞ্জিং সমস্যা হয়ে দাঁড়িয়েছে। আমি পূর্ববর্তী নিম্নগামীদের এটির স্বীকৃতি হিসাবে তাদের ভোটগুলি পরিবর্তন করতে উত্সাহিত করি (এবং অন্যরা যদি আপনি আমার সাথে একমত হন তবে প্রশ্ন উত্সাহিত করতে!)।
whuber

1
ডেটা কি প্রকাশ্যে পাওয়া যায়?
কার্ডিনাল

5
@ কার্ডিনাল, হ্যাঁ .. এফডিএ থেকে প্রাপ্ত ডেটা, একে এআরএস বলা হয়। লিঙ্কটি দেখুন: fda.gov/Drugs/GuidanceCompuleRegulatoryInifications/…
user9292

এটি একটি বৃহত সাহিত্যের সাথে একটি পরিচিত সমস্যা: আপনি এক নজরে দেখতে পারেন, উদাহরণস্বরূপ (মেডিসিনের পরিসংখ্যান থেকে, ডাউনলোডযোগ্য): "বায়সিয়ান ফার্মাকোভিজিল্যান্স সিগন্যাল সনাক্তকরণের পদ্ধতিগুলি একাধিক তুলনামূলক সেটিংয়ে পুনরায় দেখা গেছে" এবং থেরিনের উল্লেখ করে।
কেজেটিল বি হালওয়ারসেন

এটি একটি আকর্ষণীয় কাগজের মতো শোনাচ্ছে (এটি নিখরচায় পাওয়া যায় তা নিশ্চিত নয়, তবে একটি আর প্যাকেজ রয়েছে )। এখন, আপনি কোন গ্রাফিকাল সমাধানের পরামর্শ দিবেন?
chl

উত্তর:


11

আপনি যা করতে পারলেন তা হল এই বইয়ের অধ্যায়ের 49 নং পৃষ্ঠায় যেমন বিরল ম্যাট্রিক্স ভিজ্যুয়ালাইজেশনের সংমিশ্রণে এখানে ভিসিডি থেকে অবশিষ্ট শেডিং আইডিয়া ব্যবহার করা । অবশিষ্ট ছায়াগুলি সহ পরবর্তী প্লটটি কল্পনা করুন এবং আপনি ধারণাটি পাবেন।

স্পারস ম্যাট্রিক্স / কনজিজেঞ্জি টেবিলটিতে সাধারণত প্রতিটি ওষুধের প্রতিটি বিরূপ প্রভাবের সংখ্যার উপস্থিতি থাকে। অবশিষ্ট শেডিং আইডিয়াটি সহ তবে আপনি একটি বেসলাইন লগ লিনিয়ার মডেল স্থাপন করতে পারেন (উদাহরণস্বরূপ একটি স্বাধীনতা মডেল বা আপনি যা পছন্দ করেন) এবং মডেলটির পূর্বাভাসের চেয়ে বেশি / কম প্রায়ই কোন ওষুধ / প্রভাবের সংমিশ্রণ ঘটে তা খুঁজে পেতে রঙিন স্কিম ব্যবহার করুন । যেহেতু আপনি অনেক পর্যবেক্ষণ আছে, আপনি একটি খুব সূক্ষ্ম রং থ্রেশহোল্ডিং ব্যবহার এবং একটি মানচিত্র যে কিভাবে ক্লাস্টার বিশ্লেষণে microarrays প্রায়ই ভিসুয়ালাইজ্ড-যেমন অনুরূপ পেতে পারে এখানে(তবে সম্ভবত শক্তিশালী রঙের "গ্রেডিয়েন্টস")। অথবা আপনি এমন প্রান্তিকতাগুলি তৈরি করতে পারেন কেবলমাত্র যদি ভবিষ্যদ্বাণীগুলিতে পর্যবেক্ষণের পার্থক্যটি রঙিন হওয়ার চেয়ে প্রান্তিকের চেয়ে বেশি হয়ে যায় এবং বাকীগুলি সাদা থাকে। আপনি ঠিক কীভাবে এটি করবেন (উদাহরণস্বরূপ কোন মডেলটি ব্যবহার করবেন বা কোন প্রান্তিকর) আপনার প্রশ্নের উপর নির্ভর করে।

সম্পাদনা করুন সুতরাং আমি এখানে এটি কীভাবে করব (প্রদত্ত আমার যথেষ্ট পরিমাণে র্যাম পাওয়া যায় ...)

  1. পছন্দসই মাত্রাগুলির একটি বিরল ম্যাট্রিক্স তৈরি করুন (ড্রাগের নাম x ইফেক্টস)
  2. স্বাধীনতার লগলাইনার মডেল থেকে অবশিষ্টাংশ গণনা করুন
  3. সর্বনিম্ন থেকে সর্বাধিক অবশিষ্ট অবধি জরিমানা রেজোলিউশনে একটি রঙ গ্রেডিয়েন্ট ব্যবহার করুন (উদাহরণস্বরূপ, এইচএসভি রঙের স্থান সহ)
  4. স্পার্স ম্যাট্রিক্সের অনুসারে পজিশনের অবশিষ্টাংশের দৈর্ঘ্যের বর্ণের মানটি সন্নিবেশ করান
  5. একটি চিত্র প্লট সহ ম্যাট্রিক্স প্লট করুন।

এরপরে আপনি এরকম কিছু দিয়ে শেষ করবেন (অবশ্যই আপনার চিত্রটি অনেক বড় হবে এবং পিক্সেলের আকার অনেক কম থাকবে তবে আপনার ধারণাটি পাওয়া উচিত color রঙের চতুর ব্যবহারের সাথে আপনি স্বাধীনতা থেকে সংঘগুলি / প্রস্থানগুলি কল্পনা করতে পারবেন আপনি সবচেয়ে বেশি আগ্রহী).

100x100 ম্যাট্রিক্স সহ একটি দ্রুত এবং নোংরা উদাহরণ। এটি কিংবদন্তিটিতে আপনি দেখতে পাচ্ছেন -10 থেকে 10 পর্যন্ত অবশেষগুলির সাথে এটি একটি খেলনার উদাহরণ। সাদা শূন্য, নীল প্রত্যাশার চেয়ে কম ঘন ঘন, প্রত্যাশার চেয়ে লাল বেশি ঘন ঘন। আপনার ধারণাটি পেতে এবং সেখান থেকে এটি নিতে সক্ষম হওয়া উচিত। সম্পাদনা: আমি প্লটের সেট আপ স্থির করেছি এবং অহিংস রঙ ব্যবহার করেছি।

এখানে চিত্র বর্ণনা লিখুন

এটি imageফাংশনটি ব্যবহার করে এবং cm.colors()নিম্নলিখিত ফাংশনে করা হয়েছিল:

ImagePlot <- function(x, ...){
 min <- min(x)
 max <- max(x)
 layout(matrix(data=c(1,2), nrow=1, ncol=2), widths=c(1,7), heights=c(1,1))

 ColorLevels <- cm.colors(255)

 # Color Scale
 par(mar = c(1,2.2,1,1))
 image(1, seq(min,max,length=255),
  matrix(data=seq(min,max,length=255), ncol=length(ColorLevels),nrow=1),
  col=ColorLevels,
  xlab="",ylab="",
  xaxt="n")


 # Data Map
 par(mar = c(0.5,1,1,1))
 image(1:dim(x)[1], 1:dim(x)[2], t(x), col=ColorLevels, xlab="",
 ylab="", axes=FALSE, zlim=c(min,max))

layout(1)
}

#100x100 example
x <- c(seq(-10,10,length=255),rep(0,600))
mat <- matrix(sample(x,10000,replace=TRUE),nrow=100,ncol=100)
ImagePlot(mat)

এখান থেকে ধারনা ব্যবহার http://www.phaget4.org/R/image_matrix.html । যদি আপনার ম্যাট্রিক্সটি এত বড় হয়ে যায় যে imageফাংশনটি ধীর হয়ে যায়, তর্কটি ব্যবহার করুন useRaster=TRUE(আপনি স্পার্স ম্যাট্রিক্স অবজেক্টগুলিও ব্যবহার করতে চাইতে পারেন; নোট করুন যে imageউপরে থেকে কোডটি ব্যবহার করতে চাইলে কোনও পদ্ধতি থাকা উচিত , স্পার্সেম প্যাকেজটি দেখুন))

আপনি যদি এটি করেন, সারি / কলামগুলির কিছু চতুর অর্ডার কার্যকর হতে পারে, যা আপনি আরুলস প্যাকেজের সাথে গণনা করতে পারেন (পৃষ্ঠা 17 এবং 18 বা ততোধিক পরীক্ষা করুন)। আমি সাধারণত এই ধরণের ডেটা এবং সমস্যার (শুধুমাত্র ভিজ্যুয়ালাইজেশনই নয়, প্যাটার্নগুলি সন্ধান করতেও) জন্য কণ্ঠ্যগুলির ইউটিলিটিগুলির পরামর্শ দেব। সেখানে আপনি অবশিষ্ট স্তরগুলির পরিবর্তে যে স্তরগুলি ব্যবহার করতে পারেন তার মধ্যে সংযোগের ব্যবস্থাও পাবেন।

আপনি নিজের টেবিলপ্লটগুলিও দেখতে চাইতে পারেন পরে কেবল কয়েকটি প্রতিকূল প্রভাবগুলি তদন্ত করতে চান।


1
স্পষ্টতই এটিকে আজকাল একটি "কুইট প্লট" বলা হয় plosone.org/article/info:doi/10.1371/jorter.pone.0085047
মোমো

আমি সারি এবং কলামগুলি ক্লাস্টারযুক্ত উদাহরণস্বরূপ শ্রেণিবিন্যাসের সাথে উত্তাপের মানচিত্রগুলি দেখতে অভ্যস্ত। যদিও 33556 x 9516 এটিকে ভিজ্যুয়ালাইজ করার মতো অনেক কিছুই মনে হচ্ছে।
আর গ্রেগ স্টেসি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.