অনেক ভেরিয়েবলের জন্য স্ক্যাটার-প্লট ম্যাট্রিক্স অন্বেষণ


10

আমি অনেক প্যারামিটার সহ একটি ডেটাসেট বিশ্লেষণ করছি (বলুন, 50-200) এবং আমি ভেরিয়েবলের মধ্যে সম্পর্কের দিকে আগ্রহী (যেমন 2-ভেরিয়েবল স্ক্রেটার প্লট বা 2 ডি হিস্টোগ্রামের ক্ষেত্রে)। তবে এই সংখ্যার পরামিতিগুলির জন্য 200x200 অ্যারের প্লট আঁকাই অসম্ভব বলে মনে হচ্ছে (যদি না আমি এটি মুদ্রণ করি এবং কোনও দেয়ালে স্তব্ধ না করি)।

অন্যদিকে, কেবলমাত্র একটি পারস্পরিক সম্পর্ক ম্যাট্রিক্স করা 2-পরিবর্তনশীল সম্পর্কের সম্পর্কে সমস্ত তথ্য দেয় না।

অনেক ভেরিয়েবলের জন্য 2-পরিবর্তনশীল সম্পর্কগুলি অনুসন্ধান করার জন্য কি কোনও উপায় (গ্রন্থাগার বা কর্মপ্রবাহ) রয়েছে?

আমি বিশেষত অন্যকে ফলাফল প্রদর্শন করতে আগ্রহী (সম্ভবত কিছু ডেটা প্রিপ্রোসেসিংয়ের পরে)। যেমন জাভাস্ক্রিপ্টে ইন্টারেক্টিভ কিছু, আমি যদি কোনও পারস্পরিক সম্পর্ক ম্যাট্রিক্স থেকে নির্বাচিত ক্ষেত্রগুলির জন্য স্ক্যাটার-প্লট ম্যাট্রিক্স দেখতে পারি।

স্ক্যাটার প্লট ম্যাট্রিক্স দ্বারা আমি এর অর্থ কিছু বুঝি:

এখানে চিত্র বর্ণনা লিখুন

(থেকে নেওয়া pandasplotting ব্লগ ; মধ্যে aviable পাইথন / পান্ডাস , আর , D3.js , ইত্যাদি)।


4
আপনি কী পরে তা পরিষ্কার করে দেননি। আপনি কি প্রতিটি ডাটা পয়েন্ট মেঘ দেখতে চান? আপনি কি একবারে সমস্ত বিভাজনীয় দিকগুলি দেখতে চান ?
ttnphns

@ttnphns আমি সমস্ত ডেটা পয়েন্ট বা সেগুলি কিছু সংযুক্ত আকারে দেখতে চাই (যেমন 2 ডি হিস্টোগ্রাম)। আমার সমস্ত জিনিস একবারে দেখতে হবে না (কারণ এটি <15 ভেরিয়েবলের জন্য বোধ হয় তবে 200 নয়)। এবং হ্যাঁ, আমি সচেতন যে প্রশ্নটি কিছুটা উন্মুক্ত। একটি ঘনিষ্ঠ সমাপ্ত সংস্করণটি হ'ল "জেএস ​​লাইব্রেরি কি স্ক্র্যাটার প্লট এবং হিস্টোগ্রামগুলি দেখানোর জন্য যখন মাউস সম্পর্কিত পিক্সেলের সাথে একটি সম্পর্কিত ম্যাট্রিক্সে ঘুরে বেড়ায়? নাকি আমি একটি লিখতে পারি? :)" আমি আরও একটি সাধারণ লিখেছি, সম্ভবত সেখানে রয়েছে সমস্যাটি মোকাবেলার জন্য আরও কিছু ভাল কর্মপ্রবাহ।
পাইওটার মিগডাল

ওলাপ কিউব আকারে স্ক্রেটারপ্লটসের ম্যাট্রিক্সটি সংগঠিত করা সম্ভব, যাতে আপনি একবারে কেবল একটি বা একাধিক প্লট দেখতে পান এবং তাদের মধ্যে স্যুইচ করতে পারেন। দুর্ভাগ্যক্রমে, আমি গ্রাফিকাল ওল্যাপ কিউবগুলি করার জন্য একটি নির্দিষ্ট প্রোগ্রাম বা কোড জানি না।
ttnphns

উত্তর:


7

ভেরিয়েবলের মধ্যে সম্পর্কের অন্বেষণ করা বেশ অস্পষ্ট, তবে আমি অনুমান করব যে এ জাতীয় স্ক্রেটারপ্লটগুলি পরীক্ষা করার আরও দুটি সাধারণ লক্ষ্য হ'ল;

  • অন্তর্নিহিত সুপ্ত গোষ্ঠীগুলি চিহ্নিত করুন (ভেরিয়েবল বা কেসের)।
  • বহিরাগতদের সনাক্ত করুন (অবিচ্ছিন্ন, দ্বিবিভক্ত বা বহুবিধ স্থানতে)

উভয়ই আরও পরিচালনাযোগ্য সারসংক্ষেপগুলিতে ডেটা হ্রাস করে তবে এর বিভিন্ন লক্ষ্য রয়েছে। সুপ্ত গোষ্ঠীগুলি সনাক্ত করুন কোনও একটি ডেটাতে সাধারণত মাত্রা হ্রাস করে (যেমন পিসিএ মাধ্যমে) এবং তারপরে অনুসন্ধান করা হয় যে এই হ্রাসকৃত স্থানে ভেরিয়েবল বা কেস ক্লাস্টার একসাথে রয়েছে কিনা s উদাহরণস্বরূপ বন্ধুত্বপূর্ণ (2002) বা কুক এট আল দেখুন। (1995)।

বহিরাগতদের সনাক্তকরণের অর্থ হয় কোনও মডেলকে ফিট করা এবং মডেল থেকে বিচ্যুতিগুলি প্লট করা (উদাহরণস্বরূপ একটি রিগ্রেশন মডেল থেকে অবশিষ্টাংশ প্লট করা) বা ডেটাটিকে তার মূল উপাদানগুলিতে হ্রাস করা এবং কেবলমাত্র মডেল বা ডেটার প্রধান অংশ থেকে বিচ্যুত পয়েন্টগুলি হাইলাইট করা যেতে পারে। উদাহরণস্বরূপ এক বা দুটি মাত্রায় বক্সপ্লটগুলি কেবল ব্যক্তিগত দৃষ্টিকোণগুলি দেখায় যা কব্জির বাইরে থাকে (উইকহাম এবং স্ট্রিজেউস্কি, 2013)। প্লটিংয়ের অবশিষ্টাংশগুলির দুর্দান্ত সম্পত্তি রয়েছে যা প্লটকে সমতল করতে হবে (টুকি, 1977), তাই অবশিষ্ট পয়েন্ট মেঘের সম্পর্কের কোনও প্রমাণ "আকর্ষণীয়"। সিভি-তে এই প্রশ্নের বহুবিধ বিদেশী সনাক্তকারীদের কয়েকটি দুর্দান্ত পরামর্শ রয়েছে।

যেমন বড় SPLOMS অন্বেষণ করার একটি সাধারণ উপায় প্লটে বিভক্ত না করা হয় সব পৃথক পয়েন্ট কিন্তু সরলীকৃত সারসংক্ষেপ কিছু টাইপ এবং তারপর হয়তো পয়েন্ট যে এই সারসংক্ষেপ, যেমন আস্থা উপবৃত্ত থেকে মূলত পথভ্রষ্ট, scagnostic সারাংশ (উইলকিনসন ও উইলস, 2008), bivariate বক্স-প্লট, কনট্যুর প্লট নীচে লৌকিক উপকরণকে সংজ্ঞায়িত করার এবং রৈখিক সংঘের বর্ণনা দেওয়ার জন্য একটি লোমস মসৃণ সুপারমপোসিংয়ের পরিকল্পনা করার একটি উদাহরণ রয়েছে।

সংক্ষিপ্ত উপবৃত্তাকার
(উত্স: স্টেটমেথডস নেট )

যে কোনও উপায়ে, অনেকগুলি ভেরিয়েবল সহ একটি বাস্তব সফল, ইন্টারেক্টিভ প্লটের বুদ্ধিমান বাছাইয়ের প্রয়োজন হবে (উইলকিনসন, 2005) এবং ভেরিয়েবলগুলি ফিল্টার করার জন্য একটি সহজ উপায় (ব্রাশিং / লিঙ্কিং সক্ষমতার পাশাপাশি) filter এছাড়াও যেকোন বাস্তববাদী ডেটাসেটের অক্ষকে রূপান্তর করার ক্ষমতা থাকতে হবে (উদাহরণস্বরূপ লোগারিথমিক স্কেলে ডেটা প্লট করা, শিকড় গ্রহণের মাধ্যমে ডেটা রুপান্তরকরণ ইত্যাদি)। শুভকামনা, এবং শুধুমাত্র একটি চক্রান্ত সঙ্গে আটকাবেন না!


উদ্ধৃতিসমূহ


1
ধন্যবাদ! আমার লক্ষ্য হ'ল আমি পিসিএ চালানোর আগে ডেটা অন্বেষণ করা , কারণ ভেরিয়েবলগুলি একটি অ-রৈখিক উপায়ে সম্পর্কিত হতে পারে এবং পুনরুদ্ধার (বা অন্যান্য প্রক্রিয়াজাতকরণ) প্রয়োজন।
পাইটর মিগডাল

উদাহরণস্বরূপ, উপবৃত্তাকার + ধনাত্মক মসৃণতার পরেও প্রাসঙ্গিক হওয়া উচিত (বা কোভার পরিবর্তন করুন b পিসিএ (বা এর মতো কিছু) এর মাধ্যমে ডেটা হ্রাসের পরে অ-লিনিয়ার অ্যাসোসিয়েশনগুলি আইডি করা সম্ভব হলে একটি ভাল ফলোআপ প্রশ্ন হতে পারে।
অ্যান্ডি ডাব্লু

1

আপনি জোড়ের ডি 3 আর প্যাকেজটি থেকে চকচকে ইন্টারফেসটি ব্যবহার করার বিষয়ে বিবেচনা করতে পারেন , যা স্ক্যাটার প্লট ম্যাট্রিক্সের সাথে যোগাযোগের জন্য একটি উপায় সরবরাহ করে।

আইরিস ডেটা সেট সহ একটি উদাহরণ:

install.packages("pairsD3")
require("pairsD3")
shinypairs(iris)

সূত্র: https://github.com/garthtarr/pairsD3

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.