পৃথক ডেটা জন্য লাইন প্লট ব্যবহার করা কি ভুল?


12

আমি প্রায়শই লাইন প্লট হিসাবে কাঠামোযুক্ত ডেটাসেটগুলি দেখেছি, তবে এটি আমার কাছে ঘটে যায় যে রেখাটি পরিমাপের ব্যবধানগুলির মধ্যে একটি বিন্দুতে মূল্য নির্ধারণ করে যা পৃথক ডেটাসেটের জন্য অর্থহীন। অতএব এটি কি পৃথক ডেটার জন্য লাইন প্লট ব্যবহার ভুল?

উদাহরণস্বরূপ, দুটি টাইম-সিরিজ ডেটাসেট নিন, একটি অবিচ্ছিন্ন (আমার ওজন, প্রতিদিন সকালে মাপা হয়) এবং একটি স্বতন্ত্র (আমি প্রতিদিন ডোনোটের সংখ্যা খাই)। প্রথম ডেটাসেটটি লাইন প্লট হওয়ার পক্ষে এটি বোধগম্য, কারণ এটি নির্ধারণ করা যুক্তিসঙ্গত যে কোনও প্রদত্ত বিকেলে আমার ওজন আমার পূর্ববর্তী ও পরবর্তী সকালে ওজনের সাথে সম্পর্কিত হবে। যাইহোক, যদি ডনটের সংখ্যা একটি লাইন গ্রাফ হিসাবে প্রতিনিধিত্ব করে তবে বিন্দুগুলির মধ্যে লাইনগুলি কোনও অর্থই লাইন থেকে অনুমান করা যায় না।

সম্পাদনা

এখানে আরও একটি উদাহরণ রয়েছে: http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html এ প্রতিষ্ঠার প্লট থেকে যেহেতু ফেডারাল আওয়ারলি ন্যূনতম মজুরি

যদি আমি ভুল না করি তবে সর্বনিম্ন মজুরির পরিবর্তনগুলি পৃথক হয়ে থাকে এবং তাই বিন্দুগুলিতে আন্তঃসংযোগকারী লাইনটি ব্যবহার করে নির্বিচারে কিছু সময় নির্ধারণ করা এবং বিন্দুতে ন্যূনতম মজুরি প্রতিষ্ঠা করা সম্ভব নয়।


3
(+1) প্রতি ঘন্টা ন্যূনতম মজুরির উদাহরণটি দুর্দান্ত। আপনার প্রশ্নের খুব অবিচ্ছেদ্য একটি উত্তরের জবাব দেয়: যথা, যখন গ্রাফের সাথে সংযোগ স্থাপনগুলি বৈধ হয় না তখন এটি পাঠককে ভুল (বা পুরোপুরি অবৈধ) ইন্টারপোলেশন দেয়। বিচক্ষণতা এবং অবিচ্ছিন্নতার মধ্যে পার্থক্য তৈরি করা আরও বিশ্লেষণে সহায়তা করবে: নূন্যতম খরচ স্বল্প ও ন্যূনতম মজুরি বিচ্ছিন্ন থাকাকালীন। প্রতিটি প্লটের বিভিন্ন রূপের দাবিদার।
whuber

এমন প্লট রয়েছে যেখানে বিচ্ছিন্ন ডেটা সহ একটি স্ক্র্যাটার প্লট একটি লাইন প্লটের উপর দিয়ে বিভ্রান্ত করছে। উদাহরণস্বরূপ ক্ষেত্রে যেখানে ইভেন্টগুলির ক্রম প্রয়োজন হয় (হিস্টেরিসিস), বা দুটি স্তরের মধ্যে দোলন ঘটে এবং একটিকে রাষ্ট্রের পরিবর্তনগুলি এবং তাদের অবস্থান সন্ধান করতে হবে। সুতরাং: প্রবৃদ্ধি বোঝাতে লাইন প্লটগুলি ব্যবহার করবেন না, তবে উপযুক্ত হলে গাইড হিসাবে তাদের ব্যবহার করুন। একটি সাধারণ পছন্দনীয় নিয়ম ম্যাক করার পক্ষে এটি যথেষ্ট সহজ নয় তবে হাতে ডেটা এবং মডেল বিবেচনা করা দরকার।
ভাইরবল

1
মজার প্রশ্ন! তার জন্য ধন্যবাদ. আমি অনেক সময় সম্পর্কিত ডেটা নিয়ে কাজ করছি যা আংশিকভাবে বিযুক্ত মডেল এবং আংশিক পরিমাপ করা ডেটা থেকে আসে। অবিচ্ছিন্ন তথ্যের জন্য স্টেপড লাইন প্লটগুলি ব্যবহার করার বিকল্পগুলি (যা একরকমভাবে ধারাবাহিক হতে পারে তবে একক পয়েন্টগুলির মধ্যে আমাদের এখনও কোনও কার্যকারিতা নেই এবং কেবল একটি আছে বলে ধরে নিতে পারি না) এবং অবিচ্ছিন্ন তথ্যের জন্য নিয়মিতভাবে কী? আমি এটির
সাথেই এইভাবে व्यवहार

@ কর্ডকাল্ডেমায়ার মন্তব্য করার জন্য ধন্যবাদ - আমি লেখার ধরণ "স্টেপড লাইন প্লট" সম্পর্কে অবগত ছিলাম না, তবে আমি অবশ্যই এটি খুঁজছি। আমি এক্সেলের স্টেপড লাইন প্লটগুলি করার জন্য এই সহায়ক টিউটোরিয়ালটিও পেয়েছি: ট্রাম্পেক্সেল.com
স্টেপ

@ ব্যবহারকারী 1379351: খুশি আমি সাহায্য করতে পারে!
কর্ড কাল্ডেমায়ার

উত্তর:


9

সংযুক্ত লাইন প্লটগুলি একক ব্যাখ্যায় সীমাবদ্ধ রাখতে খুব কার্যকর প্রমাণিত হয়েছে। কয়েকটি বিশিষ্ট ব্যবহার:

  • আন্তঃবিবাহিত মান । যে ক্ষেত্রে আপনি উল্লেখ করেছেন যেখানে উভয় ভেরিয়েবল অবিচ্ছিন্ন এবং প্রতিটি ইন্টারপোলেটেড বিন্দুকে একটি অর্থবহ ব্যাখ্যা হিসাবে line
  • পরিবর্তনের হার । এমনকি যখন মধ্যবর্তী মানগুলি অর্থবহ না হয়, প্রতিটি লাইন বিভাগের slালু পরিবর্তনের হারের উপস্থাপনা। দ্রষ্টব্য যে এই ব্যাখ্যার জন্য, এক্স এবং ওয়াই মানগুলি যথাযথভাবে ফাঁক করা উচিত, যা আপনি মজুরির প্লটের ক্ষেত্রে উল্লেখ করেন না।
  • প্রোফাইল তুলনা । ছোট গুণগুলি বা ওভারলাইড ব্যবস্থার তুলনা করার সময় লাইনগুলি শ্রেণিবদ্ধ কারণগুলির জন্যও কার্যকর হতে পারে। এই ক্ষেত্রে, লাইনগুলি সীমিত প্যাটার্ন স্বীকৃতির জন্য প্রতিক্রিয়াগুলির গ্রুপগুলিতে সংযোগ স্থাপন করে। লেবেল পঠনযোগ্যতার জন্য y ( অ্যাক্সের পরিবর্তে) অক্ষরেখার সাথে পেলটিটেক.কমের একটি উদাহরণ এখানে রয়েছে :

এখানে চিত্র বর্ণনা লিখুন


1
সত্য, তবে দ্বিতীয় এবং তৃতীয় গ্রাফ প্রথমটির তুলনায় কঠোরভাবে কম শক্তিশালী, যেহেতু কেউ একেবারে ক্যালকুলাস ব্যবহার করতে পারে না।
মিলিন্দ আর

5

ঠিক আছে, ডোনাটগুলি ওজনের সাথে সম্পর্কিত হতে পারে :-)

আমি যখন আপনার বক্তব্যটি দেখি, তখন আমি মনে করি এই উদাহরণটি এতটা খারাপ নয় কারণ সময় (অনুভূমিক অক্ষে, যা লাইনগুলি উল্লেখ করে) অবিচ্ছিন্ন থাকে। লাইনটির অর্থ, আমার কাছে, এতটা নয়, দিনের প্রতিটি সময়ে আপনি একটি নির্দিষ্ট সংখ্যক ডোনট খেয়েছিলেন, তবে প্রতিদিন ডোনোটের সংখ্যা কিছু নিয়মিতভাবে পরিবর্তিত হয়। সুতরাং, আমরা লাইনে একটি ধনু মসৃণ এর মতো কিছু যুক্ত করতে পারি এবং এটি অর্থপূর্ণ হবে। প্রতি ঘন্টা বা এমনকি প্রতি মিনিটে ডোনট খাওয়ার বিষয়ে চিন্তা করা কমপক্ষে যুক্তিযুক্ত (যদিও এটি প্রতিদিনের জন্য গণনা বেশি ছিল এমন একটি ভেরিয়েবলের সাথে আরও বুদ্ধিমান হবে)

অনুভূমিক অক্ষটি বিচ্ছিন্ন হয়ে গেলে (এবং বিশেষত যখন এটি নামমাত্র হয়) তবে লাইনগুলি টানা হয় তখন আরও উদ্বেগজনক বিষয় । এটি সত্যিকার অর্থে কোনও অর্থবোধ করে না। উদাহরণস্বরূপ আপনি যদি মার্কিন যুক্তরাষ্ট্রে বিভিন্ন অঞ্চলের বাসিন্দাদের (বলে) ওবামার পক্ষে%% ভোটের দিকে তাকান (বলুন), তবে উত্তর-পূর্ব এবং মধ্য-পশ্চিমের মধ্যে কোনও লাইন আঁকানো কোনও বোধগম্য নয়; বিশেষত যেহেতু অঞ্চলগুলির ক্রমটি স্বেচ্ছাসেবী, তবে ক্রম পরিবর্তন করলে রেখাগুলি পরিবর্তন হবে। তবুও আমি এরকম গ্রাফ দেখেছি।


1
সম্পূর্ণরূপে সম্মত হন যে লাইন গ্রাফগুলির চেয়ে আরও খারাপ গালাগাল রয়েছে। আমি মসৃণ পদ্ধতির পছন্দ করি কারণ এটি বিন্দুগুলিকে সংযুক্ত করে না, এবং তাই সেখানে নেই এমন ডেটা বোঝায় না। তবে এটি ডোনাট খাওয়ার ক্ষেত্রে উদ্বেগজনক প্রবণতাটি হাইলাইট করে। ধন্যবাদ!
ব্যবহারকারী 1379351

3
মনে হচ্ছে আপনি একটি পরিবর্তনশীল - ডোনাট খরচ - এর পরিবর্তে অন্যটির পরিবর্তে প্রস্তাব দিচ্ছেন; যথা, একটি ডোনাট গ্রাহক ঘনত্ব (প্রতি ইউনিট সময় ডোনটস)। যদিও এটি প্রায়শই করা হয়ে থাকে - বিশেষত দ্বি-মাত্রিক বিশ্লেষণে (যেমন জনসংখ্যার ঘনত্বের মানচিত্র) - এবং খুব কার্যকর হতে পারে তবে পাঠকদের পক্ষে একটি পার্থক্য রয়েছে তা সচেতন হওয়া এবং সেই পার্থক্য কীভাবে পারে তা বিবেচনা করা ভাল well গ্রাফিকালি প্রকাশ করা।
whuber

2
@ হুইবার এটি একটি ন্যায্য বিষয়; লাইনটি প্রতিস্থাপন করে বলে মনে হচ্ছে। এমন একটি গ্রাফ যা প্রতিস্থাপন করে না এটি কেবল বিন্দু, সংযোগযুক্ত হতে পারে, তবে এটি ডোনাট সেবনে একটি নির্দিষ্ট পয়েন্টে অবস্থিত হওয়ার জন্য কমপক্ষে একটি ইঙ্গিত তৈরি বলে মনে হচ্ছে। সুতরাং, আমরা সময়কে ধারাবাহিক হিসাবে রেন্ডার করতে এবং ডোনট খাওয়ার সময় এই মুহুর্তে একটি বিন্দু রাখতে পারি।
পিটার ফ্লুম - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.