বিযুক্ত ডেটা এবং একটানা উপাত্তের মধ্যে পার্থক্য কী?


62

বিযুক্ত ডেটা এবং একটানা উপাত্তের মধ্যে পার্থক্য কী?


2
আপনি প্রথমে গুগল চেষ্টা করেছিলেন? আমার জন্য, এটা দেয় এই
রবিন গিরার্ড

এখানে একটি সুন্দর ভিডিও যা আপনার প্রশ্নের উত্তর দেয়। youtube.com/watch?v=MIX3ZpzEOdM

2
ডিজিটাল বনাম অ্যানালগটি কেবল ভাবেন। একই জিনিস - বিভিন্ন নাম।
পিথিকোস

"বিচ্ছিন্ন" এবং "অবিচ্ছিন্ন" ডেটার মধ্যে পার্থক্য কী তা সত্যই আমি জানি না। কিছু কারণে, ইন্ট্রো স্ট্যাট ক্লাসগুলি শিক্ষার্থীদের এই দুটি জিনিসকে আলাদা করার জন্য নিয়ম মুখস্থ করতে সত্যই উপভোগ করছে। যতদূর আমি বুঝতে সক্ষম হয়েছি, পার্থক্যগুলি ডেটাতে নেই - তবে কীভাবে আমরা ডেটা মডেল করতে বেছে নিই।
ব্যবহারকারী795305

1
এটি গুগলের শীর্ষ ফলাফল ছিল, @ গ্রোবিংআরার্ড।
ডেনসন

উত্তর:


58

বিযুক্ত ডেটা কেবলমাত্র নির্দিষ্ট মান নিতে পারে। সম্ভাব্য এই মানগুলির অসীম সংখ্যা থাকতে পারে তবে প্রতিটি স্বতন্ত্র এবং এর মধ্যে কোনও ধূসর অঞ্চল নেই। বিবিধ ডেটা সংখ্যায়িক হতে পারে - আপেলের সংখ্যার মতো - তবে এটিও শ্রেণিবদ্ধ হতে পারে - যেমন লাল বা নীল, বা পুরুষ বা মহিলা, বা ভাল বা খারাপ।

অবিচ্ছিন্ন ডেটা সংজ্ঞায়িত পৃথক মানগুলিতে সীমাবদ্ধ নয়, তবে অবিচ্ছিন্ন পরিসরে কোনও মান দখল করতে পারে। যে কোনও দুটি ধারাবাহিক ডেটা মানগুলির মধ্যে অপরিসীম সংখ্যা থাকতে পারে। অবিচ্ছিন্ন ডেটা সবসময় মূলত সংখ্যাসূচক থাকে।

এটি কখনও কখনও এমন সংখ্যক ডেটা চিকিত্সা করে তোলে যা সঠিকভাবে এক ধরণের অন্য হিসাবে থাকে। উদাহরণস্বরূপ, উচ্চতার মতো কিছু অবিচ্ছিন্ন, তবে প্রায়শই আমরা ক্ষুদ্র পার্থক্যগুলি সম্পর্কে সত্যই বেশি যত্ন করি না এবং পরিবর্তে গ্রুপ হাইটগুলি বেশ কয়েকটি বিচ্ছিন্ন বিনগুলিতে পরিণত করি । বিপরীতে, যদি আমরা কিছু পরিমাণে স্বতন্ত্র সত্তা - ধানের শীষ, বা দেরী বা অর্থনীতির পেনিগুলি গণনা করি - তবে আমরা 2,000,006 এবং 2,000,008 কে অত্যন্ত গুরুত্বপূর্ণ মূল্য হিসাবে বিবেচনা না করে বরং তার পরিবর্তে নিকটস্থ পয়েন্ট হিসাবে বিবেচনা করতে পারি আনুমানিক ধারাবাহিকতা।

এটি কখনও কখনও সংখ্যার ডেটাগুলিকে শ্রেণীবদ্ধ হিসাবে বিবেচনা করতেও কার্যকর হতে পারে, যেমন: কম ওজন, সাধারণ, স্থূলকায়। এটি সাধারণত অন্য ধরণের বিন্যাস।

ধারাবাহিক তথ্যটিকে অবিচ্ছিন্ন হিসাবে বিবেচনা করা খুব কমই বোধগম্য হয়।


@ জারোমি হিসাবে @ ওয়াল্ক্টালকি কমপক্ষে মনোবিজ্ঞানের ক্ষেত্রে, প্রশ্নের জবাব হিসাবে শ্রেণিবদ্ধ পরিবর্তনশীলগুলি প্রায়শই অন্তর্নিহিত বৈশিষ্ট্যের প্রতিনিধিত্ব বলে মনে করা হয়, সুতরাং সেই অর্থে শ্রেণিবদ্ধ তথ্যগুলি কখনও কখনও অবিচ্ছিন্ন হিসাবে বিবেচিত হয়।
richiemorrisroe

@ রিচিওমরিস্রোয়ে ডেটা এবং পুটিযুক্ত বৈশিষ্ট্যের মধ্যে পার্থক্য সম্পর্কে কেউ নীটপিক করতে পারে তবে অবশ্যই আপনি ঠিক বলেছেন। এই অনুসরণীয় প্রশ্নের জবাবে কিছু খুব আকর্ষণীয় আরও পয়েন্ট তৈরি করা হয়েছিল ।
ওয়াকিটালকি

লিঙ্কটির জন্য ধন্যবাদ, এই উত্তরগুলি সত্যিই খুব আকর্ষণীয়।
richiemorrisroe

> " এই মানগুলির সম্ভাব্য অসীম সংখ্যা থাকতে পারে, তবে এর প্রতিটি স্বতন্ত্র এবং এর মধ্যে কোনও ধূসর অঞ্চল নেই " - পৃথক মানগুলির সাথে আলাদা বিতরণ করা এবং এটি একই সাথে কোনও দুটি জন্য সঠিকভাবে সম্ভব possible স্বতন্ত্র মানগুলি আপনি বেছে নেন, তাদের মধ্যে সর্বদা আরও মান থাকে (এক ধরণের 'ধূসর অঞ্চল')। এগুলি প্রায়শই অনুশীলনে আসে না, তবে তাদের পক্ষে বাস্তবের পক্ষে আসা পুরোপুরি সম্ভব; প্রকৃতপক্ষে আমি দুটি স্বতন্ত্র (যদি সম্পর্কিত) উদাহরণগুলি ভাবতে পারি যা সহজেই উত্থিত হতে পারে।
Glen_b

সুতরাং স্পষ্ট করার জন্য, আপনার কাছে যদি কোনও স্টকের সম্পত্তির জন্য 10 বিলিয়ন সারি ওলক ডেটা থাকে, তবে এটি এখনও পৃথক হিসাবে বিবেচিত হবে? তবে তারপরেও সম্পদের দাম 1 থেকে অনন্তের মধ্যে কিছু হতে পারে না, এই ধরণের পরিস্থিতিতে কীভাবে ভাবেন?
পাইরেটঅ্যাপ

19

ডেটা সর্বদা বিযুক্ত থাকে। nএকটি ভেরিয়েবলের মানগুলির নমুনা দেওয়া , ভেরিয়েবল গ্রহণ করতে পারে এমন স্বতন্ত্র মানের সর্বাধিক সংখ্যার সমান n। এই উদ্ধৃতি দেখুন

সমস্ত প্রকৃত নমুনা স্পেস পৃথক, এবং সমস্ত পর্যবেক্ষণযোগ্য এলোমেলো ভেরিয়েবলের বিযুক্ত বিলি রয়েছে। অবিচ্ছিন্ন বিতরণ একটি গাণিতিক নির্মাণ, গাণিতিক চিকিত্সার জন্য উপযুক্ত, তবে ব্যবহারিকভাবে পর্যবেক্ষণযোগ্য নয়। ইজেজি পিটম্যান (১৯ 1979,, পৃ। ২)

একটি ভেরিয়েবলের ডেটা সাধারণত র্যান্ডম ভেরিয়েবল থেকে আঁকা বলে ধরে নেওয়া হয়। এলোমেলো পরিবর্তনশীল একটি সীমার উপরে অবিচ্ছিন্ন থাকে যদি সম্ভাব্য মানগুলির অসীম সংখ্যা থাকে যা ভেরিয়েবলটি পরিসরের যে কোনও দুটি পৃথক পয়েন্টের মধ্যে নিতে পারে। উদাহরণস্বরূপ, উচ্চতা, ওজন এবং সময় সাধারণত ধ্রুবক হিসাবে ধরে নেওয়া হয়। অবশ্যই, এই ভেরিয়েবলগুলির কোনও পরিমাপ চূড়ান্তভাবে নির্ভুল এবং কিছুটা অর্থে পৃথক হবে।

অর্ডার করা (অর্থাত্ অর্ডিনাল), আনর্ডারড (অর্থাত্ নামমাত্র)
এবং বাইনারি ডিসক্রিট ভেরিয়েবলের মধ্যে পার্থক্য করা দরকারী ।

কিছু প্রাথমিক পাঠ্যপুস্তক একটি অবিচ্ছিন্ন ভেরিয়েবলকে একটি সংখ্যার ভেরিয়েবলকে বিভ্রান্ত করে। উদাহরণস্বরূপ, একটি কম্পিউটার গেমের স্কোর সংখ্যাযুক্ত হলেও এটি আলাদা।

কিছু প্রাথমিক পাঠ্যপুস্তক অবিচ্ছিন্ন ভেরিয়েবলের সাথে একটি অনুপাতের ভেরিয়েবলকে বিভ্রান্ত করে। একটি কাউন্ট ভেরিয়েবল একটি অনুপাতের পরিবর্তনশীল, তবে এটি অবিচ্ছিন্ন নয়।

প্রকৃত অনুশীলনে, একটি পরিবর্তনশীল প্রায়শই ধারাবাহিক হিসাবে বিবেচিত হয় যখন এটি যথেষ্ট পরিমাণে বিভিন্ন মানকে গ্রহণ করতে পারে।

তথ্যসূত্র

  • পিটম্যান, ইজেজি 1979 stat. পরিসংখ্যানগত অনুক্রমের জন্য কিছু প্রাথমিক তত্ত্ব। লন্ডন: চ্যাপম্যান এবং হল। দ্রষ্টব্য: আমি মারে আইটকিনের স্ট্যাটিস্টিকাল ইনফারেন্স: একটি ইন্টিগ্রেটেড বয়েশিয়ান / সম্ভাবনা পদ্ধতির দ্বিতীয় অধ্যায়টির প্রবর্তনের উদ্ধৃতিটি খুঁজে পেয়েছি

12
সম্ভাব্যতাও একটি "গাণিতিক নির্মাণ" এবং "সরাসরি পর্যবেক্ষণযোগ্য" নয়। এর অর্থ কি এই যে সম্ভাবনাটি নেই? সামগ্রিকভাবে, এই আকর্ষণীয় উত্তর একটি অসমর্থনীয় প্রতিজ্ঞা যে ডেটা মান দ্বারা চিহ্নিত করা উচিত তারা এর উপর ভিত্তি করে মনে না মান একটি গাণিতিক মডেল তাদের আছে করতে পারবেন দ্বারা বদলে আছে। দ্বিতীয়টি গুরুত্বপূর্ণ নয়, পূর্বেরটি নয়। এগুলি থেকে বোঝা যায় যে অবিচ্ছিন্ন / বিযুক্ত পার্থক্যের ক্ষেত্রে যা গুরুত্বপূর্ণ তা হ'ল আমরা ডেটা সম্পর্কে কীভাবে চিন্তা করি (এটি কীভাবে আমরা তাদের মডেল করি)।
whuber

3
@ ভুবার বিষয়টিকে বোঝানোর জন্য একটি চতুর সামান্য কল্পিত কাহিনী রয়েছে: লর্ড (1953), "ফুটবল সংখ্যার পরিসংখ্যানগত চিকিত্সা সম্পর্কিত", আমেরিকান সাইকোলজিস্ট , 8 , পিপি 750-51।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

ধন্যবাদ, @ স্কোর্তচি। গুগল স্কলার অনুসন্ধানের মাধ্যমে ওয়েব সংস্করণগুলি উপলব্ধ । "পরিমাপ তত্ত্ব" পরিসংখ্যান বিশ্লেষণকে কতটা প্রভাবিত করতে পারে (বা এমনকি সীমার পরিধিও সীমাবদ্ধ করতে হবে) সে সম্পর্কে 60০ বছর আগে উষ্ণভাবে বিতর্কিত লর্ড একটি ভ্রান্ত ধারণাটিকে সম্বোধন করছেন। আমার বক্তব্যটি মডেল নির্মাণ এবং পর্যবেক্ষণের মধ্যে পার্থক্য সম্পর্কে আলাদা ছিল।
হোবার

12

তাপমাত্রা অবিচ্ছিন্ন। এটি 23 ডিগ্রি, 23.1 ডিগ্রি, 23.100004 ডিগ্রি হতে পারে।

যৌনতা বিচ্ছিন্ন। আপনি কেবল পুরুষ বা মহিলা হতে পারেন (যাই হোক না কেন শাস্ত্রীয় চিন্তায়)। 1, 2 ইত্যাদি ইত্যাদির মতো আপনি পুরো সংখ্যার সাথে কিছু উপস্থাপন করতে পারেন

পার্থক্যটি গুরুত্বপূর্ণ কারণ অনেক পরিসংখ্যান এবং ডেটা মাইনিং অ্যালগরিদমগুলি এক ধরণের পরিচালনা করতে পারে তবে অন্যটি নয়। উদাহরণস্বরূপ নিয়মিত প্রতিরোধের জন্য, ওয়াই অবশ্যই অবিচ্ছিন্ন হতে হবে। লজিস্টিক রিগ্রেশনে ওয়াই আলাদা।


5
Y

8

বিযুক্ত ডেটা কেবল নির্দিষ্ট মান নিতে পারে।

উদাহরণ: একটি ক্লাসে শিক্ষার্থীর সংখ্যা (আপনার অর্ধেক ছাত্র থাকতে পারে না)।

অবিচ্ছিন্ন ডেটা এমন ডেটা যা কোনও মান নিতে পারে (একটি সীমার মধ্যে)

উদাহরণ:

  • কোনও ব্যক্তির উচ্চতা: কোনও নির্দিষ্ট স্থির উচ্চতা নয়, কোনও মান (মানব উচ্চতার সীমার মধ্যে) হতে পারে,
  • একটি দৌড়ের সময়: আপনি এটি এক সেকেন্ডের ভগ্নাংশ পর্যন্ত পরিমাপ করতে পারেন,
  • একটি কুকুরের ওজন,
  • একটি পাতার দৈর্ঘ্য,
  • একজন ব্যক্তির ওজন,

2
আপনি উত্তরটি কোথায় অনুলিপি করেছেন তা আপনি আমাদের বলতে পারেন: mathsisfun.com/data/data-discrete-continuous.html
ফিল্মকোলে

সুন্দরভাবে বর্ণিত।
আরসমান আহমদ

0

ডাটাবেসের ক্ষেত্রে, আমরা সর্বদা ডেটাটি আলাদা করে রাখি এমনকি তথ্যের প্রকৃতি অবিচ্ছিন্ন। আমি কেন ডেটা প্রকৃতির উপর জোর দেওয়া উচিত? আমাদের এমন ডেটা বিতরণ করা উচিত যা ডেটা বিশ্লেষণে আমাদের সহায়তা করতে পারে। যদি তথ্যের প্রকৃতি অবিচ্ছিন্ন থাকে তবে আমি আপনাকে ধারাবাহিক বিশ্লেষণ করে সেগুলি ব্যবহার করার পরামর্শ দিই।

অবিচ্ছিন্ন এবং বিযুক্তির একটি উদাহরণ নিন: এমপি 3। এমনকি "শব্দ" প্রকারের সাদৃশ্যটি যদি ডিজিটাল ফর্ম্যাট দ্বারা সঞ্চিত থাকে। আমাদের এটিকে সর্বদা উপমা উপায়ে বিশ্লেষণ করা উচিত।


0

একদিকে, ব্যবহারিক দৃষ্টিকোণ থেকে আমি জেরোমি অ্যাংলিমের উত্তরের সাথে একমত নই। শেষ পর্যন্ত আমরা বেশিরভাগ সময় বিচ্ছিন্ন ভেরিয়েবলগুলির সাথে ডিল করি - যদিও তাত্ত্বিক দিক থেকে তারা অবিরত - এবং শ্রেণিবিন্যাসের জন্য এটির প্রকৃত প্রভাব রয়েছে। স্ট্রোবিলের কাগজটি স্মরণ করুন যা ইঙ্গিত করে যে এলোমেলো বনগুলি একাধিক কাটিয়া পয়েন্ট (উচ্চতর নির্ভুলতা তবে সম্ভাব্য অনুরূপ প্রকৃতি) সহ ভেরিয়েবলের প্রতি পক্ষপাতদুষ্ট। আমার ব্যক্তিগত অভিজ্ঞতা থেকে সম্ভাব্য নিউরাল নেটওয়ার্কগুলি যখন বৈষম্যগুলি একই ধরণের (অর্থাত্ ক্রমাগত) না হয় তবে ভিন্ন ভিন্ন যথার্থতা উপস্থাপন করতে পারে। অন্যদিকে, তাত্ত্বিক দৃষ্টিভঙ্গি থেকে শাস্ত্রীয় শ্রেণিবিন্যাস (যেমন, ধারাবাহিক, পৃথক, নামমাত্র ইত্যাদি), আইএমএইচও, ডান। আমার মতে আমি এম 5 অ্যালগোরিদম বর্ণনা করে কুইনলানের কাগজের উত্স নাম, যা 'রেজিস্ট্রার', এটি একটি দুর্দান্ত পছন্দ। সুতরাং সংজ্ঞা এবং ক্রমাগত বনাম পৃথক পৃথকগুলির প্রভাব 'পরিবেশের' উপর নির্ভর করে প্রাসঙ্গিক।

refs:

কুইনলান জেআর (1992)। অবিচ্ছিন্ন ক্লাস নিয়ে শিখছি। ইন: এআই-তে 5 তম অস্ট্রেলিয়ান যৌথ সম্মেলন। সিডনি (অস্ট্রেলিয়া), 343–348।

স্ট্রোবল সি।, বোলেস্টিক্স এ.এল., জেলিস এ।, এবং হথর্ন টি। (2007)। বায়বীয় এলোমেলো বন পরিবর্তনশীল গুরুত্বের পদক্ষেপগুলি: চিত্র, উত্স এবং একটি সমাধান। বিএমসি বায়োইনফরম্যাটিকস, 8, 25. ডওই: 10.1186 / 1471-2105-8-25


-1

বিচ্ছিন্ন ডেটা নির্দিষ্ট মানগুলি নিয়ে থাকে, যখন ক্রমাগত ডেটা পৃথক মানগুলিতে সীমাবদ্ধ থাকে না।

বিবিধ ডেটা স্বতন্ত্র এবং এর মধ্যে কোনও ধূসর অঞ্চল নেই, যখন অবিচ্ছিন্ন ডেটা অবিচ্ছিন্ন ডাটা মানের চেয়ে কোনও মান দখল করে।


-2

পৃথক ডেটা তারা নির্দিষ্ট মান নিতে পারে he এগুলি সংখ্যাসূচক।


সিভি তে স্বাগতম! উত্তর দেওয়ার জন্য ধন্যবাদ, তবে দয়া করে পূর্ববর্তী উত্তরগুলি দেখার জন্য সময় নিন এবং আপনি কোনও কার্যকর কিছু যুক্ত করছেন কিনা তা বিবেচনা করে।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

-3

বিচ্ছিন্ন তথ্য কেবলমাত্র পূর্ণসংখ্যার মানগুলিতে গ্রহণ করতে পারে তবে অবিচ্ছিন্ন ডেটা যে কোনও মান গ্রহণ করতে পারে। উদাহরণস্বরূপ, প্রতি বছর কোনও হাসপাতালের দ্বারা ক্যান্সার করা রোগীদের সংখ্যা পৃথক তবে আপনার ওজন অবিচ্ছিন্ন। কিছু ডেটা অবিচ্ছিন্ন তবে একটি পৃথক উপায়ে যেমন আপনার বয়স meas 31, আপনার বয়স হিসাবে রিপোর্ট করা সাধারণ।


11
পূর্ণসংখ্যাতে সীমাবদ্ধ না রেখে ডেটা আলাদা করা যায়। বা সংখ্যা, যে বিষয়টি জন্য। পূর্ণসংখ্যার সাথে পৃথক পৃথক ডেটা উপস্থাপন করা সর্বদা সম্ভব , তবে এর অর্থ এই নয় যে ডেটা কেবল এই জাতীয় মান নিতে পারে।
ওয়াকিটাল্কি

-4

বিচ্ছিন্ন ডেটা সীমিতভাবে সীমাবদ্ধ মান সম্পর্কে এবং অব্যাহত ডেটা সম্পর্কে আলোচনা করে চিরসত্য মানগুলি সম্পর্কে .....


2
বিশদ যত্ন?
chl
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.