বিযুক্ত ডেটা এবং একটানা উপাত্তের মধ্যে পার্থক্য কী?
বিযুক্ত ডেটা এবং একটানা উপাত্তের মধ্যে পার্থক্য কী?
উত্তর:
বিযুক্ত ডেটা কেবলমাত্র নির্দিষ্ট মান নিতে পারে। সম্ভাব্য এই মানগুলির অসীম সংখ্যা থাকতে পারে তবে প্রতিটি স্বতন্ত্র এবং এর মধ্যে কোনও ধূসর অঞ্চল নেই। বিবিধ ডেটা সংখ্যায়িক হতে পারে - আপেলের সংখ্যার মতো - তবে এটিও শ্রেণিবদ্ধ হতে পারে - যেমন লাল বা নীল, বা পুরুষ বা মহিলা, বা ভাল বা খারাপ।
অবিচ্ছিন্ন ডেটা সংজ্ঞায়িত পৃথক মানগুলিতে সীমাবদ্ধ নয়, তবে অবিচ্ছিন্ন পরিসরে কোনও মান দখল করতে পারে। যে কোনও দুটি ধারাবাহিক ডেটা মানগুলির মধ্যে অপরিসীম সংখ্যা থাকতে পারে। অবিচ্ছিন্ন ডেটা সবসময় মূলত সংখ্যাসূচক থাকে।
এটি কখনও কখনও এমন সংখ্যক ডেটা চিকিত্সা করে তোলে যা সঠিকভাবে এক ধরণের অন্য হিসাবে থাকে। উদাহরণস্বরূপ, উচ্চতার মতো কিছু অবিচ্ছিন্ন, তবে প্রায়শই আমরা ক্ষুদ্র পার্থক্যগুলি সম্পর্কে সত্যই বেশি যত্ন করি না এবং পরিবর্তে গ্রুপ হাইটগুলি বেশ কয়েকটি বিচ্ছিন্ন বিনগুলিতে পরিণত করি । বিপরীতে, যদি আমরা কিছু পরিমাণে স্বতন্ত্র সত্তা - ধানের শীষ, বা দেরী বা অর্থনীতির পেনিগুলি গণনা করি - তবে আমরা 2,000,006 এবং 2,000,008 কে অত্যন্ত গুরুত্বপূর্ণ মূল্য হিসাবে বিবেচনা না করে বরং তার পরিবর্তে নিকটস্থ পয়েন্ট হিসাবে বিবেচনা করতে পারি আনুমানিক ধারাবাহিকতা।
এটি কখনও কখনও সংখ্যার ডেটাগুলিকে শ্রেণীবদ্ধ হিসাবে বিবেচনা করতেও কার্যকর হতে পারে, যেমন: কম ওজন, সাধারণ, স্থূলকায়। এটি সাধারণত অন্য ধরণের বিন্যাস।
ধারাবাহিক তথ্যটিকে অবিচ্ছিন্ন হিসাবে বিবেচনা করা খুব কমই বোধগম্য হয়।
ডেটা সর্বদা বিযুক্ত থাকে। n
একটি ভেরিয়েবলের মানগুলির নমুনা দেওয়া , ভেরিয়েবল গ্রহণ করতে পারে এমন স্বতন্ত্র মানের সর্বাধিক সংখ্যার সমান n
। এই উদ্ধৃতি দেখুন
সমস্ত প্রকৃত নমুনা স্পেস পৃথক, এবং সমস্ত পর্যবেক্ষণযোগ্য এলোমেলো ভেরিয়েবলের বিযুক্ত বিলি রয়েছে। অবিচ্ছিন্ন বিতরণ একটি গাণিতিক নির্মাণ, গাণিতিক চিকিত্সার জন্য উপযুক্ত, তবে ব্যবহারিকভাবে পর্যবেক্ষণযোগ্য নয়। ইজেজি পিটম্যান (১৯ 1979,, পৃ। ২)
একটি ভেরিয়েবলের ডেটা সাধারণত র্যান্ডম ভেরিয়েবল থেকে আঁকা বলে ধরে নেওয়া হয়। এলোমেলো পরিবর্তনশীল একটি সীমার উপরে অবিচ্ছিন্ন থাকে যদি সম্ভাব্য মানগুলির অসীম সংখ্যা থাকে যা ভেরিয়েবলটি পরিসরের যে কোনও দুটি পৃথক পয়েন্টের মধ্যে নিতে পারে। উদাহরণস্বরূপ, উচ্চতা, ওজন এবং সময় সাধারণত ধ্রুবক হিসাবে ধরে নেওয়া হয়। অবশ্যই, এই ভেরিয়েবলগুলির কোনও পরিমাপ চূড়ান্তভাবে নির্ভুল এবং কিছুটা অর্থে পৃথক হবে।
অর্ডার করা (অর্থাত্ অর্ডিনাল), আনর্ডারড (অর্থাত্ নামমাত্র)
এবং বাইনারি ডিসক্রিট ভেরিয়েবলের মধ্যে পার্থক্য করা দরকারী ।
কিছু প্রাথমিক পাঠ্যপুস্তক একটি অবিচ্ছিন্ন ভেরিয়েবলকে একটি সংখ্যার ভেরিয়েবলকে বিভ্রান্ত করে। উদাহরণস্বরূপ, একটি কম্পিউটার গেমের স্কোর সংখ্যাযুক্ত হলেও এটি আলাদা।
কিছু প্রাথমিক পাঠ্যপুস্তক অবিচ্ছিন্ন ভেরিয়েবলের সাথে একটি অনুপাতের ভেরিয়েবলকে বিভ্রান্ত করে। একটি কাউন্ট ভেরিয়েবল একটি অনুপাতের পরিবর্তনশীল, তবে এটি অবিচ্ছিন্ন নয়।
প্রকৃত অনুশীলনে, একটি পরিবর্তনশীল প্রায়শই ধারাবাহিক হিসাবে বিবেচিত হয় যখন এটি যথেষ্ট পরিমাণে বিভিন্ন মানকে গ্রহণ করতে পারে।
তাপমাত্রা অবিচ্ছিন্ন। এটি 23 ডিগ্রি, 23.1 ডিগ্রি, 23.100004 ডিগ্রি হতে পারে।
যৌনতা বিচ্ছিন্ন। আপনি কেবল পুরুষ বা মহিলা হতে পারেন (যাই হোক না কেন শাস্ত্রীয় চিন্তায়)। 1, 2 ইত্যাদি ইত্যাদির মতো আপনি পুরো সংখ্যার সাথে কিছু উপস্থাপন করতে পারেন
পার্থক্যটি গুরুত্বপূর্ণ কারণ অনেক পরিসংখ্যান এবং ডেটা মাইনিং অ্যালগরিদমগুলি এক ধরণের পরিচালনা করতে পারে তবে অন্যটি নয়। উদাহরণস্বরূপ নিয়মিত প্রতিরোধের জন্য, ওয়াই অবশ্যই অবিচ্ছিন্ন হতে হবে। লজিস্টিক রিগ্রেশনে ওয়াই আলাদা।
বিযুক্ত ডেটা কেবল নির্দিষ্ট মান নিতে পারে।
উদাহরণ: একটি ক্লাসে শিক্ষার্থীর সংখ্যা (আপনার অর্ধেক ছাত্র থাকতে পারে না)।
অবিচ্ছিন্ন ডেটা এমন ডেটা যা কোনও মান নিতে পারে (একটি সীমার মধ্যে)
উদাহরণ:
ডাটাবেসের ক্ষেত্রে, আমরা সর্বদা ডেটাটি আলাদা করে রাখি এমনকি তথ্যের প্রকৃতি অবিচ্ছিন্ন। আমি কেন ডেটা প্রকৃতির উপর জোর দেওয়া উচিত? আমাদের এমন ডেটা বিতরণ করা উচিত যা ডেটা বিশ্লেষণে আমাদের সহায়তা করতে পারে। যদি তথ্যের প্রকৃতি অবিচ্ছিন্ন থাকে তবে আমি আপনাকে ধারাবাহিক বিশ্লেষণ করে সেগুলি ব্যবহার করার পরামর্শ দিই।
অবিচ্ছিন্ন এবং বিযুক্তির একটি উদাহরণ নিন: এমপি 3। এমনকি "শব্দ" প্রকারের সাদৃশ্যটি যদি ডিজিটাল ফর্ম্যাট দ্বারা সঞ্চিত থাকে। আমাদের এটিকে সর্বদা উপমা উপায়ে বিশ্লেষণ করা উচিত।
একদিকে, ব্যবহারিক দৃষ্টিকোণ থেকে আমি জেরোমি অ্যাংলিমের উত্তরের সাথে একমত নই। শেষ পর্যন্ত আমরা বেশিরভাগ সময় বিচ্ছিন্ন ভেরিয়েবলগুলির সাথে ডিল করি - যদিও তাত্ত্বিক দিক থেকে তারা অবিরত - এবং শ্রেণিবিন্যাসের জন্য এটির প্রকৃত প্রভাব রয়েছে। স্ট্রোবিলের কাগজটি স্মরণ করুন যা ইঙ্গিত করে যে এলোমেলো বনগুলি একাধিক কাটিয়া পয়েন্ট (উচ্চতর নির্ভুলতা তবে সম্ভাব্য অনুরূপ প্রকৃতি) সহ ভেরিয়েবলের প্রতি পক্ষপাতদুষ্ট। আমার ব্যক্তিগত অভিজ্ঞতা থেকে সম্ভাব্য নিউরাল নেটওয়ার্কগুলি যখন বৈষম্যগুলি একই ধরণের (অর্থাত্ ক্রমাগত) না হয় তবে ভিন্ন ভিন্ন যথার্থতা উপস্থাপন করতে পারে। অন্যদিকে, তাত্ত্বিক দৃষ্টিভঙ্গি থেকে শাস্ত্রীয় শ্রেণিবিন্যাস (যেমন, ধারাবাহিক, পৃথক, নামমাত্র ইত্যাদি), আইএমএইচও, ডান। আমার মতে আমি এম 5 অ্যালগোরিদম বর্ণনা করে কুইনলানের কাগজের উত্স নাম, যা 'রেজিস্ট্রার', এটি একটি দুর্দান্ত পছন্দ। সুতরাং সংজ্ঞা এবং ক্রমাগত বনাম পৃথক পৃথকগুলির প্রভাব 'পরিবেশের' উপর নির্ভর করে প্রাসঙ্গিক।
refs:
কুইনলান জেআর (1992)। অবিচ্ছিন্ন ক্লাস নিয়ে শিখছি। ইন: এআই-তে 5 তম অস্ট্রেলিয়ান যৌথ সম্মেলন। সিডনি (অস্ট্রেলিয়া), 343–348।
স্ট্রোবল সি।, বোলেস্টিক্স এ.এল., জেলিস এ।, এবং হথর্ন টি। (2007)। বায়বীয় এলোমেলো বন পরিবর্তনশীল গুরুত্বের পদক্ষেপগুলি: চিত্র, উত্স এবং একটি সমাধান। বিএমসি বায়োইনফরম্যাটিকস, 8, 25. ডওই: 10.1186 / 1471-2105-8-25
বিচ্ছিন্ন ডেটা নির্দিষ্ট মানগুলি নিয়ে থাকে, যখন ক্রমাগত ডেটা পৃথক মানগুলিতে সীমাবদ্ধ থাকে না।
বিবিধ ডেটা স্বতন্ত্র এবং এর মধ্যে কোনও ধূসর অঞ্চল নেই, যখন অবিচ্ছিন্ন ডেটা অবিচ্ছিন্ন ডাটা মানের চেয়ে কোনও মান দখল করে।
পৃথক ডেটা তারা নির্দিষ্ট মান নিতে পারে he এগুলি সংখ্যাসূচক।
বিচ্ছিন্ন তথ্য কেবলমাত্র পূর্ণসংখ্যার মানগুলিতে গ্রহণ করতে পারে তবে অবিচ্ছিন্ন ডেটা যে কোনও মান গ্রহণ করতে পারে। উদাহরণস্বরূপ, প্রতি বছর কোনও হাসপাতালের দ্বারা ক্যান্সার করা রোগীদের সংখ্যা পৃথক তবে আপনার ওজন অবিচ্ছিন্ন। কিছু ডেটা অবিচ্ছিন্ন তবে একটি পৃথক উপায়ে যেমন আপনার বয়স meas 31, আপনার বয়স হিসাবে রিপোর্ট করা সাধারণ।