ডেটা সায়েন্স কি ডেটা মাইনিংয়ের মতো?


22

আমি নিশ্চিত যে এই ফোরামে আলোচিত হবে ডেটা বিজ্ঞানের বেশ কয়েকটি প্রতিশব্দ বা কমপক্ষে সম্পর্কিত ক্ষেত্র রয়েছে যেখানে বড় ডেটা বিশ্লেষণ করা হয়।

আমার বিশেষ প্রশ্নটি ডেটা মাইনিংয়ের ক্ষেত্রে। আমি কয়েক বছর আগে ডেটা মাইনিংয়ে স্নাতক শ্রেণি নিয়েছি। ডেটা সায়েন্স এবং ডেটা মাইনিংয়ের মধ্যে পার্থক্যগুলি কী কী এবং বিশেষত ডেটা মাইনিংয়ে দক্ষ হয়ে উঠার জন্য আমাকে আরও কী দেখার প্রয়োজন হবে?


আপনার প্রশ্নের দ্বিতীয় অংশ হিসাবে, আমি মেটাতে একটি আলোচনার প্রস্তাব দিয়েছি: মেটা.ডাটাসায়েন্স.স্ট্যাকেক্সেঞ্জ / ডকুমেন্টস / ৫/২। কীভাবে এটি পাওয়া যায় তা আপনার দক্ষতার উদ্বেগ জবাবদিহি করতে পারে বা সুযোগের মধ্যে থাকতে পারে তা কীভাবে আকার দিতে পারে।
ক্লেটন

উত্তর:


25

@ স্ট্যাটাস আরস আপনার প্রশ্নের উত্তরটির ভিত্তি তৈরি করতে শুরু করে অন্য একটি প্রশ্নে https : //datasज्ञान.stackexchange.com/questions/1/ what-characterises-the-differences-between-data-s विज्ञान- and- statistics :

  • ডেটা সংগ্রহ : ওয়েব স্ক্র্যাপিং এবং অনলাইন সমীক্ষা
  • ডেটা ম্যানিপুলেশন : অগোছালো ডেটা পুনরায় তৈরি করা এবং ভাষাগত এবং সামাজিক নেটওয়ার্ক ডেটা থেকে অর্থ বের করা
  • ডেটা স্কেল : অত্যন্ত বড় ডেটা সেটগুলির সাথে কাজ করা
  • ডেটা মাইনিং : অ্যালগরিদমিক কৌশলগুলির উপর জোর দিয়ে বৃহত, জটিল ডেটা সেটগুলিতে নিদর্শনগুলি সন্ধান করা
  • ডেটা যোগাযোগ : ভিজ্যুয়ালাইজেশনের মাধ্যমে "মেশিন-পঠনযোগ্য" ডেটাটিকে "মানব-পঠনযোগ্য" তথ্যে পরিণত করতে সহায়তা করে

সংজ্ঞা

ডেটা বিজ্ঞানীর টুলকিটে একটি আইটেম (বা দক্ষতা এবং অ্যাপ্লিকেশনগুলির সেট) হিসাবে দেখা যেতে পারে। আমি পছন্দ করি যে তিনি কীভাবে খাঁজকার সংজ্ঞাটি একধরণের বাণিজ্য-নির্দিষ্ট জার্গনে সংগ্রহ থেকে আলাদা করেন।

তবে, আমি মনে করি যে ডেটা মাইনিং মার্কিন-ইংরেজী কথাবার্তা সংজ্ঞায় ডেটা সংগ্রহের সমার্থক হবে ।

দক্ষ হয়ে উঠতে কোথায়? আমি মনে করি যে প্রশ্নটি বর্তমানে বিস্তৃত হিসাবে খুব বিস্তৃত এবং প্রাথমিকভাবে মতামত ভিত্তিক উত্তরগুলি প্রাপ্ত করবে। সম্ভবত আপনি যদি আপনার প্রশ্নটি পরিমার্জন করতে পারেন তবে আপনি কী জিজ্ঞাসা করছেন তা দেখতে আরও সহজ হতে পারে।


11

@ ক্লেটন যা পোস্ট করেছেন তা আমার কাছে সঠিক হিসাবে মনে হয়, সেই শর্তগুলির জন্য এবং "ডেটা মাইনিং" ডেটা বিজ্ঞানীর অন্যতম হাতিয়ার হিসাবে রয়েছে। তবে, আমি সত্যই "ডেটা সংগ্রহ" শব্দটি ব্যবহার করি নি এবং এটি "ডেটা মাইনিং" এর সমার্থক হিসাবে আমাকে আঘাত করে না।

আপনার প্রশ্নের আমার নিজস্ব উত্তর: না , শর্তাবলী এক নয়। সংজ্ঞাগুলি এই ক্ষেত্রে inিলে ,ালা হতে পারে, তবে আমি এই শর্তগুলি আন্তঃব্যবহারযোগ্য হিসাবে ব্যবহার করতে দেখিনি। আমার কাজে, আমরা কখনও কখনও তাদের লক্ষ্য বা পদ্ধতিগুলির মধ্যে পার্থক্য করতে ব্যবহার করি। আমাদের জন্য, আরও একটি হাইপোথিসিস পরীক্ষা করার বিষয়ে আরও বেশি, এবং সাধারণত কেবল সেই উদ্দেশ্যে ডেটা সংগ্রহ করা হয়। বিদ্যমান ডেটাগুলি অনুসন্ধানের বিষয়ে, কাঠামোটি অনুসন্ধান করা এবং সম্ভবত হাইপোথিসিস তৈরির বিষয়ে আরও বেশি। ডেটা মাইনিং অনুমান দিয়ে শুরু করতে পারে তবে এটি প্রায়শই খুব দুর্বল বা সাধারণ এবং আত্মবিশ্বাসের সাথে সমাধান করা কঠিন হতে পারে। (যথেষ্ট দীর্ঘ খনন করুন এবং আপনি কিছু পাবেন , যদিও এটি পাইরাইট হতে পারে))

তবে, "ডেটা মাইনিং" অন্তর্ভুক্ত করার জন্য আমরা একটি বৃহত শব্দ হিসাবে "ডেটা সায়েন্স" ব্যবহার করেছি। আমরা "ডেটা মডেলিং" সম্পর্কেও কথা বলি, যা আমাদের জন্য আগ্রহের সিস্টেমের জন্য একটি মডেল সন্ধানের জন্য যা ডেটা পাশাপাশি অন্যান্য জ্ঞান এবং লক্ষ্যগুলির উপর নির্ভর করে। কখনও কখনও এর অর্থ আসল ব্যবস্থাটি ব্যাখ্যা করে এমন গণিতের সন্ধানের চেষ্টা করা হয় এবং কখনও কখনও এর অর্থ এমন একটি ভবিষ্যদ্বাণীমূলক মডেল সন্ধান করা হয় যা কোনও উদ্দেশ্যে যথেষ্ট উপযুক্ত।


8

আমার উত্তর হবে না। আমি ডেটা মাইনিংকে ডেটা সায়েন্সের বিবিধ ক্ষেত্র হিসাবে বিবেচনা করি। ডেটা মাইনিং বেশিরভাগ প্রশ্নের উত্তর দেওয়ার পরিবর্তে প্রশ্ন উত্সের বিষয়ে বিবেচনা করা হয়। এটি প্রায়শই "নতুন কিছু সনাক্তকরণ" হিসাবে অভিহিত করা হয়, যখন ডেটা সায়েন্সের সাথে তুলনা করা হয়, যেখানে ডেটা সায়েন্টিস্ট তাদের শেষ ফলাফলগুলিতে পৌঁছতে সক্ষম হতে জটিল সমস্যাগুলি সমাধান করার চেষ্টা করে। তবে উভয় পদগুলির মধ্যে অনেকগুলি মিল রয়েছে। উদাহরণস্বরূপ..যদি আপনার একটি কৃষিজমি রয়েছে যেখানে আপনি আক্রান্ত গাছগুলি খুঁজে বের করার লক্ষ্য রাখেন..এখানে স্থানিক ডেটা মাইনিং এই কাজটি করার ক্ষেত্রে একটি গুরুত্বপূর্ণ ভূমিকা পালন করে Tএই সম্ভাবনা রয়েছে যে আপনি কেবল আক্রান্ত গাছগুলি খুঁজে না পেয়েই শেষ করতে পারেন here জমিতে তবে তারা যে পরিমাণে ক্ষতিগ্রস্থ হয়েছে তা ....... এটি এমন তথ্য যা ডেটা সায়েন্সের মাধ্যমে সম্ভব নয়।


আপনার উত্তরটি খুব সুন্দর, এবং খুব সুন্দর হ'ল যদি আপনি একটি সামান্য উদাহরণ যোগ করেন, যাতে ফলাফল খোলার এবং ফলাফলগুলি পৌঁছানোর চেষ্টা করার পরিবর্তে ডেটা মাইনিংয়ের সাথে নতুন কিছু আবিষ্কারের সাথে সম্পর্কিত হওয়ার বিষয়ে আপনার বক্তব্যকে জোর দেওয়া যায় ।
রুবেন্স

6

ডেটা মাইনিং এবং ডেটাসায়েন্সের মধ্যে অনেকগুলি ওভারল্যাপ রয়েছে। আমি বলব যে ডেটামাইনিংয়ের ভূমিকাযুক্ত ব্যক্তিরা ডেটা সংগ্রহ এবং উদারহিত, অসংগঠিত এবং বেশিরভাগ কাঁচা / বুনো ডেটাসেট থেকে বৈশিষ্ট্যগুলি আহরণের সাথে সম্পর্কিত। কিছু খুব গুরুত্বপূর্ণ ডেটা এক্সট্রাকশন করা কঠিন হতে পারে, বাস্তবায়ন সংক্রান্ত সমস্যাগুলি না করে তবে এর বৈদেশিক নিদর্শন থাকতে পারে।

যেমন। যদি 70 এর দশকে স্ক্যান করা এবং লিখিত ট্যাক্স রিটার্নগুলি থেকে লোকেরা গাড়ি বীমাগুলিতে লোকেরা বেশি সঞ্চয় করেছে কিনা তা জানতে মেশিন পড়ার জন্য আর্থিক তথ্য দেখার জন্য যদি আমার কারও প্রয়োজন হয়; একজন ডেটাামিনার পাওয়া ব্যক্তি হবে।

ব্রাজিলের টুইটগুলিতে নাইকের টুইটার প্রোফাইলের প্রভাব পরীক্ষা করার জন্য এবং প্রোফাইল থেকে মূল ইতিবাচক বৈশিষ্ট্যগুলি সনাক্ত করার জন্য আমার যদি কারও প্রয়োজন হয়, তবে আমি একজন ডেটাস্টিস্টের সন্ধান করব।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.