ডেটা মাইনিং, পরিসংখ্যান, মেশিন লার্নিং এবং এআইয়ের মধ্যে পার্থক্য কী?


208

ডেটা মাইনিং, পরিসংখ্যান, মেশিন লার্নিং এবং এআইয়ের মধ্যে পার্থক্য কী?

এটি কি সঠিক হবে যে তারা 4 টি ক্ষেত্র খুব অনুরূপ সমস্যাগুলি সমাধান করার চেষ্টা করছে তবে বিভিন্ন পদ্ধতির সাথে? তাদের ঠিক কী মিল রয়েছে এবং কোথায় তাদের পার্থক্য রয়েছে? তাদের মধ্যে যদি একধরনের শ্রেণিবিন্যাস হয় তবে তা কী হবে?

অনুরূপ প্রশ্ন আগে জিজ্ঞাসা করা হয়েছিল কিন্তু আমি এখনও এটি পাই না:

উত্তর:


109

এগুলির মধ্যে যথেষ্ট ওভারল্যাপ রয়েছে তবে কিছু ভিন্নতা তৈরি করা যেতে পারে। প্রয়োজনীয়তার জন্য, আমাকে কিছু জিনিস অতিরিক্ত সরল করতে হবে বা অন্যকে সংক্ষিপ্ত-ক্রেফট দিতে হবে, তবে আমি এই ক্ষেত্রগুলি সম্পর্কে কিছুটা বোঝার জন্য যথাসাধ্য চেষ্টা করব।

প্রথমত, কৃত্রিম বুদ্ধি বাকি থেকে মোটামুটি আলাদা distin এআই হ'ল কীভাবে বুদ্ধিমান এজেন্ট তৈরি করা যায় তার গবেষণা study অনুশীলনে, এটি কোনও কম্পিউটারকে কিভাবে বুদ্ধিমান এজেন্ট হিসাবে (কোনও ব্যক্তি বলুন) কাজ হিসাবে আচরণ করতে এবং সঞ্চালনের জন্য প্রোগ্রাম করা যায়। এই না আছে এ সব লার্নিং বা আনয়ন জড়িত, এটা ঠিক একটি উপায় 'একটি ভাল বিস্বাদ নির্মাণ' হতে পারে। উদাহরণস্বরূপ, এআই অ্যাপ্লিকেশনগুলিতে চলমান প্রক্রিয়াগুলি নিরীক্ষণ এবং নিয়ন্ত্রণের জন্য প্রোগ্রাম অন্তর্ভুক্ত করা হয়েছে (উদাহরণস্বরূপ, দিকটি এটিকে খুব কম মনে হলে বৃদ্ধি করুন)। লক্ষ্য করুন যে এআই অভিশাপ-কাছাকাছি অন্তর্ভুক্ত করতে পারে কিছু যে একটি মেশিন, তাই যতদিন এটা করে না 'বোকার মত'।

তবে বাস্তবে, বেশিরভাগ কার্যগুলিতে যেগুলি বুদ্ধি প্রয়োজন তার জন্য অভিজ্ঞতা থেকে নতুন জ্ঞান প্রেরণ করার ক্ষমতা প্রয়োজন। সুতরাং, এআই এর মধ্যে একটি বৃহত অঞ্চল হ'ল মেশিন লার্নিং । কোনও কম্পিউটার প্রোগ্রাম অভিজ্ঞতার কাছ থেকে কিছু কাজ শিখতে বলা হয় যদি কিছু কার্য সম্পাদনের পরিমাপ অনুসারে টাস্কটিতে তার পারফরম্যান্স অভিজ্ঞতার সাথে উন্নত হয়। মেশিন লার্নিংয়ের সাথে অ্যালগরিদমগুলির অধ্যয়ন জড়িত যা স্বয়ংক্রিয়ভাবে তথ্য আহরণ করতে পারে (অর্থাত্, অন-লাইন মানব নির্দেশিকা ব্যতীত)। এটা অবশ্যই ক্ষেত্রে যে এই পদ্ধতি কিছু ধারনা থেকে সরাসরি উদ্ভূত, অথবা দ্বারা, শাস্ত্রীয় পরিসংখ্যান অনুপ্রাণিত অন্তর্ভুক্ত, কিন্তু তারা না আছেহতে। একইভাবে এআই-তেও, মেশিন লার্নিং খুব বিস্তৃত এবং প্রায় সব কিছু অন্তর্ভুক্ত করতে পারে, যতক্ষণ না এর সাথে কিছু প্ররোচক উপাদান থাকে। একটি মেশিন লার্নিং অ্যালগরিদমের উদাহরণ কালম্যান ফিল্টার হতে পারে।

ডেটা মাইনিং এমন একটি অঞ্চল যা মেশিন লার্নিং (এবং কিছু, এছাড়াও পরিসংখ্যান থেকেও) এর অনুপ্রেরণা এবং কৌশলগুলির বেশিরভাগ অংশ নিয়েছে, তবে এটি বিভিন্ন প্রান্তে ফেলেছে । ডেটা মাইনিং কোনও ব্যক্তি একটি নির্দিষ্ট পরিস্থিতিতে, একটি নির্দিষ্ট ডেটা সেটে, একটি লক্ষ্য মাথায় রেখে সম্পন্ন করে। সাধারণত, এই ব্যক্তি মেশিন লার্নিংয়ে বিকাশ করা বিভিন্ন প্যাটার্ন স্বীকৃতি কৌশলগুলির শক্তি অর্জন করতে চান। বেশিরভাগ ক্ষেত্রেই ডেটা সেটটি বিশাল , জটিল এবং / অথবা বিশেষ সমস্যা হতে পারে(যেমন পর্যবেক্ষণের তুলনায় আরও পরিবর্তনশীল রয়েছে)। সাধারণত লক্ষ্যটি হ'ল এমন একটি অঞ্চলে প্রাথমিক প্রাথমিক অন্তর্দৃষ্টি আবিষ্কার / জেনারেট করা যেখানে ইতিমধ্যে সামান্য জ্ঞান ছিল, বা ভবিষ্যতের পর্যবেক্ষণগুলি নির্ভুলভাবে পূর্বাভাস দিতে সক্ষম হওয়া। তদ্ব্যতীত, ডেটা মাইনিং পদ্ধতিগুলি হয় 'অকার্যকর' (আমরা উত্তরটি আবিষ্কার করতে পারি না) বা 'তদারকি' (আমরা উত্তরটি জানি - ভবিষ্যদ্বাণী জানি)। নোট করুন যে লক্ষ্যটি সাধারণত অন্তর্নিহিত ডেটা উত্পাদন প্রক্রিয়া সম্পর্কে আরও পরিশীলিত বোঝার বিকাশ না করে। সাধারণ ডেটা মাইনিং কৌশলগুলিতে ক্লাস্টার বিশ্লেষণ, শ্রেণিবদ্ধকরণ এবং রিগ্রেশন ট্রি এবং নিউরাল নেটওয়ার্ক অন্তর্ভুক্ত থাকবে।

আমি মনে করি এই সাইটে পরিসংখ্যানগুলি কী তা বোঝাতে আমার বেশি কিছু বলার দরকার নেই , তবে সম্ভবত আমি কয়েকটি জিনিস বলতে পারি। শাস্ত্রীয় পরিসংখ্যান (এখানে আমি উভয় ঘনত্ববাদী এবং বায়েশিয়ান) অর্থ গণিতের মধ্যে একটি সাব-বিষয়। আমি সম্ভাব্যতা সম্পর্কে আমরা যা জানি এবং অপ্টিমাইজেশন সম্পর্কে আমরা কী জানি তার মোড়কে একেবারে বড় ভাবি। যদিও গাণিতিক পরিসংখ্যানগুলি কেবল তদন্তের প্লাটোনিক অবজেক্ট হিসাবে অধ্যয়ন করা যেতে পারে, তবে এটি বেশিরভাগই গণিতের অন্যান্য, বিরল অংশগুলির চেয়ে বেশি ব্যবহারিক হিসাবে এবং চরিত্রে প্রয়োগ হয়। যেমন (এবং উপরে ডেটা মাইনিংয়ের বিপরীতে), এটি বেশিরভাগ নির্দিষ্ট কিছু ডেটা উত্পাদন প্রক্রিয়া আরও ভালভাবে বোঝার দিকে নিযুক্ত করা হয়। সুতরাং, এটি সাধারণত একটি আনুষ্ঠানিকভাবে নির্দিষ্ট মডেল দিয়ে শুরু হয়, এবং এর থেকে শোরগোলের দৃষ্টান্তগুলি থেকে মডেলটি সঠিকভাবে বের করে আনার পদ্ধতি (যেমন অনুমান - কিছু লোকসান ফাংশন অনুকূল করে) এবং অন্যান্য সম্ভাবনা (যেমন, নমুনা বিতরণের পরিচিত বৈশিষ্ট্যের উপর ভিত্তি করে ইনফারেন্সগুলি) থেকে আলাদা করতে সক্ষম হয়ে এগুলি থেকে প্রক্রিয়াগুলি উত্পন্ন হয়। প্রোটোটাইপিকাল স্ট্যাটিস্টিকাল কৌশল হ'ল রিগ্রেশন ression


1
আমি বেশিরভাগ পোস্টের সাথে একমত, তবে আমি বলব এআই বেশিরভাগ সময় বুদ্ধিমান এজেন্ট (বুদ্ধি কী, যাইহোক?) তৈরি করার চেষ্টা করে না, তবে যৌক্তিক এজেন্ট তৈরি করার চেষ্টা করে না। যৌক্তিক দ্বারা এটি "বিশ্বের সম্পর্কে উপলব্ধ জ্ঞান দেওয়া সর্বোত্তম" বোঝানো হয়। যদিও স্বীকার করা যায় যে চূড়ান্ত লক্ষ্যটি একটি সাধারণ সমস্যা সমাধানের মতো like
কুত্স্কেম

3
দুঃখিত, আমি এখনও ডেটা মাইনিং এবং মেশিন লার্নিংয়ের মধ্যে পার্থক্যটি পাই না। আমি যা দেখছি তা থেকে, ডেটা মাইনিং = মেশিন লার্নিংয়ের অকার্যকর শেখা। নতুন অন্তর্দৃষ্টি আবিষ্কার সম্পর্কে মেশিন লার্নিং অকার্যকর নয়?
dtc

একজন অনামী ব্যবহারকারী এই ব্লগপোস্টটি একটি পরামিতি ভিত্তিতে ডেটা মাইনিং এবং মেশিন লার্নিংয়ের মধ্যে পার্থক্যগুলি ছিন্ন করার জন্য একটি টেবিলের জন্য প্রস্তাব করেছিলেন ।
গাং

1
Common data mining techniques would include cluster analyses, classification and regression trees, and neural networks.এটি বলা কি নিরাপদ যে কোনও নিউরাল নেটওয়ার্ক ডেটা মাইনিংয়ে ব্যবহৃত একটি মেশিন লার্নিং সরঞ্জামের একটি উদাহরণ, একটি ক্লাস্টার বিশ্লেষণের সাথে তুলনা করে যা ডেটা মাইনিংয়ের জন্য ব্যবহৃত মেশিন লার্নিংয়ের জন্য ডিজাইন করা হয়নি এমন একটি অ্যালগরিদম ?
t0mgs

টমগ্রানট-স্কালোসুব বাস্তবে বাস্তবে এগুলি সমস্তই অস্পষ্ট। আমি বলব যে নিউরাল নেটওয়ার্কগুলি অবশ্যই এমএল, এবং অবশ্যই ক্লাস্টার বিশ্লেষণ এবং কার্ট এমএল গবেষকগণ দ্বারা অধ্যয়ন করা হয়। আমি ধারণাগুলি কিছুটা পরিষ্কার এবং স্বতন্ত্র করার চেষ্টা করি, তবে এই বিভাগগুলির মধ্যে সত্যই একটি উজ্জ্বল রেখা নেই।
গাং

41

অন্যান্য উত্তরগুলির অনেকগুলিই মূল বিষয়গুলি coveredেকে ফেলেছে তবে আপনি কোনও উপস্থিতি থাকলে এবং যেভাবে আমি এটি দেখতে পাই তার জন্য একটি শ্রেণিবিন্যাসের জন্য জিজ্ঞাসা করেছিলেন, যদিও এগুলি প্রতিটি নিজস্ব অনুচ্ছেদে রয়েছে, এখানে শ্রেনীক্রম রয়েছে যেহেতু প্রত্যেকটি বিল্ডিংয়ের পরে এখনও কেউ উল্লেখ করেছেন বলে মনে হয় না আগেরটি

পরিসংখ্যানগুলি কেবল সংখ্যাগুলি সম্পর্কে এবং ডেটাটির পরিমাণ নির্ধারণ করে। তথ্যের প্রাসঙ্গিক বৈশিষ্ট্য সন্ধানের জন্য অনেকগুলি সরঞ্জাম রয়েছে তবে এটি খাঁটি গণিতের খুব কাছাকাছি।

ডেটা মাইনিং স্ট্যাটিস্টিক্স পাশাপাশি ডেটাগুলিতে লুকানো নিদর্শনগুলি খুঁজে পাওয়ার জন্য অন্যান্য প্রোগ্রামিং পদ্ধতিগুলি ব্যবহার করে যাতে আপনি কিছু ঘটনা ব্যাখ্যা করতে পারেন । ডেটা মাইনিং প্রকৃতপক্ষে কিছু ডেটাতে কী ঘটছে সে সম্পর্কে স্বজ্ঞাততা তৈরি করে এবং প্রোগ্রামিংয়ের চেয়ে গণিতের দিকে এখনও কিছুটা বেশি, তবে উভয়ই ব্যবহার করে।

মেশিন লার্নিং কিছু ডেটার পিছনে কী ঘটছে তার মডেলগুলি তৈরি করতে ডেটা মাইনিং কৌশল এবং অন্যান্য শেখার অ্যালগরিদম ব্যবহার করে যাতে এটি ভবিষ্যতের ফলাফলগুলির পূর্বাভাস দিতে পারে। অ্যালগরিদমের অনেকের জন্য ম্যাথ ভিত্তি, তবে এটি প্রোগ্রামিংয়ের দিকে বেশি।

কৃত্রিম বুদ্ধিমত্তা মেশিন লার্নিং দ্বারা নির্মিত এবং অন্যান্য উপায় সম্পর্কে বিশ্ব সম্পর্কে যুক্তিযুক্ত এবং এটি কোনও গেম খেলছে বা রোবট / গাড়ি চালাচ্ছে কিনা তা বুদ্ধিমান আচরণের জন্ম দেয় models কৃত্রিম বুদ্ধিমত্তার কীভাবে বিশ্বব্যাপী মডেলকে প্রভাবিত করবে এবং সেই লক্ষ্যটি সর্বোত্তমভাবে অর্জন করবে এমন ক্রিয়াগুলি চয়ন করে তা পূর্বাভাস দিয়ে অর্জনের কিছু লক্ষ্য রয়েছে। খুব প্রোগ্রামিং ভিত্তিক।

সংক্ষেপে

  • পরিসংখ্যান সংখ্যা নির্ধারণ করে
  • ডেটা মাইনিং নিদর্শনগুলি ব্যাখ্যা করে
  • মেশিন লার্নিং মডেলগুলির সাথে ভবিষ্যদ্বাণী করে
  • কৃত্রিম বুদ্ধি আচরণ এবং কারণগুলি

এখন এটি বলা হচ্ছে, কিছু এআই সমস্যা থাকবে যা কেবল এআইতে পড়ে এবং একইভাবে অন্যান্য ক্ষেত্রগুলির ক্ষেত্রে পড়ে তবে আজ বেশিরভাগ আকর্ষণীয় সমস্যাগুলি (উদাহরণস্বরূপ স্ব-গাড়ি চালনা) সহজেই এবং সঠিকভাবে এগুলি বলা যেতে পারে। আশা করি এটি আপনার সম্পর্কে জিজ্ঞাসা করা তাদের মধ্যে সম্পর্ক সরিয়ে দেয়।


আপনি কি কখনও WEKA বা RapidMiner ব্যবহার করেছেন? উদাহরণস্বরূপ, EM তথ্য খনির মধ্যে রয়েছে এবং এটি একটি মডেল প্রয়োগ করে app তা ছাড়া মারিয়ানা সফফার দ্বারা প্রদত্ত সংজ্ঞাটি দেখুন এবং এটি আপনার উত্তরের সাথে তুলনা করুন। কয়েক বছর আগে আমি বিশপ এবং রাসেল / নরভিগ পড়েছি, তবে যতদূর মনে পড়ে আমি ডিএফের কথা মনে করি না। মারিয়ানা সফার দ্বারা আরও উপযুক্ত। বিটিডব্লিউ ডেটা মাইনিং ("কেবল") জ্ঞান আবিষ্কারের আগে বড় পদক্ষেপ। পর্যাপ্ত পরামিতি সহ অ্যালগরিদম ব্যবহার করার সময় ডেটা মাইনিং কেবল ডেটা এবং পরবর্তী তথ্যের জন্য দখল করে। ডেটা মাইনিং নিদর্শনগুলি ব্যাখ্যা করতে পারে না।
স্মৃতিবিহীন

না, @ স্মারক, এআই এর এই সংজ্ঞা মারিয়ানার তুলনায় রাসেল এবং
নরভিগের সাথে অনেকটা সামঞ্জস্যপূর্ণ

2
আমি মনে করি পরিসংখ্যানের বিবরণটি খারাপ নয়; কোয়ান্টেফিন্ফ সংখ্যাগুলি জাতীয় পরিসংখ্যান বিভাগের পরিসংখ্যানগুলির পরিসংখ্যান, তবে এটি পরিসংখ্যান বিজ্ঞানের মতো নয় যা তথ্যগুলির জন্য মডেল তৈরি করে, তাদের পরামিতিগুলি অনুমান করে এবং অনুমান করে makes এছাড়াও, ডেটা মাইনিং এবং মেশিন লার্নিংয়ের মধ্যে সম্পর্ক উল্টো হয়; ডেটা সায়েন্স মেশিন লার্নিং কৌশল ব্যবহার করে, অন্যভাবে নয়। কেন ভ্যান হারেনের উত্তরও দেখুন।
রিচার্ড হার্ডি

25
  • পরিসংখ্যানগুলি সম্ভাব্য মডেলগুলির সাথে সম্পর্কিত, বিশেষত ডেটা ব্যবহার করে এই মডেলগুলির উপর দৃষ্টি নিবদ্ধ করে।
  • মেশিন লার্নিং কিছু ডেটা দেওয়া হলে একটি নির্দিষ্ট ফলাফলের পূর্বাভাস দেওয়ার সাথে সম্পর্কিত। প্রায় কোনও যুক্তিসঙ্গত মেশিন শেখার পদ্ধতি একটি আনুষ্ঠানিক সম্ভাব্য মডেল হিসাবে তৈরি করা যেতে পারে, সুতরাং এই অর্থে মেশিন লার্নিংটি পরিসংখ্যানের মতোই একই রকম, তবে এটির মধ্যে পার্থক্য রয়েছে যে এটি সাধারণত প্যারামিটারের অনুমানগুলি (কেবলমাত্র পূর্বাভাস) সম্পর্কে চিন্তা করে না এবং এটি ফোকাস করে গণনা দক্ষতা এবং বড় ডেটাসেটের উপর।
  • ডেটা মাইনিং হ'ল (যেমন আমি এটি বুঝতে পারি) প্রয়োগকৃত মেশিন লার্নিং। এটি বড় ডেটাসেটগুলিতে মেশিন লার্নিং অ্যালগরিদম স্থাপনের ব্যবহারিক দিকগুলিতে আরও বেশি মনোনিবেশ করে। এটি মেশিন লার্নিংয়ের সাথে অনেক মিল।
  • কৃত্রিম বুদ্ধিমত্তা কম্পিউটারে বুদ্ধি (কিছু স্বেচ্ছাসেবী সংজ্ঞা) এর সাথে সম্পর্কিত যে কোনও জিনিস। সুতরাং, এটি অনেক কিছুই অন্তর্ভুক্ত ।

সাধারণভাবে, সম্ভাব্য মডেলগুলি (এবং এইভাবে পরিসংখ্যান) একটি মেশিনে আনুষ্ঠানিকভাবে জ্ঞান এবং বোঝার কাঠামোর সবচেয়ে কার্যকর উপায় হিসাবে প্রমাণিত হয়েছে যে অন্য তিনটি (এআই, এমএল এবং ডিএম) আজ বেশিরভাগের উপক্ষেত্র পরিসংখ্যান। পরিসংখ্যানের ছায়া বাহুতে পরিণত হওয়ার প্রথম শৃঙ্খলা নয় ... (অর্থনীতি, মনোবিজ্ঞান, জৈববৈজ্ঞানিক ইত্যাদি)


5
@ কেন - অর্থনীতির মনোবিজ্ঞান বা এআইকে পরিসংখ্যানের ছায়া বাহিনী হিসাবে বর্ণনা করা ভুল হবে - এমনকি এই ক্ষেত্রগুলি আগ্রহী এমন অনেক সমস্যার বিশ্লেষণ করতে যদি পরিসংখ্যানগুলির প্রত্যেকের মধ্যে ভারীভাবে ব্যবহৃত হয় তবে আপনি ওষুধকে ছায়া বাহু হিসাবে প্রস্তাব করতে চান না এমনকি বেশিরভাগ চূড়ান্ত সিদ্ধান্তে ডেটা বিশ্লেষণের উপর নির্ভর করে এমনকি পরিসংখ্যানগুলির।
এমপেসার

@ কেন - এটি একটি দুর্দান্ত প্রতিক্রিয়া তবে এআই অন্যান্য জিনিসগুলির মধ্যে কী রয়েছে তা আপনি আরও সম্পূর্ণরূপে বর্ণনা করতে পারেন। উদাহরণস্বরূপ, icallyতিহাসিকভাবে এআই-অ-সম্ভাব্য মডেলগুলির বিশ্লেষণের প্রচুর পরিমাণেও অন্তর্ভুক্ত করেছে (উদাঃ উত্পাদন সিস্টেম, সেলুলার অটোমেটা ইত্যাদি, যেমন নীওয়েল এবং সাইমন 1972 দেখুন)। অবশ্যই এই জাতীয় সমস্ত মডেল কিছু সম্ভাব্য মডেলগুলির কেসকে সীমাবদ্ধ করে চলেছে, তবে এত দিন পর্যন্ত এগুলি একটি শিরাতে বিশ্লেষণ করা হয়নি।
এমপেসার

4
ডেটা মাইনিং মেশিন লার্নিংয়ের বাইরে চলে যায়, কারণ এটি আসলে জড়িত থাকে যে কীভাবে ডেটা সংরক্ষণ করা হয় এবং অ্যালগোরিদমকে আরও দ্রুত তৈরি করতে সূচিযুক্ত করা হয়। এটি বেশিরভাগ এআই, এমএল এবং পরিসংখ্যান থেকে পদ্ধতি গ্রহণ এবং দক্ষ এবং চতুর ডেটা ম্যানেজমেন্ট এবং ডেটা বিন্যাস কৌশলগুলির সাথে তাদের সংমিশ্রণ হিসাবে চিহ্নিত করা যেতে পারে। এটিতে ডেটা পরিচালনা জড়িত না হলে আপনি প্রায়শই একে "মেশিন লার্নিং" বলতে পারেন। তবে কিছু কাজ রয়েছে, বিশেষত "অকার্যকর", যেখানে কোনও "লার্নিং" জড়িত নেই, তবে কোনও ডেটা ম্যানেজমেন্ট নেই, এগুলিকে এখনও "ডেটা মাইনিং" (ক্লাস্টারিং, আউটলেট সনাক্তকরণ) বলা হয়।
অ্যানি-মৌসে

21

আমরা বলতে পারি যে এগুলি সমস্ত সম্পর্কিত, তবে তারা সমস্ত আলাদা জিনিস। যদিও আপনি তাদের মধ্যে জিনিসগুলিতে সাধারণ জিনিস রাখতে পারেন যেমন পরিসংখ্যান এবং ডেটা মাইনিংয়ের ক্ষেত্রে আপনি ক্লাস্টারিং পদ্ধতি ব্যবহার করেন।
আমি প্রতিটি সংক্ষেপে সংজ্ঞায়িত করার চেষ্টা করি:

  • পরিসংখ্যানগুলি মূলত শাস্ত্রীয় গাণিতিক পদ্ধতির উপর ভিত্তি করে একটি পুরাতন শৃঙ্খলা data যা ডেটা মাইনিংয়ের ক্ষেত্রে একইভাবে ব্যবহার করা যেতে পারে যা কখনও কখনও শ্রেণিবদ্ধকরণ এবং জিনিসগুলিকে শ্রেণিবদ্ধকরণ করে।

  • ডেটা মাইনিং বিল্ডিং মডেলগুলি সমন্বিত করে যাতে নিদর্শনগুলি সনাক্ত করে যা আমাদেরকে পরিস্থিতি শ্রেণিবদ্ধ করতে বা প্রচুর পরিমাণে তথ্য বা কারণগুলির পূর্বে ভবিষ্যদ্বাণী করতে দেয়।

  • কৃত্রিম বুদ্ধিমত্তা (চেক মারভিন মিনস্কি *) হ'ল শৃঙ্খলা যা মস্তিষ্ক প্রোগ্রামিং পদ্ধতিগুলির সাথে কীভাবে কাজ করে তা অনুকরণ করার চেষ্টা করে, উদাহরণস্বরূপ দাবা খেলা এমন একটি প্রোগ্রাম তৈরি করা।

  • মেশিন লার্নিং কম্পিউটারে জ্ঞান তৈরি এবং এটি কোনও আকারে সংরক্ষণের কাজ; সেই ফর্মটি গাণিতিক মডেল, অ্যালগরিদম ইত্যাদি হতে পারে ... এমন কিছু যা নিদর্শনগুলি সনাক্ত করতে সহায়তা করতে পারে।


2
না, আধুনিক এআইয়ের বেশিরভাগ অংশ "মস্তিষ্ককে অনুকরণ করুন" পদ্ধতির অনুসরণ করে না। এটি "যুক্তিযুক্ত এজেন্ট" তৈরিতে মনোনিবেশ করে যা ইউটিলিটি সর্বাধিকতর করতে পরিবেশে কাজ করে এবং মেশিন লার্নিংয়ের সাথে আরও ঘনিষ্ঠভাবে সম্পর্কিত related রাসেল এবং নরভিগের বইটি দেখুন।
nealmcb

1
আমি আপনার সংজ্ঞায় এমএল এবং ডেটা মাইনিংয়ের মধ্যে পার্থক্য দেখতে পাচ্ছি না
মার্টিন থোমা

16

আমি মেশিন-লার্নিংয়ের সাথে সর্বাধিক পরিচিত - ডেটা মাইনিং অক্ষ - সুতরাং আমি এতে মনোনিবেশ করব:

মেশিন লার্নিং অ-মানক পরিস্থিতিতে, যেমন নন-আইডির ডেটা, সক্রিয় শেখা, অর্ধ-তত্ত্বাবধানে শেখা, কাঠামোগত ডেটা (উদাহরণস্বরূপ স্ট্রিং বা গ্রাফের জন্য) সহ শিখতে আগ্রহী হতে আগ্রহী। এমএলও যা শেখা যায় তার তাত্ত্বিক সীমানায় আগ্রহী হতে থাকে, যা প্রায়শই ব্যবহৃত অ্যালগরিদমগুলির জন্য ভিত্তি তৈরি করে (যেমন সহায়তা ভেক্টর মেশিন)। এমএল একটি বায়েশিয়ান প্রকৃতির হতে থাকে।

ডেটা মাইনিং এমন ডেটাগুলির নিদর্শনগুলি খুঁজতে আগ্রহী যা আপনি ইতিমধ্যে জানেন না। আমি নিশ্চিত নই যে পরিসংখ্যানগুলিতে অনুসন্ধানের ডেটা বিশ্লেষণের তুলনায় উল্লেখযোগ্যভাবে আলাদা, যদিও মেশিন লার্নিংয়ে সাধারণত সমাধানের জন্য আরও সু-সংজ্ঞায়িত সমস্যা রয়েছে।

এমএল ছোট ডেটাসেটগুলিতে বেশি আগ্রহী হওয়ার প্রবণতা দেখায় যেখানে অতিরিক্ত ফিটিং সমস্যা এবং ডেটা মাইনিং যেখানে বৃহত্তর স্ক্রিনের ডেটাসেটগুলিতে সমস্যাটি ডেটার পরিমাণের সাথে মোকাবেলা করতে আগ্রহী।

পরিসংখ্যান এবং মেশিন লার্নিং ডেটা মাইনারদের দ্বারা ব্যবহৃত অনেকগুলি প্রাথমিক সরঞ্জাম সরবরাহ করে।


"এমএল ছোট ডাটাসেটগুলিতে আরও আগ্রহী হতে থাকে" এর সাথে আমি একমত নই।
মার্টিন থোমা

ছোট ডেটাসেটগুলির সাথে ডেটা মাইনিং অনেক বেশি কঠিন হয়ে ওঠে কারণ এটি একটি উত্সাহী অ্যাসোসিয়েশন সন্ধানের সুযোগ বাড়ে (এবং এটি সনাক্তকরণে অসুবিধা বাড়িয়ে তোলে)। ছোট ছোট ডেটাসেটের ইনফারেন্সগুলির সাথে যতটা সম্ভব কম পছন্দ বেছে নিন অনেক বেশি নিরাপদ হতে থাকে।
ডিকরান মার্শুপিয়াল

13

এটি আমার গ্রহণ এখানে। দুটি খুব বিস্তৃত বিভাগ দিয়ে শুরু করা যাক:

  • এমনকি স্মার্ট হওয়ার ভান করে এমন কিছু হ'ল কৃত্রিম বুদ্ধিমত্তা (এমএল এবং ডিএম সহ)।
  • তথ্যের সংক্ষিপ্তসার যুক্ত যে কোনও কিছু হ'ল পরিসংখ্যান , যদিও আপনি সাধারণত এটি কেবল এমন পদ্ধতিগুলিতে প্রয়োগ করেন যা ফলাফলের বৈধতার দিকে মনোযোগ দেয় (প্রায়শই এমএল এবং ডিএম ব্যবহার করা হয়)

এমএল এবং ডিএম উভয়ই সাধারণত এআই এবং পরিসংখ্যান উভয়ই থাকে কারণ তারা সাধারণত উভয় থেকেই প্রাথমিক পদ্ধতি জড়িত। এখানে কিছু পার্থক্য রয়েছে:

  • মধ্যে মেশিন লার্নিং , আপনি একটি আছে ভাল-সংজ্ঞায়িত উদ্দেশ্য (সাধারণত ভবিষ্যদ্বাণী )
  • মধ্যে ডেটা মাইনিং , আপনি মূলত উদ্দেশ্য "have আমি হয়নি না আগে জানা "

অতিরিক্তভাবে, ডেটা মাইনিংয়ে সাধারণত আরও অনেক বেশি ডেটা ম্যানেজমেন্ট জড়িত থাকে , কীভাবে দক্ষ সূচক কাঠামো এবং ডাটাবেসগুলিতে ডেটা সংগঠিত করতে হয়।

দুর্ভাগ্যক্রমে, তারা আলাদা করা এত সহজ নয়। উদাহরণস্বরূপ, "অপ্রচারিত শিক্ষণ" রয়েছে, যা প্রায়শই এমএল-র চেয়ে ডিএমের সাথে আরও ঘনিষ্ঠভাবে জড়িত, কারণ এটি লক্ষ্যটির দিকে অনুকূল করতে পারে না। অন্যদিকে, ডিএম পদ্ধতিগুলি মূল্যায়ন করা শক্ত (আপনি কী জানেন না এমন কিছুকে আপনি কীভাবে রেট করবেন?) এবং প্রায়শই কিছু তথ্য রেখে মেশিন লার্নিংয়ের মতো একই কাজগুলিতে মূল্যায়ন করা হয় । তবে এটি সাধারণত তাদের মেশিন লার্নিং পদ্ধতির চেয়ে খারাপ কাজ করতে দেখাবে যা প্রকৃত মূল্যায়ন লক্ষ্যটির দিকে অনুকূল করতে পারে।

তদতিরিক্ত, তারা প্রায়শই সংমিশ্রণে ব্যবহৃত হয়। উদাহরণস্বরূপ, ডেটা মাইনিং পদ্ধতি (বলুন, ক্লাস্টারিং বা অকার্যকর আউটলেট সনাক্তকরণ) ডেটা প্রিপ্রোসেস করার জন্য ব্যবহৃত হয়, তারপরে আরও ভাল শ্রেণিবদ্ধীদের প্রশিক্ষণের জন্য মেশিন লার্নিং পদ্ধতি প্রিপ্রোসেসড ডেটাতে প্রয়োগ করা হয়।

মেশিন লার্নিং সাধারণত মূল্যায়ন করা অনেক সহজ: স্কোর বা শ্রেণি পূর্বাভাসের মতো একটি লক্ষ্য রয়েছে। আপনি নির্ভুলতা গণনা করতে পারেন এবং পুনরায় স্মরণ করতে পারেন। ডেটা মাইনিংয়ে, বেশিরভাগ মূল্যায়ন কিছু তথ্য (যেমন শ্রেণির লেবেল) রেখে এবং তারপরে পরীক্ষা করে দেখা হয় যে আপনার পদ্ধতিটি একই কাঠামোটি আবিষ্কার করেছে কিনা। এটি অর্থে নিষ্পাপ, আপনি যেমন ধরে নিয়েছেন যে শ্রেণিবদ্ধ লেবেলগুলি ডেটার কাঠামোটিকে সম্পূর্ণভাবে এনকোড করে; আপনি আসলে ডেটা মাইনিং অ্যালগরিদমকে শাস্তি দেন যা আপনার ডেটাতে নতুন কিছু আবিষ্কার করে। অপ্রত্যক্ষভাবে - এটির মূল্যায়ন করার আরেকটি উপায়, কীভাবে আবিষ্কারকৃত কাঠামোটি আসল এমএল অ্যালগরিদমের কার্যকারিতা উন্নত করে (উদাহরণস্বরূপ ডেটা ভাগ করার সময় বা বহিরাগতদের অপসারণ করার সময়)। তবুও, এই মূল্যায়নটি বিদ্যমান ফলাফলগুলি পুনরুত্পাদন করার উপর ভিত্তি করে তৈরি করা হয় , যা আসলে ডেটা মাইনিংয়ের উদ্দেশ্য নয় ...


1
আপনার প্রতিক্রিয়া খুব অন্তর্দৃষ্টিযুক্ত। আমি বিশেষত শেষ অনুচ্ছেদের প্রশংসা করি, এমএল এর কার্যকারিতা মূল্যায়ন এবং ডিএম এর কার্যকারিতা মূল্যায়নের পার্থক্য সম্পর্কে।
জাস্টিস

8

যা বলা হয়েছে তাতে আমি কিছু পর্যবেক্ষণ যুক্ত করব ...

যুক্তি-মত বা সংবেদনশীল-উপস্থিত কার্যকলাপগুলি করার জন্য, কোনও কার্য পরিকল্পনা করা থেকে শুরু করে বা অন্যান্য সত্তাগুলির সাথে সহযোগিতা করা থেকে শুরু করে, হাঁটাচলা করার জন্য অঙ্গ পরিচালনা করতে শেখা পর্যন্ত যে কোনও কিছু করার জন্য মেশিনগুলির সাথে সম্পর্কিত, এআই একটি বিস্তৃত শব্দ। একটি অতিশয় সংজ্ঞাটি হ'ল এআই কম্পিউটার সম্পর্কিত যে কোনও কিছুই যা আমরা এখনও ভাল করতে জানি না। (একবার আমরা কীভাবে এটি ভালভাবে করতে হয় তা জানার পরে, এটি সাধারণত নিজস্ব নাম পায় এবং আর "এআই" থাকে না))

এটি আমার ধারণা, উইকিপিডিয়া থেকে পৃথক, প্যাটার্ন রিকগনিশন এবং মেশিন লার্নিং একই ক্ষেত্র, তবে পূর্ববর্তীটি কম্পিউটার-বিজ্ঞান ভাবেন দ্বারা অনুশীলন করা হয় এবং পরবর্তীকালে পরিসংখ্যানবিদ এবং প্রকৌশলী দ্বারা অনুশীলন করা হয়। (অনেকগুলি প্রযুক্তিগত ক্ষেত্র বিভিন্ন উপগোষ্ঠী দ্বারা অনুসন্ধান করা হয়, যারা প্রায়শই তাদের নিজস্ব লিঙ্গো এবং মানসিকতাকে টেবিলে নিয়ে আসে))

ডেটা মাইনিং, আমার মনে যেভাবেই হোক না কেন, মেশিন লার্নিং / প্যাটার্ন রিকগনিশন (যে ডেটাগুলির সাথে কাজ করে এমন কৌশলগুলি) নেয় এবং সেগুলি ডেটাবেস, অবকাঠামো এবং ডেটা বৈধতা / পরিষ্কারের কৌশলগুলিতে আবৃত করে।


6
মেশিন লার্নিং এবং প্যাটার্নের স্বীকৃতি একই জিনিস নয়, মেশিন লার্নিং রিগ্রেশন এবং কার্যকারণ সূচনা ইত্যাদির মতো বিষয়েও আগ্রহী Pat প্যাটার্ন স্বীকৃতি মেশিন লার্নিংয়ের আগ্রহের সমস্যাগুলির মধ্যে একটি only আমার জানা মেশিন লার্নিংয়ের বেশিরভাগ লোক কম্পিউটার বিজ্ঞান বিভাগে।
ডিকরান মার্সুপিয়াল

2
@ ডিকরান সম্মত হন তবে এমএল এবং জনসংযোগ প্রায়শই আলাদা করে রাখা হয় এবং ডেটা বিশ্লেষণের অনুরূপ বিষয়ের অধীনে উপস্থাপন করা হয়। আমার পছন্দের বইটি প্রকৃতপক্ষে ক্রিস্টোফ এম বিশপের কাছ থেকে প্যাটার্ন রিকগনিশন এবং মেশিন লার্নিং । জেএসএস, জেএমপি / etg3w1 এ জন মেইনডোনাল্ডের একটি পর্যালোচনা এখানে দেওয়া হয়েছে
chl

আমি আরও অনুভব করি যে সিএস বিশ্বে "প্যাটার্ন স্বীকৃতি" এর চেয়ে "মেশিন লার্নিং" শব্দটি অনেক বেশি সাধারণ।
বায়ারজ

এছাড়াও এখানে অনুভব করুন যে এমএল আরও একটি সিএস শব্দ।
কার্ল মরিসন

3

দুঃখজনকভাবে, এই অঞ্চলের মধ্যে পার্থক্য মূলত যেখানে তাদের শেখানো হয়: পরিসংখ্যানগুলি গণিতের বিভাগগুলিতে, আইআই, কম্পিউটার বিজ্ঞানের বিভাগগুলিতে মেশিন লার্নিংয়ের উপর ভিত্তি করে তৈরি হয় এবং ডেটা মাইনিং আরও প্রয়োগ করা হয় (সফ্টওয়্যার সংস্থাগুলি দ্বারা উন্নত ব্যবসায় বা বিপণন বিভাগ দ্বারা ব্যবহৃত হয়) ।

প্রথমত এআই (যদিও এটি কোনও বুদ্ধিমান সিস্টেমের অর্থ হতে পারে) traditionতিহ্যগতভাবে পরিসংখ্যানগত অনুমানের চেয়ে লজিক ভিত্তিক পদ্ধতির (যেমন বিশেষজ্ঞ সিস্টেমগুলি) বোঝায়। পরিসংখ্যানগুলির উপর ভিত্তি করে পরিসংখ্যানগুলির একটি খুব ভাল তাত্ত্বিক বোঝাপড়া ছিল, পরীক্ষামূলক বিজ্ঞানের দৃ applied় প্রয়োগের অভিজ্ঞতার সাথে, যেখানে একটি স্পষ্ট বৈজ্ঞানিক মডেল রয়েছে এবং উপলব্ধ সীমিত পরীক্ষামূলক তথ্যাদি মোকাবেলায় পরিসংখ্যানের প্রয়োজন। ফোকাসটি প্রায়শই খুব অল্প ডেটা সেট থেকে সর্বাধিক তথ্য ছড়িয়ে দেওয়ার দিকে থাকে। এছাড়াও গাণিতিক প্রমাণগুলির প্রতি পক্ষপাতিত্ব রয়েছে: আপনি আপনার পদ্ধতির বিষয়ে কিছু প্রমাণ না করে আপনি প্রকাশিত হবেন না। এর অর্থ হ'ল বিশ্লেষণ স্বয়ংক্রিয় করতে কম্পিউটারের ব্যবহারের পরিসংখ্যান পিছিয়ে গেছে। আবার, প্রোগ্রামিং জ্ঞানের অভাব পরিসংখ্যানবিদদের বৃহত্তর সমস্যাগুলিতে কাজ করতে বাধা দিয়েছে যেখানে গণনাগত সমস্যাগুলি গুরুত্বপূর্ণ হয়ে ওঠে (জিপিইউগুলি বিবেচনা করুন এবং হ্যাডোপের মতো বিতরণকারী সিস্টেমগুলি বিবেচনা করুন)) আমি বিশ্বাস করি যে বায়োইনফরম্যাটিকসের মতো ক্ষেত্রগুলি এখন এই দিকে আরও পরিসংখ্যানকে সরিয়ে নিয়েছে। পরিশেষে আমি বলব যে পরিসংখ্যানবিদরা আরও সংশয়ী গোছা: তারা দাবি করেন না যে আপনি পরিসংখ্যান দিয়ে জ্ঞান আবিষ্কার করেছেন - বরং একজন বিজ্ঞানী একটি অনুমান নিয়ে এসেছেন, এবং পরিসংখ্যানবিদদের কাজটি এই অনুমানটি ডেটা দ্বারা সমর্থিত কিনা তা পরীক্ষা করা। মেশিন লার্নিং সিএস বিভাগগুলিতে শেখানো হয়, যা দুর্ভাগ্যক্রমে উপযুক্ত গণিত শেখায় না: মাল্টিভারিয়াল ক্যালকুলাস, সম্ভাবনা, পরিসংখ্যান এবং অপ্টিমাইজেশান সাধারণ বিষয় নয় ... কারও কাছে উদাহরণ থেকে শেখার মতো অস্পষ্ট 'গ্ল্যামারাস' ধারণা রয়েছে ...পরিসংখ্যান শেখার উপাদানসমূহ পৃষ্ঠা 30। এর অর্থ এই যে দাঁড়ায় যে খুব কম তাত্ত্বিক বোঝাপড়া এবং অ্যালগরিদমের বিস্ফোরণ রয়েছে কারণ গবেষকরা সবসময় এমন কিছু ডেটাসেট খুঁজে পেতে পারেন যার উপর তাদের অ্যালগরিদম আরও ভাল প্রমাণিত হয়। এমএল গবেষকরা পরের বড় বিষয়টির পিছনে তাড়া করার জন্য হাইপগুলির বিশাল পর্যায় রয়েছে: নিউরাল নেটওয়ার্ক, গভীর শিক্ষা ইত্যাদি Unfortunately দুর্ভাগ্যক্রমে সিএস বিভাগগুলিতে আরও অনেক বেশি অর্থ রয়েছে (গুগল, মাইক্রোসফ্ট, আরও বাজারজাত 'শেখার' সাথে ভাবুন) তাই আরও সংশয়ী পরিসংখ্যানবিদদের উপেক্ষা করা হয়। অবশেষে, সেখানে এক এম্পিরিসিস্ট বেন্ট রয়েছে: মূলত একটি অন্তর্নিহিত বিশ্বাস রয়েছে যে আপনি যদি অ্যালগরিদমে যথেষ্ট পরিমাণ ডেটা ফেলে দেন তবে এটি সঠিক ভবিষ্যদ্বাণীগুলি 'শিখবে'। যদিও আমি এমএল-এর বিরুদ্ধে পক্ষপাতদুষ্ট, এমএল-তে একটি মৌলিক অন্তর্দৃষ্টি রয়েছে যা পরিসংখ্যানবিদরা এড়িয়ে গেছেন: কম্পিউটার পরিসংখ্যান প্রয়োগে বৈপ্লবিক পরিবর্তন আনতে পারে।

দুটি উপায় রয়েছে- ক) স্ট্যান্ডার্ড টেস্ট এবং মডেলগুলির স্বয়ংক্রিয়করণ। যেমন মডেলের ব্যাটারি চালানো (লিনিয়ার রিগ্রেশন, এলোমেলো বন, ইত্যাদি ইনপুটগুলির বিভিন্ন সংমিশ্রণ চেষ্টা করে, প্যারামিটার সেটিংস ইত্যাদি)। এটি সত্যিই ঘটেনি - যদিও আমি সন্দেহ করি যে কাগল প্রতিযোগীরা তাদের নিজস্ব অটোমেশন কৌশল বিকাশ করে। খ) বিশাল পরিসংখ্যানগুলিতে প্রমিত পরিসংখ্যানের মডেল প্রয়োগ করা: উদাহরণস্বরূপ গুগল ট্রান্সলেট, সুপারিশকারী সিস্টেম ইত্যাদির কথা চিন্তা করুন (কেউ দাবি করছেন না যে, উদাহরণস্বরূপ লোকেরা অনুবাদ করে বা এর মতো প্রস্তাব দেয়..কিন্তু এটি একটি দরকারী সরঞ্জাম)। অন্তর্নিহিত পরিসংখ্যানের মডেলগুলি সোজাসাপ্টা কিন্তু বিলিয়ন ডেটা পয়েন্টগুলিতে এই পদ্ধতিগুলি প্রয়োগ করার ক্ষেত্রে প্রচুর গণনামূলক সমস্যা রয়েছে।

ডেটা মাইনিং এই দর্শনের চূড়ান্ত ... তথ্য থেকে জ্ঞান আহরণের স্বয়ংক্রিয় পদ্ধতিগুলি বিকাশ করা। তবে এটির আরও ব্যবহারিক পদ্ধতি রয়েছে: মূলত এটি আচরণগত তথ্যগুলিতে প্রয়োগ করা হয়, যেখানে কোনও বৈজ্ঞানিক তত্ত্ব নেই (বিপণন, জালিয়াতি সনাক্তকরণ, স্প্যাম ইত্যাদি) এবং লক্ষ্যটি বৃহত পরিমাণে ডেটা বিশ্লেষণ স্বয়ংক্রিয় করে তোলা: সন্দেহ নেই যে পরিসংখ্যানবিদদের দল পর্যাপ্ত সময় দেওয়া আরও ভাল বিশ্লেষণ উত্পাদন করতে পারে, তবে এটি কম্পিউটার ব্যবহার করা আরও কার্যকর। ডি ডি হ্যান্ড ব্যাখ্যা করার সাথে সাথে এটি হ'ল মাধ্যমিক তথ্যগুলির বিশ্লেষণ - ডেটা যা যে কোনও উপায়ে লগ ইন করা তথ্যের চেয়ে দৃ experiment়ভাবে পরীক্ষামূলক নকশায় একটি বৈজ্ঞানিক প্রশ্নের উত্তর দেওয়ার জন্য সংগ্রহ করা হয়েছে। ডেটা মাইনিংয়ের পরিসংখ্যান এবং আরও অনেক কিছু, ডি হ্যান্ড

সুতরাং আমি সংক্ষেপে বলব যে traditionalতিহ্যবাহী এআই পরিসংখ্যানের চেয়ে যুক্তি ভিত্তিক, মেশিন লার্নিং তত্ত্ব ব্যতীত পরিসংখ্যান এবং পরিসংখ্যানগুলি 'কম্পিউটারবিহীন পরিসংখ্যান' এবং ডেটা মাইনিং হ'ল ন্যূনতম ব্যবহারকারীর হস্তক্ষেপের সাথে পরিসংখ্যান বিশ্লেষণের জন্য স্বয়ংক্রিয় সরঞ্জামগুলির বিকাশ।


এই উত্তরটি প্রচুর পরিমাণে ঘোড়দৌড় করে, তাই এটি অনুসরণ করা শক্ত এবং অযথা দীর্ঘ but তবে এটি সত্যিই এই চিহ্নটি হিট করে যে পার্থক্যগুলি অন্য যে কোনও কিছুর চেয়ে শৃঙ্খলাবদ্ধ traditionsতিহ্য এবং জোর দিয়ে more
ত্রিপরিটো

1

ডেটা মাইনিং হিডেন নিদর্শন বা অজানা জ্ঞান আবিষ্কার সম্পর্কে, যা লোকেদের সিদ্ধান্ত নেওয়ার জন্য ব্যবহার করা যেতে পারে।

মেশিন লার্নিং নতুন বিষয়গুলিকে শ্রেণিবদ্ধ করার জন্য একটি মডেল শেখার বিষয়ে।


যন্ত্রটি কি কেবল শ্রেণিবিন্যাস সম্পর্কে শিখছে ? অন্যান্য লক্ষ্য পরিবেশন করতে মেশিন লার্নিং ব্যবহার করা যাবে না?
গুং

@ gung একেবারে না আইএমএইচও, এমএল-এর সর্বাধিক বৈশিষ্ট্যযুক্ত উপ-ক্ষেত্র এবং শক্তিবৃদ্ধি শেখা হ'ল এটি আমি শ্রেণিবদ্ধের ভিত্তিতে নয়, লক্ষ্য অর্জনের উপর ভিত্তি করে বলব।
nbro

@ এনব্রো, এই মন্তব্যটি ওপিকে একটি সংকেত বলে মনে করা হয়েছিল যে তারা এমএলকে কত সংকীর্ণভাবে সংজ্ঞায়িত করছে।
গাং

0

আমার মতে, কৃত্রিম বুদ্ধিমত্তাকে মেশিন লার্নিং, ডেটা মাইনিং, প্যাটার্ন রিকগনিশন ইত্যাদি ক্ষেত্রগুলির "সুপারসেট" হিসাবে বিবেচনা করা যেতে পারে my

  • পরিসংখ্যান, গণিতের একটি ক্ষেত্র যা এআইতে ব্যবহৃত সমস্ত গাণিতিক মডেল, কৌশল এবং উপপাদ্য অন্তর্ভুক্ত।

  • মেশিন লার্নিং এআইয়ের একটি ক্ষেত্র যা উপরে উল্লিখিত পরিসংখ্যানের মডেলগুলি প্রয়োগ করে এবং উপাত্তকে বোঝায় যে ক্লাস্টারিং এবং শ্রেণিবদ্ধকরণের মতো ভবিষ্যদ্বাণীমূলক বিশ্লেষণ করে all

  • ডেটা মাইনিং হ'ল বিজ্ঞান যা উপাত্ত থেকে দরকারী এবং গুরুত্বপূর্ণ নিদর্শনগুলি বের করার জন্য উপরের সমস্ত কৌশলগুলি (মেশিন লার্নিং মূলত) ব্যবহার করে। ডেটা মাইনিংয়ের ক্ষেত্রে সাধারণত বিশাল ডেটাসেটগুলি, অর্থাত্ বিগ ডেটা থেকে দরকারী তথ্য বের করা do


-1

কীভাবে: শিখতে শেখানোর মেশিনগুলি

ডেটাতে অর্থপূর্ণ নিদর্শনগুলি সনাক্ত করুন: ডেটা মাইনিং

জ্ঞাত নিদর্শনগুলি থেকে ফলাফলের পূর্বাভাস: এমএল

কাঁচা ডেটা পুনরায় তৈরি করতে নতুন বৈশিষ্ট্যগুলি সন্ধান করুন: এআই

এই পাখির মস্তিষ্কের সত্যিকারের সহজ সংজ্ঞা দরকার।


-1

প্রায়শই ডেটা মাইনিং ভবিষ্যতের কিছু ডেটা "ভবিষ্যদ্বাণী" করার চেষ্টা করে বা কেন কিছু ঘটে তার "ব্যাখ্যা" করার চেষ্টা করে।

আমার চোখে হাইপোথিসিসের বৈধতা দেওয়ার জন্য পরিসংখ্যানগুলি বেশি ব্যবহৃত হয়। তবে এটি একটি বিষয়গত আলোচনা।

পরিসংখ্যানবিদদের এবং ডেটা মাইনারদের মধ্যে একটি স্পষ্ট পার্থক্য তারা দেখছেন সংক্ষিপ্ত পরিসংখ্যানগুলির ধরণের মধ্যে পাওয়া যাবে।

পরিসংখ্যানগুলি প্রায়শই নিজেকে আর ও নির্ভুলতার মধ্যে সীমাবদ্ধ করে রাখে, যখন ডেটা মাইনাররা এউসি, আরওসি বক্ররেখা, উত্তোলন কার্ভ ইত্যাদির দিকে নজর রাখবে এবং ব্যয় সম্পর্কিত নির্ভুলতা বক্ররেখাকে নিযুক্ত করেও উদ্বিগ্ন হতে পারে।

ডেটা মাইনিং প্যাকেজগুলি (উদাহরণস্বরূপ ওপেন সোর্স ওয়েকা) ইনপুট নির্বাচন, ভেক্টর মেশিনগুলির শ্রেণিবিন্যাস, সমর্থন ইত্যাদির কৌশলগুলি তৈরি করেছে, যখন এগুলি বেশিরভাগ অংশের জন্য জেএমপির মতো পরিসংখ্যান প্যাকেজগুলিতে অনুপস্থিত। আমি সম্প্রতি যখন জেএমপি জনগণের কাছ থেকে "ডেটা মাইনিং ইন জ্যাম্প" বিষয়ে কোর্স করলাম এবং এটি দৃশ্যত শক্তিশালী প্যাকেজ হলেও কিছু প্রয়োজনীয় ডেটা মাইনিং প্রাক / পোস্ট / মিড কৌশলগুলি কেবল অনুপস্থিত। ইনপুট নির্বাচনটি ম্যানুয়ালি করা হয়েছিল, তথ্যের মধ্যে অন্তর্দৃষ্টি পেতে, এখনও ডেটা মাইনিংয়ের ক্ষেত্রে, বড় ডেটাতে স্মার্টলি, অ্যালগরিদমগুলি প্রকাশ করা এবং স্বয়ংক্রিয়ভাবে কী বেরিয়ে আসে তা দেখার জন্য আপনার ইচ্ছা intention কোর্সটি স্পষ্টতই পরিসংখ্যান ব্যক্তিরা শিখিয়েছিলেন, যা উভয়ের মধ্যে বিভিন্ন মানসিকতার উপর জোর দেয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.