কিভাবে ডেটা মাইনিং সম্পর্কে পড়া শুরু করবেন?


14

আমি একজন নবজাতক যিনি ডেটা মাইনিং সম্পর্কে পড়া শুরু করতে যাচ্ছেন। আমার কাছে এআই এবং পরিসংখ্যান সম্পর্কে প্রাথমিক জ্ঞান রয়েছে। যেহেতু অনেকেই বলে যে ডেটা মাইনিংয়ে মেশিন লার্নিংও গুরুত্বপূর্ণ ভূমিকা পালন করে, তাই ডেটা মাইনিংয়ের আগে মেশিন লার্নিং সম্পর্কে পড়া দরকার?


1
ডেটা মাইনিং: জিয়াউই হান দ্বারা ধারণাগুলি এবং কৌশলগুলি একটি ভাল শুরু
aaronjg

উত্তর:


12

আমি নিজে এই পজিশনে কিছুটা থাকায় কিছুটা অন্তর্দৃষ্টি দেওয়ার চেষ্টা করব।

প্রথমত, পরিসংখ্যান শিক্ষার উপাদানগুলি ডাউনলোড করুন । এটি ক্যালকুলাস এবং লিনিয়ার বীজগণিত অনুমান করে এবং এটি খুব প্রযুক্তিগত হলেও এটি খুব ভালভাবে লেখাও রয়েছে।

দ্বিতীয়ত (বা প্রথমত) মেশিন শেখার বিষয়ে অ্যান্ড্রু এনগের টিউটোরিয়ালগুলি দেখুন ।

তৃতীয়ত, কিছু ডেটা পান এবং ডেটা বিশ্লেষণের চেষ্টা শুরু করুন। আপনাকে প্রশিক্ষণ এবং পরীক্ষা সেটগুলিতে বিভক্ত করতে হবে, এবং তারপরে প্রশিক্ষণ সেটে মডেলগুলি তৈরি করতে হবে এবং পরীক্ষার সেটটির বিপরীতে তাদের পরীক্ষা করতে হবে। আমি আর এর জন্য ক্যারেট প্যাকেজটি এইগুলির জন্য খুব দরকারী। এর পরে এর অনুশীলন, অনুশীলন অনুশীলন (প্রায় সব কিছুর মতো)।


1
আপনি গরিব মানুষকে চিরতরে দূরে সরিয়ে দেবেন!
নিল ম্যাকগুইগান

অ্যান্ডি এনজি'র কোর্সটি ২০১১ সালের পতনের সময় শিক্ষার্থীদের বিশ্বজুড়ে 'বিনামূল্যে এবং অনলাইনে অফার করা' হবে
আন্দ্রে হলজনার ২

5

টান, স্টেইনব্যাক, কুমার দ্বারা ডেটা মাইনিংয়ের পরিচিতি কুমার সেখানকার সেরা পরিচয় পুস্তক

http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367

আপনি আরও গভীর খনন করতে চাইলে ইওএসএল সংরক্ষণ করুন। এটি আরও একটি রেফারেন্স।


4

ডেটা মাইনিং বর্ণনামূলক বা ভবিষ্যদ্বাণীমূলক হতে পারে।

একদিকে, আপনি যদি বর্ণনামূলক ডেটা মাইনিংয়ে আগ্রহী হন, তবে মেশিন লার্নিং সাহায্য করবে না।

অন্যদিকে, আপনি যদি ভবিষ্যদ্বাণীপূর্ণ ডেটা মাইনিংয়ে আগ্রহী হন, তবে মেশিন লার্নিং আপনাকে বুঝতে সাহায্য করবে যে আপনি বোধগম্য ঝুঁকি হ্রাস করার সময় অজানা ঝুঁকি (ক্ষতি ফাংশনের প্রত্যাশা) হ্রাস করার চেষ্টা করেছেন: আপনি অতিরিক্ত চাপ, সাধারণীকরণের কথা মাথায় রাখবেন ত্রুটি এবং ক্রস-বৈধতা। উদাহরণস্বরূপ, ধারাবাহিকতার ক্ষেত্রে, সাইজের এর প্রশিক্ষণের নমুনার জন্য এনএন এমন হওয়া উচিত:এনkn

  • এনk যায় যখন অনন্তে যায়,n
  • এনkn 0 এ চলে যায় যখন অনন্তিতে যায়।n

3
এটি লক্ষণীয় যে কিছু লেখক এর দৈর্ঘ্যের উপর নির্ভর করে ডিএম এবং এমএল এর মধ্যে একটি পার্থক্য তৈরি করতে পছন্দ করে । আমি ব্যক্তিগতভাবে র‌্যাডফোর্ড নীলের পদ্ধতিকে পছন্দ করি, মেশিন লার্নিং এবং ডেটা মাইনিং সম্পর্কিত পরিসংখ্যানগত পদ্ধতি সম্পর্কে তাঁর কোর্সে : অনেকগুলি মেশিন লার্নিংয়ের সমস্যায় প্রচুর পরিমাণে ভেরিয়েবল থাকে, ডেটা মাইনিং অ্যাপ্লিকেশনগুলিতে প্রায়শই খুব বড় সংখ্যক কেস জড়িত। k/n
chl

3

আমি কেবল টম মিশেল দ্বারা ডেটা মাইনিং / মেশিন লার্নিংয়ের টিউটোরিয়ালগুলির খুব ভাল উত্স যোগ করি ।

তিনি এটিকে খুব স্পষ্টভাবে ব্যাখ্যা করেছেন এবং আপনি তাঁর উপস্থাপনাগুলি তার ওয়েবসাইট থেকে ডাউনলোড করতে পারেন (সেখানে তাঁর বক্তৃতাগুলি দেখার সাথে)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.