ডেটা মাইনিং সফটওয়্যার সরঞ্জামগুলির একটি সমীক্ষা


15

যদিও আমি ইঞ্জিনিয়ার হিসাবে প্রশিক্ষণ পেয়েছি, তবে আমি দেখতে পাচ্ছি যে আমি ডেটা মাইনিংয়ের প্রতি আরও আগ্রহী হয়ে উঠছি। এখনই আমি ক্ষেত্রটি আরও তদন্ত করার চেষ্টা করছি। বিশেষত, আমি বুঝতে চাই যে বিভিন্ন বিভাগের সফ্টওয়্যার সরঞ্জামগুলি বিদ্যমান এবং কোন সরঞ্জামগুলি প্রতিটি বিভাগে উল্লেখযোগ্য এবং কেন। (দ্রষ্টব্য যে আমি "সেরা" সরঞ্জামগুলি বলিনি, কেবল উল্লেখযোগ্যগুলি যাতে আমরা শিখা যুদ্ধ শুরু করি না)) বিশেষত ওপেন-সোর্স এবং অবাধে উপলভ্য যে সরঞ্জামগুলি নোট করুন - যদিও এর অর্থ এটি গ্রহণ করবেন না আমি কেবল ওপেন সোর্স এবং ফ্রিতে আগ্রহী।


1
আমি এটি একটি সম্প্রদায়ের উইকি হতে পরামর্শ দিই।
তাল গ্যালি

একটি হোমওয়ার্ক প্রশ্নের মতো শোনায়
নীল ম্যাকগুইগান

@ টাল অবশ্যই, এখন রূপান্তরিত।

@ এল চিফ - এটি একটি বিস্তৃত এবং সাধারণ প্রশ্ন ... তবে আমি ভয় করি যে এটি কোনও হোমওয়ার্কের প্রশ্ন নয়।
জন বেরিম্যান

উত্তর:


7

এটি সম্ভবত আপনি সর্বাধিক বিস্তৃত তালিকা পাবেন: mloss.org


এটি যদিও মেশিন-লার্নিংয়ে ফোকাস করা হয়েছে, যা এআইয়ের মতোই ডেটা মাইনিংয়ের সম্পর্কিত ক্ষেত্র হিসাবে দেখা যেতে পারে। যদিও সাধারণত এটি সমার্থক ব্যবহার হয়, কারণ ডেটা মাইনিংয়ের ক্ষেত্রে "ভবিষ্যদ্বাণী" হ'ল অন্যতম গুরুত্বপূর্ণ চ্যালেঞ্জ। তবে ডেটা মাইনিংয়ের ক্ষেত্রে "লার্নিং" এর চেয়েও বেশি কিছু রয়েছে।
কিট আছে - অ্যানি-মউসে

7

একটু দেখো

  • ওয়েকা (জাভা, শ্রেণিবিন্যাসে শক্তিশালী)
  • কমলা (পাইথন স্ক্রিপ্টিং, বেশিরভাগ শ্রেণিবিন্যাস)
  • জিএনইউ আর (আর ভাষা, কিছুটা ভেক্টর টেবিল ভিত্তিক, মেশিন লার্নিং টাস্কভিউ এবং রাটাল ইউআই দেখুন)
  • ELKI (জাভা, ক্লাস্টারিং এবং আউটিলার সনাক্তকরণে শক্তিশালী, স্পিডআপগুলির জন্য সূচক কাঠামো সমর্থন, অ্যালগরিদম তালিকা )
  • মাহাউট (জাভা, হাদুপের অন্তর্ভুক্ত, যদি আপনার কাছে একটি ক্লাস্টার এবং বিশাল ডেটা সেট থাকে)

এবং ডেটা সেটগুলির জন্য ইউসিআই মেশিন লার্নিং সংগ্রহস্থল


1
আপনি তালিকায় রেড-আর যুক্ত করতে পারেন ( কমলাতে
আম্রো

আমি আর ডাউনলোড করেছি এবং এখন এটি নিয়ে খেলছি।
জন বেরিম্যান

@ আম্রো ধন্যবাদ! তবে ম্যাক প্ল্যাটফর্মে এটি পাওয়া যায় না, যদি না আমি ভুল করি?
chl

আমি কোনও ম্যাক ব্যবহারকারী নই, তবে আমি মনে করি লিনাক্স বিল্ডটি আপনার পক্ষে কাজ করতে পারে (আপনাকে সমস্ত পাইথন নির্ভরতা ম্যানুয়ালি ইনস্টল করতে হবে): red-r.org/forum/topic.php?id=22#post-76
Amro

@ আম্রো আমি চেষ্টা করে দেখব; অতীতে আমি র‌্যানালিটিকফ্লো ( j.mp/bYF8xs ) পরীক্ষা করছিলাম তবে নিশ্চিত হয়ে উঠতে পারি নি: আমি মূলত একজন সিএলআই ব্যবহারকারী :-)
সিএলএইচ


3

কেএনটাইমে একবার দেখুন ।

শিখতে খুব সহজ। আরও অগ্রগতির প্রচুর সুযোগ সহ। ওয়েকা এবং আর এর সাথে দুর্দান্তভাবে সংহত করে




2

নেই ELKI , একটি ওপেন সোর্স বিশ্ববিদ্যালয় প্রকল্প কিছুটা Weka সঙ্গে তুলনীয়, কিন্তু অনেক শক্তিশালী যখন এটি ক্লাস্টারিং এবং Outlier সনাক্তকরণ আসে। ওয়েকা আসলেই ডেটা মাইনিং নয়, মেশিন লার্নিং সফটওয়্যার।




0

এসকিউএল সার্ভার ডেটা মাইনিং (এসএসডিএম) একটি দীর্ঘ সময়ের সাথে আপডেট করা হয়নি তবে আপনি যদি বৃহত্তর রিলেশনাল ডাটাবেস এবং কিউবগুলি খনন করেন তবে এটি এখনও বেশ প্রতিযোগিতামূলক। আমি আস্তে আস্তে কিন্তু পদ্ধতিগতভাবে যতটা খনির সরঞ্জামগুলি পরীক্ষা করতে পারি তার মধ্যে দিয়ে আমি স্লোগান দিচ্ছি এবং এসকিউএল সার্ভারের উইন্ডোজ ইন্টারফেসটি আমি এখনও খুঁজে পেয়েছি এমন সবচেয়ে উত্পাদনশীল এবং স্থিতিশীল (বিশেষত যখন এটি এন্টারপ্রাইজ ডাটাবেসের ক্ষেত্রে আসে, যার মধ্যে কিছুটা অবাক করে দেয় opালু ইন্টারফেস) এর বয়স সত্ত্বেও। আমি একটি আধুনিক উইন্ডোজ উপস্থাপনা ফাউন্ডেশন (ডাব্লুপিএফ) ইন্টারফেস পছন্দ করব তবে এটি পরবর্তী সেরা জিনিস।

আমি এসকিউএল সার্ভার ডেটা মাইনিং-এ একটি রিকিটি স্টেইরওয়ে শিরোনামে বিশদ শৌখিন টিউটোরিয়ালগুলির একটি সম্পূর্ণ সিরিজ লিখেছিলাম , যখন আমি কিছু বেসিক মাইনিং দক্ষতা অর্জন করার চেষ্টা করছিলাম। আমার অনভিজ্ঞতা সত্ত্বেও তারা এখনও "গোটচাস" এর কিছু অগ্রিম সনাক্তকরণে সহায়তা করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.