আইএলপি ছাড়াই সম্পর্কিত ডেটা মাইনিং


9

আমার কাছে একটি রিলেশনাল ডাটাবেস থেকে একটি বিশাল ডেটাসেট রয়েছে যার জন্য আমার একটি শ্রেণিবদ্ধকরণ মডেল তৈরি করতে হবে। সাধারণত এই পরিস্থিতির জন্য আমি ইন্ডুকটিভ লজিক প্রোগ্রামিং (আইএলপি) ব্যবহার করব তবে বিশেষ পরিস্থিতির কারণে আমি এটি করতে পারি না।

এটি মোকাবেলার অন্যান্য উপায়টি হ'ল আমি যখন বিদেশী সম্পর্ক স্থাপন করি তখন মানগুলি একত্রিত করার চেষ্টা করা। তবে কিছু নামমাত্র বৈশিষ্ট্যের জন্য আমার কাছে কয়েক হাজার গুরুত্বপূর্ণ এবং স্বতন্ত্র সারি রয়েছে (উদাহরণস্বরূপ: বেশ কয়েকটি স্বতন্ত্র ওষুধের ব্যবস্থার সাথে সম্পর্কিত একটি রোগী)। সুতরাং, আমি কেবলমাত্র সেই নামমাত্র বৈশিষ্ট্যের প্রতিটি স্বতন্ত্র সারির জন্য একটি নতুন অ্যাট্রিবিউট তৈরি না করেই এটি করতে পারি না এবং তদ্ব্যতীত নতুন কলামগুলির বেশিরভাগেরই যদি আমি এটি করি তবে নূন্যমূল্য থাকবে।

আইভলবিহীন অ্যালগরিদম এমন কোনও কি আছে যা আমাকে পাইভোটিংয়ের মতো কৌশল অবলম্বন না করে আমার খনি সম্পর্কিত ডেটাবেসগুলিতে ডেটা দেওয়ার অনুমতি দেয়, যা কয়েক হাজার নতুন কলাম তৈরি করতে পারে?


2
বিধি খনির কী হবে? আপনার উদ্দেশ্য কী তা আমার কাছে পরিষ্কার নয়।
অ্যাডিসান্টোস

যদিও একটি ভাল প্রশ্ন আমি লক্ষ্য করেছি যে এটি একাধিক স্ট্যাক এক্সচেঞ্জ ফোরামে প্রদর্শিত হচ্ছে ... stackoverflow.com/questions/24260299/… ; আমি এ জাতীয় স্টাফ নিয়ে স্টিকলার নই তবে আমি মনে করি আমাদের এটি করা উচিত নয়
হ্যাক-আর

এছাড়াও, আপনি যদি শ্রেণিবদ্ধ করছেন সে সম্পর্কে আপনি যদি আরও কিছু নির্দিষ্ট হতে পারেন, আপনি যে প্রতিবন্ধকতার মুখোমুখি হয়ে উঠছেন এবং একটি আদর্শ বিশ্বে আমাদের সন্ধানের জন্য কিছু নমুনা তথ্য সরবরাহ করে তবে এটি খুব সহায়ক হবে
হ্যাক-আর

উত্তর:


1

প্রথম, কিছু সাবধান

আপনি কেন আপনার পছন্দের প্রোগ্রামিং (উপ) প্যারাডিজম *, ইন্ডুকটিভ লজিক প্রোগ্রামিং (আইএলপি) বা আপনি শ্রেণিবদ্ধ করার চেষ্টা করছেন তা আমি নিশ্চিত নই । আরও বিস্তারিত জানানো সম্ভবত আরও ভাল উত্তর হতে পারে; বিশেষত যেহেতু প্রোগ্রামিং দৃষ্টান্তের সাথে তারা জড়িত তার ভিত্তিতে শ্রেণিবদ্ধকরণ অ্যালগরিদমগুলির নির্বাচনের কাছে যাওয়া সামান্য অস্বাভাবিক as যদি আপনার আসল বিশ্বের উদাহরণটি গোপনীয় হয় তবে কেবল একটি কাল্পনিক-তবে-অ্যানালগাস উদাহরণ তৈরি করুন।

আইএলপি ছাড়াই বড় ডেটা শ্রেণিবিন্যাস

এই বলে যে, আইএলপি প্রত্যাখ্যান করার পরে আমাদের বিবেচনার জন্য আরও 4 টি লজিক প্রোগ্রামিং উপমা রয়েছে:

  1. Abductive
  2. উত্তর সেট
  3. বাধ্যতা
  4. ক্রিয়ামূলক

লজিক প্রোগ্রামিংয়ের বাইরে কয়েক ডজন উপমা এবং উপ-প্যারাডিমগুলি ছাড়াও ms

উদাহরণস্বরূপ ফাংশনাল লজিক প্রোগ্রামিংয়ের মধ্যে , আইএলপি'র ইনডাকটিভ ফাংশনাল লজিক প্রোগ্রামিং নামক এক্সটেনশন রয়েছে , যা ইনভার্সন সংকীর্ণ (অর্থাত্ সংকীর্ণ ব্যবস্থার বিপরীত) এর উপর ভিত্তি করে। এই পদ্ধতির আইএলপির বেশ কয়েকটি সীমাবদ্ধতা কাটিয়ে উঠেছে এবং ( কিছু পণ্ডিতের মতে, কমপক্ষে ) উপস্থাপনের ক্ষেত্রে প্রয়োগের জন্য যথাযথ উপযুক্ত এবং আরও প্রাকৃতিক উপায়ে সমস্যা প্রকাশ করার সুযোগ সুবিধা রয়েছে।

আপনার ডাটাবেসের সুনির্দিষ্ট বিবরণ এবং আইএলপি ব্যবহারে আপনি যে প্রতিবন্ধকতাগুলির মুখোমুখি হন সেগুলি সম্পর্কে আরও না জানলে আমি বুঝতে পারি না এটি আপনার সমস্যার সমাধান করে বা একই সমস্যার সাথে ভুগছে কিনা I এই হিসাবে, আমি পাশাপাশি সম্পূর্ণ ভিন্ন পদ্ধতির বাইরে ফেলে দেব।

আইএলপি "ক্লাসিকাল" বা ডেটা মাইনিংয়ের ক্ষেত্রে "প্রস্তাবিত" পদ্ধতির সাথে বিপরীত । এই পদ্ধতির মধ্যে সিদ্ধান্ত গাছ, নিউরাল নেটওয়ার্ক, রিগ্রেশন, ব্যাগিং এবং অন্যান্য পরিসংখ্যানগত পদ্ধতিগুলির মতো মেশিন লার্নিংয়ের মাংস এবং হাড়গুলি অন্তর্ভুক্ত। আপনার ডেটা আকারের কারণে এই পদ্ধতিগুলি ছেড়ে দেওয়া পরিবর্তে, আপনি প্রচুর ডেটা বিজ্ঞানী, বিগ ডেটা ইঞ্জিনিয়ার এবং পরিসংখ্যানবিদদের মধ্যে যোগ দিতে পারেন যারা উচ্চতর পারফরম্যান্স কম্পিউটিং (এইচপিসি) ব্যবহার করে এই পদ্ধতিগুলিকে বিশাল ডেটা সেট সহ ব্যবহার করে (সেখানে রয়েছে এছাড়াও নমুনা এবং অন্যান্য পরিসংখ্যান কৌশল আপনি গণনামূলক সম্পদ এবং আপনার রিলেশনাল ডাটাবেসে বিগ ডেটা বিশ্লেষণের জন্য প্রয়োজনীয় সময় হ্রাস করতে ব্যবহার করতে পারেন)।

এইচপিসিতে একাধিক সিপিইউ কোর ব্যবহার করা, উচ্চ মেমরি সহ প্রচুর সংখ্যক দ্রুত সিপিইউ সার্ভারের ইলাস্টিক ব্যবহার সহ আপনার বিশ্লেষণকে স্কেল করা, উচ্চ-পারফরম্যান্সের ডেটা গুদাম সরঞ্জামগুলি ব্যবহার করা, ক্লাস্টারগুলিকে নিয়োগ করা বা সমান্তরাল কম্পিউটিংয়ের অন্যান্য রূপগুলি ইত্যাদি things আমি কোন ভাষা বা পরিসংখ্যান সংক্রান্ত স্যুটটি দিয়ে আপনার ডেটা বিশ্লেষণ করছি তা নিশ্চিত নই, তবে উদাহরণস্বরূপ এই ক্র্যান টাস্ক ভিউতে আর ভাষার জন্য অনেকগুলি এইচপিসি সংস্থান তালিকাভুক্ত করা হয়েছে যা আপনাকে একটি প্রস্তাবিত অ্যালগরিদম স্কেল করার অনুমতি দেয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.