প্রশ্ন ট্যাগ «data-mining»

পূর্বের অজানা নিদর্শনগুলি আবিষ্কার করতে ডেটা মাইনিং একটি ডাটাবেস প্রসঙ্গে কৃত্রিম বুদ্ধিমত্তার থেকে পদ্ধতিগুলি ব্যবহার করে। এই হিসাবে, পদ্ধতিগুলি সাধারণত অপ্রচলিত হয়। এটি নিবিড়ভাবে সম্পর্কিত তবে মেশিন লার্নিংয়ের সাথে অভিন্ন নয়। ডেটা মাইনিংয়ের মূল কাজগুলি হ'ল ক্লাস্টার বিশ্লেষণ, আউটলেট সনাক্তকরণ এবং সমিতি বিধিগুলির খনন।

5
কে-উপায়গুলির ত্রুটিগুলি কীভাবে বোঝা যায়
ক্লাস্টার বিশ্লেষণে কে-মানে একটি বহুল ব্যবহৃত পদ্ধতি। আমার বোধগম্যতার জন্য, এই পদ্ধতিটির জন্য কোনও অনুমানের প্রয়োজন হয় না, অর্থাত্ আমাকে একটি ডেটাসেট এবং একটি নির্দিষ্ট নির্দিষ্ট ক্লাস্টার, কে প্রদান করুন এবং আমি কেবল এই অ্যালগরিদম প্রয়োগ করি যা ক্লাস্টারের স্কোয়ারের মধ্যে স্কোয়ার ত্রুটির যোগফলকে কমিয়ে দেয় (এসএসই) the ত্রুটি। সুতরাং …

12
ডেটা মাইনিং, পরিসংখ্যান, মেশিন লার্নিং এবং এআইয়ের মধ্যে পার্থক্য কী?
ডেটা মাইনিং, পরিসংখ্যান, মেশিন লার্নিং এবং এআইয়ের মধ্যে পার্থক্য কী? এটি কি সঠিক হবে যে তারা 4 টি ক্ষেত্র খুব অনুরূপ সমস্যাগুলি সমাধান করার চেষ্টা করছে তবে বিভিন্ন পদ্ধতির সাথে? তাদের ঠিক কী মিল রয়েছে এবং কোথায় তাদের পার্থক্য রয়েছে? তাদের মধ্যে যদি একধরনের শ্রেণিবিন্যাস হয় তবে তা কী হবে? …

4
কোহেনের কপ্পা সরল ইংরেজিতে
আমি একটি ডেটা মাইনিং বই পড়ছি এবং এটি ক্লাসিফায়ারদের পূর্বাভাসের পারফরম্যান্সকে মূল্যায়নের উপায় হিসাবে কাপা পরিসংখ্যানের উল্লেখ করেছে। যাইহোক, আমি কেবল এটি বুঝতে পারি না। আমি উইকিপিডিয়াও পরীক্ষা করেছিলাম তবে এটি খুব একটা কাজে দেয় নি: https://en.wikedia.org/wiki/Cohen's_kappa । শ্রেণিবদ্ধদের পূর্বাভাস কর্মক্ষমতা মূল্যায়নে কোহেনের কপা কীভাবে সহায়তা করে? এটা কি বলে? …

9
এলোমেলো বন থেকে জ্ঞান অর্জন করা
এলোমেলো বনগুলিকে ব্ল্যাক বক্স হিসাবে বিবেচনা করা হয় তবে সম্প্রতি আমি ভাবছিলাম যে এলোমেলো বন থেকে কোন জ্ঞান পাওয়া যায়? সর্বাধিক সুস্পষ্ট বিষয় হল ভেরিয়েবলের গুরুত্ব, সহজতম ভেরিয়েন্টে এটি কেবল একটি ভেরিয়েবলের সংখ্যার সংখ্যা গণনা করেই করা যেতে পারে। দ্বিতীয় জিনিসটির বিষয়ে আমি ভাবছিলাম ইন্টারঅ্যাকশন। আমি মনে করি গাছের সংখ্যা …

11
পিএইচডি ছাড়াই ডেটা মাইনিংয়ে চাকরী হচ্ছে
আমি কিছুক্ষণের জন্য ডেটা মাইনিং এবং মেশিন-লার্নিংয়ের প্রতি খুব আগ্রহী হয়েছি, আংশিক কারণ যে আমি স্কুলে এই অঞ্চলে মেজাজ করি, তবে কারণ আমি কেবল প্রোগ্রামিংয়ের চেয়ে কিছুটা বেশি চিন্তাভাবনা করা সমস্যাগুলির সমাধান করার চেষ্টা করে সত্যই অনেক বেশি আগ্রহী জ্ঞান এবং যার সমাধানে একাধিক ফর্ম থাকতে পারে। আমার কোনও গবেষক …

7
ইউক্লিডিয়ান দূরত্ব সাধারণত বিরল ডেটার জন্য ভাল হয় না?
আমি কোথাও দেখেছি যে ক্লাসিকাল দূরত্বগুলি (ইউক্লিডিয়ান দূরত্বের মতো) দুর্বলভাবে বৈষম্যমূলক হয়ে ওঠে যখন আমাদের কাছে বহুমাত্রিক এবং বিরল ডেটা থাকে। কেন? ইউক্লিডিয়ান দূরত্ব ভাল সঞ্চালন করে না এমন দুটি স্পার ডেটা ভেক্টরের উদাহরণ রয়েছে কি? এক্ষেত্রে আমাদের কোন মিল খুঁজে পাওয়া উচিত?

8
দক্ষতা মেশিন শিখতে পাওয়া?
দেখে মনে হচ্ছে ডেটা মাইনিং এবং মেশিন লার্নিং এত জনপ্রিয় হয়ে উঠেছে যে এখন প্রায় প্রতিটি সিএস শিক্ষার্থী শ্রেণিবদ্ধ, ক্লাস্টারিং, স্ট্যাটিস্টিকাল এনএলপি ... ইত্যাদি সম্পর্কে জানে তাই তাই মনে হয় যে ডেটা মাইনারদের সন্ধান করা আজকাল কোনও কঠিন কাজ নয়। আমার প্রশ্ন: একটি ডেটা মাইনার কী কী দক্ষতা শিখতে পারে …

8
একটি বিদ্যমান ভেরিয়েবল (গুলি) এর সাথে সংজ্ঞায়িত পারস্পরিক সম্পর্কযুক্ত একটি এলোমেলো ভেরিয়েবল তৈরি করুন
একটি সিমুলেশন অধ্যয়নের জন্য আমাকে এলোমেলো ভেরিয়েবলগুলি তৈরি করতে হবে যা বিদ্যমান ভেরিয়েবল সাথে একটি পূর্বনির্ধারিত (জনসংখ্যা) পারস্পরিক সম্পর্ক দেখায় ।ওয়াইYY আমি Rপ্যাকেজগুলিতে সন্ধান করেছি copulaএবং CDVineযা প্রদত্ত নির্ভরতা কাঠামোর সাথে এলোমেলো মাল্টিভারিয়েট বিতরণ তৈরি করতে পারে। যাইহোক, বিদ্যমান ভেরিয়েবলের ফলে ফলাফলগুলির মধ্যে একটি স্থির করা সম্ভব নয়। বিদ্যমান ক্রিয়াকলাপগুলির …

2
কেন কেবল তিনটি পার্টিশন? (প্রশিক্ষণ, বৈধতা, পরীক্ষা)
আপনি যখন একটি বড় ডেটাসেটে মডেলগুলি ফিট করার চেষ্টা করছেন, তখন সাধারণ পরামর্শটি হ'ল ডেটাটিকে তিন ভাগে বিভক্ত করা: প্রশিক্ষণ, বৈধতা এবং পরীক্ষা ডেটাসেট। এটি কারণ মডেলগুলির সাধারণত প্যারামিটারগুলির তিনটি "স্তর" থাকে: প্রথম "পরামিতি" হ'ল মডেল বর্গ (যেমন এসভিএম, নিউরাল নেটওয়ার্ক, এলোমেলো বন), পরামিতিগুলির দ্বিতীয় সেট হ'ল "নিয়মিতকরণ" পরামিতি বা …

12
গ্রাফ [বন্ধ] থেকে ডেটা স্ক্র্যাপ করার জন্য সফ্টওয়্যারটির দরকার
কারও কারও কাছে এমন কোনও সফ্টওয়্যার রয়েছে (পছন্দমতো বিনামূল্যে, সবচেয়ে ভাল মুক্ত উত্স) যা কারটিশিয়ান স্থানাঙ্কে (একটি মানক, প্রতিদিনের প্লট) প্লট করা ডেটার একটি চিত্র নেবে এবং গ্রাফে প্লট করা পয়েন্টগুলির স্থানাঙ্কগুলি বের করবে? মূলত, এটি একটি ডেটা মাইনিং সমস্যা এবং একটি বিপরীত ডেটা-ভিজ্যুয়ালাইজেশন সমস্যা।

8
'বড় ডেটা'র সময়ে স্যাম্পলিং কি প্রাসঙ্গিক?
বা আরও কিছু "তাই হবে"? বিগ ডেটা পরিসংখ্যান এবং প্রাসঙ্গিক জ্ঞানকে আরও গুরুত্বপূর্ণ করে তোলে তবে স্যাম্পলিং থিওরিটিকে আন্ডারপ্লে করে বলে মনে হয়। আমি 'বিগ ডেটা' এর আশেপাশে এই হাইপ দেখেছি এবং ভাবতে পারি না যে "কেন" আমি সবকিছু বিশ্লেষণ করতে চাই ? "স্যাম্পলিং থিওরি" ডিজাইন / প্রয়োগ / আবিষ্কার …

3
আমাদের কি “করুণা বাড়ানোর” সমস্যা আছে?
আমি জানি, এটি শব্দহীন বলে মনে হতে পারে তবে শুনুন। স্ট্যাক ওভারফ্লোতে এবং এখানে আমরা পোস্টগুলিতে ভোট পাই, এটি সমস্ত একটি সারণী আকারে সঞ্চিত। উদাহরণ: পোস্ট আইডি ভোটার আইডি ভোট টাইপ তারিখের সময় ------- -------- --------- -------- 10 1 2 2000-1-1 10:00:01 11 3 3 2000-1-1 10:00:01 10 5 2 …

3
কে-মিনস এবং ইএম এর সাথে ক্লাস্টারিং: এগুলি কীভাবে সম্পর্কিত?
আমি ক্লাস্টারিং ডেটার জন্য অ্যালগরিদমগুলি অধ্যয়ন করেছি (নিরীক্ষণযোগ্য শিক্ষণ): ইএম এবং কে-মানে। আমি নিম্নলিখিত পড়তে থাকি: ক্লোস্টারগুলি গোলাকার বলে অনুমান করে কে-মানে ইএম এর একটি বৈকল্পিক। কেউ কি উপরের বাক্যটি ব্যাখ্যা করতে পারেন? গোলাকৃতির অর্থ কী, এবং কীমান এবং ইএম কীভাবে সম্পর্কিত তা আমি বুঝতে পারি না, যেহেতু একটি সম্ভাব্য …

1
নিরীক্ষণযোগ্য শেখার মূল্যায়ন করার জন্য পারফরম্যান্স মেট্রিক্স
আনসারভিজড লার্নিং (যেমন ক্লাস্টারিং) এর প্রতি শ্রদ্ধা রেখে, পারফরম্যান্স মূল্যায়নের জন্য কি কোনও মেট্রিক রয়েছে?

3
লুকানো মার্কভ মডেল এবং নিউরাল নেটওয়ার্কগুলির মধ্যে পার্থক্য কী?
আমি পরিসংখ্যানগুলিতে কেবল আমার পা ভেজাচ্ছি তাই এই প্রশ্নের অর্থ যদি না বোঝায় তবে আমি দুঃখিত। আমি কোনও অনুসন্ধান ইঞ্জিনে ব্যবহারকারীদের ক্লিকগুলি অধ্যয়ন করতে লুকানো রাজ্যগুলি (অন্যায় ক্যাসিনো, ডাইস রোলস ইত্যাদি) এবং নিউরাল নেটওয়ার্কগুলির পূর্বাভাস দেওয়ার জন্য মার্কভ মডেলগুলি ব্যবহার করেছি। উভয়েরই গোপনীয় অবস্থা ছিল যে আমরা পর্যবেক্ষণগুলি ব্যবহার করে …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.