প্রশ্ন ট্যাগ «data-mining»

পূর্বের অজানা নিদর্শনগুলি আবিষ্কার করতে ডেটা মাইনিং একটি ডাটাবেস প্রসঙ্গে কৃত্রিম বুদ্ধিমত্তার থেকে পদ্ধতিগুলি ব্যবহার করে। এই হিসাবে, পদ্ধতিগুলি সাধারণত অপ্রচলিত হয়। এটি নিবিড়ভাবে সম্পর্কিত তবে মেশিন লার্নিংয়ের সাথে অভিন্ন নয়। ডেটা মাইনিংয়ের মূল কাজগুলি হ'ল ক্লাস্টার বিশ্লেষণ, আউটলেট সনাক্তকরণ এবং সমিতি বিধিগুলির খনন।

3
নেতিবাচক দ্বিপদী বিতরণ বনাম দ্বিপদী বিতরণ
নেতিবাচক দ্বিপদী বিতরণ এবং দ্বিপদী বিতরণের মধ্যে পার্থক্য কী? আমি অনলাইনে পড়ার চেষ্টা করেছি, এবং আমি দেখতে পেয়েছি যে ডেটা পয়েন্টগুলি পৃথক হলে নেতিবাচক দ্বিপদী বিতরণ ব্যবহৃত হয়, তবে আমি মনে করি এমনকি দ্বিপদী বিতরণও পৃথক ডেটা পয়েন্টের জন্য ব্যবহার করা যেতে পারে।

8
কে-মানে (বা তার নিকটাত্মীয়) কেবলমাত্র একটি দূরত্বের ম্যাট্রিক্স দিয়ে ক্লাস্টারিং করুন, পয়েন্ট-বাই বৈশিষ্ট্যযুক্ত ডেটা নয়
আমি আমার থাকা বস্তুগুলিতে কে-মানে ক্লাস্টারিং করতে চাই, তবে বস্তুগুলিকে স্থানের বিন্দু হিসাবে বর্ণনা করা হয় না, যেমন objects x featuresডেটাসেট দ্বারা । যাইহোক, আমি যে কোনও দুটি বস্তুর মধ্যে দূরত্ব গণনা করতে সক্ষম (এটি একটি মিলের ফাংশনের উপর ভিত্তি করে)। সুতরাং, আমি দূরত্বের ম্যাট্রিক্স নিষ্পত্তি করি objects x objects। …

5
ডেটা মাইনিংয়ের নতুন বিপ্লবী উপায়?
নিম্নলিখিত অংশটি শোয়েজারের হেজ ফান্ড মার্কেট উইজার্ডস (মে ২০১২) এর ধারাবাহিকভাবে সফল হেজ ফান্ডের ব্যবস্থাপক জাফ্রে উড্রিফের একটি সাক্ষাত্কার: এই প্রশ্নের উত্তর: "ডেটা মাইনিংয়ের ক্ষেত্রে লোকেদের মধ্যে সবচেয়ে খারাপ ত্রুটিগুলি কী কী?": প্রচুর লোক মনে করে তারা ঠিক আছে কারণ তারা প্রশিক্ষণের জন্য নমুনা ডেটা এবং পরীক্ষার জন্য নমুনা ছাড়িয়ে …

3
বড় ডেটার জন্য প্রথম পদক্ষেপ ( , )
মনে করুন আপনি প্রতিদিন কোটি কোটি পর্যবেক্ষণের ভিত্তিতে একটি বিশাল ডেটা সেট বিশ্লেষণ করছেন, যেখানে প্রতিটি পর্যবেক্ষণে কয়েক হাজার বিচ্ছিন্ন এবং সম্ভবত অপ্রয়োজনীয় সংখ্যাসূচক এবং শ্রেণিবদ্ধ ভেরিয়েবল রয়েছে। আসুন আমরা বলি যে একটি রিগ্রেশন সমস্যা, একটি ভারসাম্যহীন বাইনারি শ্রেণিবদ্ধকরণ সমস্যা এবং "কোন ভবিষ্যদ্বাণীকারী সবচেয়ে গুরুত্বপূর্ণ তা খুঁজে বের করুন" এর …

4
সিদ্ধান্ত গাছ প্রায় সবসময় বাইনারি গাছ হয়?
প্রায় প্রতিটি সিদ্ধান্ত গাছের উদাহরণটি আমি জুড়ে এসেছি বাইনারি ট্রি হিসাবে ঘটে। এটি কি বেশ সার্বজনীন? বেশিরভাগ মানক অ্যালগোরিদম (সি 4.5, কার্ট ইত্যাদি) কেবল বাইনারি গাছকে সমর্থন করে? আমি যা সংগ্রহ করি তা থেকে CHAID বাইনারি গাছগুলির মধ্যে সীমাবদ্ধ নয় তবে এটি একটি ব্যতিক্রম বলে মনে হয়। একটি দ্বি-দ্বি দ্বিধা …

2
মডেল নির্বাচনের পরে ক্রস বৈধকরণ (ত্রুটি সাধারণকরণ)
দ্রষ্টব্য: কেস হল এন >> পি আমি পরিসংখ্যানগত শিক্ষার উপাদানগুলি পড়ছি এবং ক্রস বৈধকরণের "ডান" উপায় সম্পর্কে বিভিন্ন উল্লেখ রয়েছে (যেমন পৃষ্ঠা 60, পৃষ্ঠা 245)) বিশেষত, আমার প্রশ্ন হল যখন কোনও মডেল অনুসন্ধান হয়েছে তখন কে-ফোল্ড সিভি বা বুটস্ট্র্যাপিং ব্যবহার করে চূড়ান্ত মডেলটিকে (পৃথক পরীক্ষার সেট ছাড়াই) কীভাবে মূল্যায়ন করা …

2
যদি কে-মানে ক্লাস্টারিং গাউসিয়ান মিশ্রণ মডেলিংয়ের একটি রূপ, ডেটা স্বাভাবিক না থাকে তখন কী এটি ব্যবহার করা যেতে পারে?
আমি GM GM এর জন্য ইএম অ্যালগরিদমের উপর বিশপ পড়ছি এবং জিএমএম এবং কে-অর্থের মধ্যে সম্পর্কের। এই বইতে এটি বলেছে যে কে-মানে জিএমএম এর একটি হার্ড অ্যাসাইন সংস্করণ। আমি ভাবছি কি এর দ্বারা বোঝা যায় যে আমি যে ডেটা ক্লাস্টার করার চেষ্টা করছি তা যদি গাউসিয়ান না হয় তবে আমি …

4
কীভাবে ডেটা রৈখিকভাবে পৃথকযোগ্য কিনা তা কীভাবে জানবেন?
ডেটাতে অনেকগুলি বৈশিষ্ট্য রয়েছে (উদাহরণস্বরূপ 100) এবং উদাহরণগুলির সংখ্যা 100,000 এর মতো। তথ্য বিরল। আমি লজিস্টিক রিগ্রেশন বা এসএমএম ব্যবহার করে ডেটা ফিট করতে চাই। বৈশিষ্ট্যগুলি রৈখিক বা অ-রৈখিক কিনা তা আমি কীভাবে জানতে পারি যাতে আমি লিনিয়ার না থাকলে কার্নেল ট্রিকটি ব্যবহার করতে পারি?

2
গভীর শিক্ষণ কোথায় এবং কেন আলোকিত হয়?
সমস্ত মিডিয়া আলাপ এবং এই দিন গভীর জ্ঞান সম্পর্কে হাইপ সঙ্গে, আমি এটি সম্পর্কে কিছু প্রাথমিক জিনিস পড়েছি। আমি সবেমাত্র আবিষ্কার করেছি যে ডেটা থেকে নিদর্শনগুলি শিখতে এটি অন্য একটি মেশিন লার্নিং পদ্ধতি। তবে আমার প্রশ্ন হ'ল: কোথায় এবং কেন এই পদ্ধতিটি চকচকে? এখনই এটি সম্পর্কে সমস্ত আলোচনা কেন? অর্থাৎ …

2
স্ট্যাক এক্সচেঞ্জ প্রশ্নের জন্য "আকর্ষণীয়তা" ফাংশন
আমি স্ট্যাকএক্সচেঞ্জ সাইটগুলির জন্য ডেটা মাইনিং প্যাকেজ একসাথে রাখার চেষ্টা করছি এবং বিশেষত আমি "সবচেয়ে আকর্ষণীয়" প্রশ্নগুলি নির্ধারণের চেষ্টাতে আটকে আছি। আমি প্রশ্ন স্কোরটি ব্যবহার করতে চাই, তবে ভিউ সংখ্যার কারণে পক্ষপাতটি সরিয়ে ফেলব, তবে কীভাবে এটি কঠোরভাবে পৌঁছাতে হবে তা আমি জানি না। আদর্শ বিশ্বে, আমি গণনা করে প্রশ্নগুলি …

1
দূর তদারকি: তদারকি, আধা তত্ত্বাবধান, বা উভয়?
"ডিস্ট্যান্ট তদারকি" একটি শিক্ষণ প্রকল্প যাতে শ্রেণিবদ্ধকে একটি দুর্বল লেবেলযুক্ত প্রশিক্ষণ সেট দেওয়া হয় (প্রশিক্ষণ ডেটা হিউরিস্টিকস / নিয়মের ভিত্তিতে স্বয়ংক্রিয়ভাবে লেবেল করা হয়)। আমি মনে করি যে তত্ত্বাবধানে পড়াশোনা, এবং আধা তত্ত্বাবধানে পড়াশোনা উভয়ই এই জাতীয় "দূরবর্তী তদারকি" অন্তর্ভুক্ত করতে পারে যদি তাদের লেবেলযুক্ত ডেটা heuristically / স্বয়ংক্রিয়ভাবে লেবেল …

2
বুস্টিং: শেখার হারকে নিয়মিতকরণের পরামিতি কেন বলা হয়?
গ্রেডিয়েন্ট বুস্টিং- এ লার্নিং রেট প্যারামিটার ( ) প্রতিটি নতুন বেস মডেলের অবদান সঙ্কুচিত করে - মূলত একটি অগভীর গাছ- যা সিরিজে যুক্ত করা হয়। এটি টেস্ট সেট যথার্থতা নাটকীয়ভাবে বৃদ্ধি করে দেখানো হয়েছিল, এটি ছোট পদক্ষেপের মতোই বোধগম্য, ক্ষতির ন্যূনতমতম কাজটি আরও সঠিকভাবে অর্জন করা যেতে পারে। ν∈ [ …

3
ডেটা মাইনিংয়ের ক্ষেত্রে সমিতির নিয়ম এবং সিদ্ধান্তের গাছের মধ্যে ব্যবহারিক পার্থক্য কী?
এই দুটি কৌশলগুলির মধ্যে ব্যবহারিক পার্থক্যের কি খুব সাধারণ বর্ণনা আছে? উভয়ই তত্ত্বাবধানে শিক্ষার জন্য ব্যবহৃত হয়েছে বলে মনে হয় (যদিও সমিতির নিয়মগুলিও নিরীক্ষণ ব্যবস্থা পরিচালনা করতে পারে)। উভয় ভবিষ্যদ্বাণী জন্য ব্যবহার করা যেতে পারে 'ভাল' বর্ণনার সবচেয়ে কাছের আমি স্ট্যাটসফট পাঠ্যপুস্তক থেকে পেয়েছি । তারা বলে যে অ্যাসোসিয়েশন বিধিগুলি …

6
প্রোগ্রামার মেশিন লার্নিং ক্ষেত্রের মধ্যে প্রবেশ করতে চাইছেন
আমি একটি সফ্টওয়্যার বিকাশকারী (বেশিরভাগ। নেট এবং পাইথন প্রায় 5 বছরের অভিজ্ঞতা)। আমাকে মেশিন লার্নিং ফিল্ডে চাকরী পেতে বা সত্যিই এমন কিছু যা আমাকে field ক্ষেত্রে শুরু করতে সহায়তা করবে আমি কী করতে পারি? স্নাতকোত্তর ডিগ্রি কি কঠিন প্রয়োজন?

6
ডেটা মাইনিং এবং পরিসংখ্যান বিশ্লেষণের মধ্যে পার্থক্য কী?
ডেটা মাইনিং এবং পরিসংখ্যান বিশ্লেষণের মধ্যে পার্থক্য কী? কিছু ব্যাকগ্রাউন্ডের জন্য, আমার পরিসংখ্যানগত শিক্ষাটি বরং আমি প্রচলিত বলে মনে করি। একটি নির্দিষ্ট প্রশ্ন পোস্ট করা হয়, গবেষণা নকশা করা হয়, এবং তথ্য সংগ্রহ করা হয় এবং বিশ্লেষণ করা হয় সেই প্রশ্নের উপর কিছু অন্তর্দৃষ্টি দেওয়ার জন্য। ফলস্বরূপ, আমি "ডেটা ড্রেজিং" …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.