তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
ডাক অ্যাড্রেসগুলি ফাজি ম্যাচিং কীভাবে করবেন?
আমি জানতে চাই যে ডাক ঠিকানাগুলি কীভাবে তাদের ফর্ম্যাটটি আলাদা হয় বা যখন তার একটিতে ভুল বানান থাকে তখন কীভাবে মিলিত হয়। এখনও অবধি আমি বিভিন্ন সমাধান খুঁজে পেয়েছি তবে আমি মনে করি এগুলি বেশ পুরানো এবং খুব দক্ষ নয়। আমি নিশ্চিত যে আরও ভাল কিছু পদ্ধতি বিদ্যমান, সুতরাং আপনার …

1
নিকটস্থ পয়েন্টগুলি টি-এসএনই ভিজ্যুয়ালাইজেশনে আরও অনুরূপ বিবেচনা করা যেতে পারে?
আমি হিন্টনের কাগজ থেকে বুঝতে পারি যে টি-এসএনই স্থানীয় সাদৃশ্য রাখতে এবং বিশ্বব্যাপী কাঠামো (গুচ্ছবদ্ধকরণ) সংরক্ষণে একটি শালীন কাজ করে। তবে আমি স্পষ্ট নই যে 2D টি-স্নি ভিজুয়ালাইজেশনে পয়েন্টগুলি আরও নিকটে উপস্থিত হবে যদি "আরও অনুরূপ" ডেটা-পয়েন্ট হিসাবে ধরে নেওয়া যায়। আমি 25 টি বৈশিষ্ট্য সহ ডেটা ব্যবহার করছি। উদাহরণ …

4
সিদ্ধান্ত গাছ বা লজিস্টিক রিগ্রেশন?
আমি একটি শ্রেণিবদ্ধকরণ সমস্যা নিয়ে কাজ করছি। আমার কাছে একটি ডেটাसेट রয়েছে যাতে সমান সংখ্যক শ্রেণিবদ্ধ ভেরিয়েবল এবং অবিচ্ছিন্ন ভেরিয়েবল থাকে। কীভাবে কী কৌশল ব্যবহার করবেন তা আমি কীভাবে জানব? একটি সিদ্ধান্ত গাছ এবং একটি লজিস্টিক রিগ্রেশন মধ্যে? লজিস্টিক রিগ্রেশন ধারাবাহিক পরিবর্তনশীল জন্য আরও উপযুক্ত এবং সিদ্ধান্ত গাছ ধারাবাহিক + …

2
শ্রেণিবদ্ধ / ক্লাস্টার ব্যবহারকারীর প্রোফাইলগুলিতে বৈশিষ্ট্য ব্যবহার করে
আমার কাছে একটি ওয়েবসাইট থেকে পণ্য ক্রয়ের ব্যবহারকারীদের একটি ডেটাসেট রয়েছে। আমার বৈশিষ্ট্যগুলি হ'ল ব্যবহারকারীর আইডি, ব্যবহারকারীর অঞ্চল (রাষ্ট্র), পণ্যের আইডি, পণ্যের আইওয়ার্ড আইডি, ওয়েবসাইটের কীওয়ার্ড আইডি এবং পণ্যের ব্যয় বিক্রয় পরিমাণ। লক্ষ্যটি হ'ল "পুরুষ যুবক গেমার" বা "বাড়ির মা থাকুন" এর মতো ব্যবহারকারীরা কারা পরিচয় হিসাবে কোনও পণ্য এবং …

2
10 ^ 10 পয়েন্টের জন্য অ্যালগরিদমের মতো দ্রুত কে-মানে?
আমি 10-মাত্রিক পয়েন্টের সেটটিতে কে-মানে ক্লাস্টারিং করতে চাইছি। ধরা: 10 ^ 10 পয়েন্ট আছে । আমি বৃহত্তম ক্লাস্টারগুলির কেন্দ্র এবং আকারের সন্ধান করছি (আসুন 10 থেকে 100 টি ক্লাস্টার বলি); প্রতিটি পয়েন্টটি কী ক্লাস্টারে শেষ হবে তা নিয়ে আমি মাথা ঘামাই না k আমি কেবল একটি অনুরূপ প্রভাব অনুসন্ধান করছি, …

1
রুবির জন্য মেশিন লার্নিং লাইব্রেরি
রুবির জন্য এমন কোনও মেশিন লার্নিং লাইব্রেরি রয়েছে যা তুলনামূলকভাবে সম্পূর্ণ (তদারকি করা এবং নিরীক্ষণযোগ্য শিক্ষার জন্য বিভিন্ন ধরণের অ্যালগোরিদম সহ), দৃ rob়ভাবে পরীক্ষিত এবং ভাল-নথিভুক্ত রয়েছে? আমি পাইথনের অবিশ্বাস্য ডকুমেন্টেশনের জন্য বিজ্ঞান-শিখাকে পছন্দ করি, তবে একজন ক্লায়েন্ট রুবিতে কোড লিখতে পছন্দ করবেন যেহেতু তারা তাদের সাথে পরিচিত। মূলত আমি …

2
ভারসাম্যহীন ডেটার জন্য বাইনারি শ্রেণিবদ্ধকরণ মডেল
নিম্নলিখিত স্পেসিফিকেশন সহ আমার একটি ডেটাসেট রয়েছে: 2,821 ধনাত্মক সহ 193,176 নমুনা সহ ডেটাসেট প্রশিক্ষণ 673 ধনাত্মক সহ 82,887 নমুনা সহ ডেটাসেট পরীক্ষা করুন এখানে 10 টি বৈশিষ্ট্য রয়েছে। আমি একটি বাইনারি শ্রেণিবদ্ধতা (0 বা 1) সম্পাদন করতে চাই। আমি যে সমস্যার মুখোমুখি হচ্ছি তা হ'ল ডেটাটি ভারসাম্যহীন। কিছু বৈশিষ্ট্যযুক্ত …

4
উচ্চ পক্ষপাতদুষ্ট ডেটাসেটের সাথে একটি ট্রি এনসেম্বল প্রশিক্ষণের জন্য কী কী প্রভাব পড়বে?
আমার কাছে অত্যন্ত পক্ষপাতিত্বমূলক বাইনারি ডেটাসেট রয়েছে - আমার কাছে ইতিবাচক শ্রেণির চেয়ে নেতিবাচক শ্রেণির আরও 1000x উদাহরণ রয়েছে। আমি এই ডেটাতে একটি ট্রি এনসেম্বলকে (অতিরিক্ত র্যান্ডম ট্রি বা একটি এলোমেলো বন হিসাবে) প্রশিক্ষণ দিতে চাই তবে ইতিবাচক শ্রেণির পর্যাপ্ত উদাহরণ রয়েছে এমন প্রশিক্ষণ ডেটাসেট তৈরি করা কঠিন। ইতিবাচক এবং …

4
উদাহরণস্বরূপ অবকাঠামো স্ট্যাক / ওয়ার্কফ্লো / পাইপলাইনগুলির সন্ধান করছেন
আমি বুঝতে চেষ্টা করছি যে সমস্ত "বিগ ডেটা" উপাদানগুলি বাস্তব বিশ্বের ব্যবহারের ক্ষেত্রে কীভাবে একসাথে খেলছে, যেমন হ্যাডোপ, মনোগডবি / নোসকিএল, ঝড়, কাফকা, ... আমি জানি যে এটি বেশ বিস্তৃত সরঞ্জামগুলির জন্য ব্যবহৃত হয় বিভিন্ন ধরণের, তবে আমি অ্যাপ্লিকেশনগুলিতে তাদের মিথস্ক্রিয়া সম্পর্কে আরও জানতে চাই, যেমন কোনও অ্যাপ্লিকেশন, ওয়েবঅ্যাপ, অনলাইন …

1
গ্রেডিয়েন্ট বুস্টেড গাছগুলি কোনও ফাংশন মাপসই করতে পারে?
নিউরাল নেটওয়ার্কগুলির জন্য আমাদের সর্বজনীন আনুমানিক উপপাদ্য রয়েছে যা বলে যে নিউরাল নেটওয়ার্কগুলি এর একটি কমপ্যাক্ট সাবসেটে যে কোনও ধ্রুবক ফাংশন আনুমানিক করতে পারে ।RnRnR^n গ্রেডিয়েন্ট বুস্টেড গাছগুলির জন্য কি একই রকম ফলাফল রয়েছে? এটি যুক্তিসঙ্গত বলে মনে হচ্ছে যেহেতু আপনি আরও শাখা যুক্ত করতে পারেন তবে আমি বিষয়টির কোনও …

1
সিএনএনগুলির ইনপুট হিসাবে পাশের চিত্রগুলি সহ অ-চিত্রযুক্ত বৈশিষ্ট্যগুলি কীভাবে যুক্ত করা যায়
আমি কুয়াশার অবস্থার (3 শ্রেণি) চিত্রগুলিকে শ্রেণিবদ্ধ করার জন্য একটি কনভোলশনাল নিউরাল নেটওয়ার্ক প্রশিক্ষণ দিচ্ছি। যাইহোক, প্রায় প্রতিটি 150.000 চিত্রের জন্য আমার কাছে চারটি আবহাওয়া সংক্রান্ত পরিবর্তনশীলও পাওয়া যায় যা চিত্রগুলির ক্লাস পূর্বাভাস দিতে সহায়তা করতে পারে। আমি ভাবছিলাম যে কীভাবে আমি বিদ্যমান সিএনএন কাঠামোর সাথে আবহাওয়া পরিবর্তনগুলি (যেমন তাপমাত্রা, …

3
ইমেজনেটে ​​কোনও ব্যক্তি শ্রেণি রয়েছে? মানুষের সাথে সম্পর্কিত কোন শ্রেণি রয়েছে কি?
আমি যদি ইন্টারনেটে ইমেজেনেট ক্লাসের জন্য বহু উত্সের মধ্যে একটির দিকে নজর রাখি তবে আমি মানুষের সাথে সম্পর্কিত কোনও একক শ্রেণির সন্ধান করতে পারি না (এবং না, ফসল কাটানোর লোক নয়, তবে এটি আমি ড্যাডি লম্বেলস হিসাবে জানতাম, এক ধরণের মাকড়সা :-)। কীভাবে সম্ভব? আমি অন্তত একটি প্রত্যাশিত এ হবে …

5
মেশিন লার্নিংয়ের জন্য শিক্ষানবিশ গণিতের বই
আমি একজন কম্পিউটার বিজ্ঞান প্রকৌশলী যা পরিসংখ্যান বা অগ্রণী গণিতে কোন পটভূমি নেই। আমি রসচা এবং মিরজালিলির পাইথন মেশিন লার্নিং বইটি অধ্যয়ন করছি , কিন্তু যখন আমি মেশিন লার্নিংয়ের গণিতটি বোঝার চেষ্টা করছিলাম, তখন বন্ধুরা আমাকে স্ট্যাটিস্টিকাল লার্নিংয়ের উপাদানগুলির পরামর্শ দেয় এমন দুর্দান্ত বইটি বুঝতে পারি না । আপনি কি …

1
এলোমেলো বন ব্যবহার করে কতগুলি বৈশিষ্ট্য নমুনা করা যায়
উইকিপিডিয়া পৃষ্ঠা উদ্ধৃতি চিহ্ন "পরিসংখ্যানগত শিক্ষণ উপাদানসমূহ" বলেছেন: সাধারণত, সঙ্গে একটি শ্রেণীবিন্যাস সমস্যার জন্য বৈশিষ্ট্য, ⌊ √ppp বৈশিষ্ট্যগুলি প্রতিটি বিভক্তিতে ব্যবহৃত হয়।⌊p–√⌋⌊p⌋\lfloor \sqrt{p}\rfloor আমি বুঝতে পারি যে এটি মোটামুটি ভাল শিক্ষিত অনুমান এবং এটি সম্ভবত অভিজ্ঞতাগত প্রমাণ দ্বারা নিশ্চিত করা হয়েছিল, তবে এর অন্যান্য কারণগুলি কি কারণ বর্গমূলকে বেছে নেওয়া …

1
আরএনএন একাধিক সময় সিরিজ ব্যবহার করে
আমি প্রতিটি সিরিজের ধরণের উপর ভিত্তি করে প্রশিক্ষণের জন্য টাইম সিরিজটিকে ইনপুট হিসাবে ব্যবহার করে একটি নিউরাল নেটওয়ার্ক তৈরি করার চেষ্টা করছি। আমি পড়েছি যে আরএনএন ব্যবহার করে আপনি ইনপুটটিকে ব্যাচগুলিতে বিভক্ত করতে পারেন এবং সময় সিরিজের প্রতিটি পয়েন্টকে পৃথক নিউরনগুলিতে ব্যবহার করতে পারেন এবং শেষ পর্যন্ত নেটওয়ার্কটিকে প্রশিক্ষণ দিতে …
14 time-series  rnn 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.