তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
বিভিন্ন ধরণের মডেল কেন প্রায় অভিন্ন ফলাফল দিতে পারে?
আমি k 400k রেকর্ড এবং 9 ভেরিয়েবলের একটি ডেটা সেট বিশ্লেষণ করেছি নির্ভরশীল ভেরিয়েবল বাইনারি। আমি একটি লজিস্টিক রিগ্রেশন, একটি রিগ্রেশন ট্রি, একটি এলোমেলো বন এবং একটি গ্রেডিয়েন্ট বুস্টেড ট্রি লাগিয়েছি। আমি অন্য ডেটা সেটে এগুলিকে বৈধতা দিলে এগুলি সমস্তই ফিট সংখ্যার ভার্চুয়াল অভিন্ন ধার্মিকতা দেয়। কেন এমন হয়? আমি …

3
পরিসংখ্যান + কম্পিউটার বিজ্ঞান = তথ্য বিজ্ঞান? [বন্ধ]
বন্ধ থাকে। এই প্রশ্নটি অফ-টপিক । এটি বর্তমানে উত্তর গ্রহণ করছে না। এই প্রশ্নটি উন্নত করতে চান? প্রশ্নটি আপডেট করুন যাতে এটি ডেটা সায়েন্স স্ট্যাক এক্সচেঞ্জের বিষয়বস্তু । 5 বছর আগে বন্ধ । আমি একটি হতে চান ডেটা বিজ্ঞানী । আমি প্রয়োগ পরিসংখ্যান (অ্যাকিউয়ারিয়াল সায়েন্স) অধ্যয়ন করেছি , সুতরাং আমার …

1
অ-পারমাণবিক বৈশিষ্ট্যগুলির সাথে ভবিষ্যদ্বাণী
ভবিষ্যদ্বাণীটির বৈশিষ্ট্য হিসাবে আমি অ-পারমাণবিক ডেটা ব্যবহার করতে চাই। মনে করুন এই বৈশিষ্ট্যগুলির সাথে আমার একটি ছক রয়েছে: - Column 1: Categorical - House - Column 2: Numerical - 23.22 - Column 3: A Vector - [ 12, 22, 32 ] - Column 4: A Tree - [ [ 2323, …

2
নিউরাল নেটওয়ার্কগুলির সাথে বৈদেশিক মুদ্রার বাজারের পূর্বাভাস
আমি ট্রেডিং মুদ্রাগুলি, ইউএসডি / ইইউ বা ইউএসডি / জিবিপি সর্বাধিক স্বয়ংক্রিয় করতে এএনএন ব্যবহার করতে চাই। আমি জানি এটি শক্ত এবং সোজা নাও হতে পারে। আমি ইতিমধ্যে কিছু কাগজপত্র পড়েছি এবং কিছু পরীক্ষা-নিরীক্ষা করেছি তবে অনেক ভাগ্য ছাড়াই। এই কাজটি করার জন্য আমি এক্সਪਰ্টসের পরামর্শ নিতে চাই। আমি এখন …

3
নিয়মিত বর্ধমান বৈশিষ্ট্য সেট পরিচালনা করা
আমি জালিয়াতি সনাক্তকরণ সিস্টেমে কাজ করছি। এই ক্ষেত্রে, নতুন জালিয়াতি নিয়মিত উপস্থিত হয়, যাতে চলমান ভিত্তিতে মডেলটিতে নতুন বৈশিষ্ট্য যুক্ত করতে হয়। আমি ভাবছি এটি পরিচালনা করার সর্বোত্তম উপায় কোনটি (উন্নয়ন প্রক্রিয়ার দৃষ্টিকোণ থেকে)? বৈশিষ্ট্য ভেক্টরে কেবল নতুন বৈশিষ্ট্য যুক্ত করা এবং শ্রেণিবদ্ধকে পুনরায় প্রশিক্ষণ দেওয়া একটি নির্বোধ দৃষ্টিভঙ্গি বলে …

4
আরডিনাল রিগ্রেশন শিখছেন?
আমি একটি প্রকল্পে কাজ করছি এবং আমাকে দ্রুত অর্জনের জন্য সংস্থান প্রয়োজন। 30 বা তত ভেরিয়েবলের উপর ডেটাসেট প্রায় 35000 পর্যবেক্ষণ। প্রায় অর্ধেক ভেরিয়েবলগুলি কয়েকটি বিভিন্ন সম্ভাব্য মানগুলির সাথে শ্রেণিবদ্ধ, যেমন আপনি যদি শ্রেণীবদ্ধ ভেরিয়েবলগুলিকে ডামি ভেরিয়েবলগুলিতে বিভক্ত করেন তবে আপনার 30 টিরও বেশি ভেরিয়েবল থাকতে পারে। তবে এখনও সম্ভবত …

1
একটি সাধারণ এলিউর ডায়াগ্রামে সাবসেটগুলি প্লট করা যায় কিনা তা আমি কীভাবে বুঝব?
কিছু ক্ষেত্রে, ওভারল্যাপিং চেনাশোনাগুলির সাথে ইউলার ডায়াগ্রামগুলি অঙ্কন করা অসম্ভব হতে পারে যাতে সঠিক অনুপাতে সমস্ত ওভারল্যাপিং সাবসেটগুলি উপস্থাপন করতে পারে । এই ধরণের ডেটাতে প্রতিটি সেট উপস্থাপনের জন্য বহুভুজ বা অন্যান্য চিত্র ব্যবহার করা প্রয়োজন। ওভারল্যাপিং উপগ্রহগুলি বর্ণনা করে এমন ডেটা নিয়ে কাজ করার সময়, আমি কীভাবে নির্ধারণ করতে …

1
সর্বাধিক দক্ষ ডেটা ইনডেক্সিং কৌশল
যেমনটি আমরা সকলেই জানি, এখানে কিছু ডেটা ইনডেক্সিং কৌশল রয়েছে যা সুপরিচিত ইনডেক্সিং অ্যাপ্লিকেশনগুলি ব্যবহার করে যেমন Lucene (জাভা জন্য) বা Lucene.NET (। নেট), মারমুরহ্যাশ, বি + ট্রি ইত্যাদি একটি নো-স্কিল / অবজেক্টের জন্য ওরিয়েন্টেড ডাটাবেস (যা আমি C # দিয়ে একটু লেখার / খেলার চেষ্টা করি), আপনি কোন কৌশলটির …

4
গ্যাস খরচ বহিরাগতদের সনাক্তকরণ - নিউরাল নেটওয়ার্ক প্রকল্প। খারাপ ফলাফল
আমি নিউরাল নেটওয়ার্কের মডেল তৈরি করে কিছু ডাচ বিল্ডিংয়ের জ্বালানী গ্যাস গ্রহণের ক্ষেত্রে আউটলিয়ারদের সনাক্ত করার চেষ্টা করেছি। আমার খুব খারাপ ফলাফল হয়েছে, তবে কারণ খুঁজে পাচ্ছি না। আমি কোনও বিশেষজ্ঞ নই তাই আমি আপনাকে জিজ্ঞাসা করতে চাই আমি কী উন্নতি করতে পারি এবং আমি কী ভুল করছি। এটি সম্পূর্ণ …

5
পিএইচডি প্রোগ্রামের জন্য যোগ্যতা
ইয়ান লেকুন তার এএমএ-তে উল্লেখ করেছিলেন যে শীর্ষস্থানীয় একটি প্রতিষ্ঠানে চাকরি পাওয়ার জন্য তিনি পিএইচডি করা অত্যন্ত গুরুত্বপূর্ণ বলে মনে করেন। আমার পরিসংখ্যান বিষয়ে স্নাতকোত্তর রয়েছে এবং আমার আন্ডারগ্র্যাড অর্থনীতিতে এবং প্রয়োগিত গণিতে ছিল, তবে আমি এখন এমএল পিএইচডি প্রোগ্রামগুলি সন্ধান করছি। বেশিরভাগ প্রোগ্রাম বলে যে একেবারে প্রয়োজনীয় সিএস কোর্স …
10 education 

3
আর মেমরির সীমাবদ্ধতাগুলি কী কী?
" ফলিত ভবিষ্যদ্বাণীমূলক মডেলিং " পর্যালোচনা করে একজন পর্যালোচক বলেছেন : আমার কাছে স্ট্যাটিস্টিকাল লার্নিংয়ের (এসএল) শিক্ষাগুলির একটি সমালোচনা হ'ল বিভিন্ন মডেলিং কৌশলগুলির মূল্যায়নে গণনা কর্মক্ষমতা বিবেচনার অনুপস্থিতি। বুটস্ট্র্যাপিং এর উপর জোর দেওয়া এবং সুর / পরীক্ষার মডেলগুলিতে ক্রস-বৈধকরণের সাথে, এসএল বেশ গণ্য-নিবিড়। এতে আরও যোগ করুন যে ব্যাগিং এবং …
10 apache-hadoop  r 

2
এটি কি আরডিবিএমএস কার্যকর করার সময়টির সাথে নিও 4j তুলনা সঠিক?
পটভূমি: গ্রাফ ডেটাবেসস বইটি নীচে দেওয়া হয়েছে , যা নিও 4 জে বইয়ে উল্লিখিত একটি পারফরম্যান্স টেস্ট কভার করে : কোনও গ্রাফের মধ্যে সম্পর্ক প্রাকৃতিকভাবে পথ তৈরি করে। অনুসন্ধান, বা ট্র্যাভারিং, গ্রাফের সাথে নিম্নলিখিত পথগুলি জড়িত। ডেটামোডেলের মৌলিকভাবে পথ-কেন্দ্রিক প্রকৃতির কারণে, বেশিরভাগ পাথ-ভিত্তিক গ্রাফ ডাটাবেস ক্রিয়াকলাপগুলি যেভাবে ডেটা বিভক্ত করা …
10 databases  nosql  neo4j 

4
লাইব্রেরি ব্যবহার করার সময় দক্ষতা দেওয়া কেন কঠিন?
যে কোনও ছোট ডাটাবেস প্রসেসিং সহজেই পাইথন / পার্ল / ... স্ক্রিপ্টগুলির দ্বারা মোকাবেলা করা যায়, এটি ভাষা থেকে লাইব্রেরি এবং / অথবা এমনকি ইউটিলিটি ব্যবহার করে। যাইহোক, যখন এটি সম্পাদনের কথা আসে তখন লোকেরা C / C ++ / নিম্ন-স্তরের ভাষাগুলি সন্ধান করে। প্রয়োজন অনুসারে কোডটি টেলিংয়ের সম্ভাবনাটি মনে …

3
24,000 বিভাগ সহ একটি শ্রেণি কীভাবে এনকোড করা যায়?
আমি বর্তমানে জিনোমিক্সের জন্য একটি লজিস্টিক রিগ্রেশন মডেল নিয়ে কাজ করছি। একটি ইনপুট ক্ষেত্রগুলির মধ্যে আমি একটি কোভারিয়েট হিসাবে অন্তর্ভুক্ত করতে চাই genes। প্রায় 24,000 টি জিন রয়েছে। কম্পিউটেশনাল বায়োলজিতে এই স্তরের পরিবর্তনশীলতার সাথে অনেকগুলি বৈশিষ্ট্য রয়েছে এবং কয়েক লক্ষ লক্ষ নমুনা প্রয়োজন। আমি যদি LabelEncoder()সেই 24 কে জিন করি …

2
কনভলিউশনাল 1 ডি, কনভলিউশনাল 2 ডি এবং কনভোলিউশনাল 3 ডি এর মধ্যে পার্থক্য কী?
আমি কনভলিউশনাল নিউরাল নেটওয়ার্কগুলি সম্পর্কে শিখছি। Kerasউদাহরণগুলির দিকে তাকানোর সময় , আমি তিনটি পৃথক সমঝোতা পদ্ধতি জুড়ে এসেছি। যথা, 1 ডি, 2 ডি এবং 3 ডি। এই তিনটি স্তরের মধ্যে পার্থক্য কী? তাদের ব্যবহারের ক্ষেত্রে কী কী? তাদের ব্যবহারের কেসগুলি দেখানোর জন্য কি কিছু লিঙ্ক বা রেফারেন্স রয়েছে?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.