তথ্য বিজ্ঞান

1

নাইভ বেয়েস ক্লাসিফায়ার গণনায় শূন্য ফ্যাক্টর কীভাবে পরিচালনা করবেন?

যদি আমার একটি প্রশিক্ষণের ডেটা সেট থাকে এবং আমি এটিতে একটি নাইভ বয়েস ক্লাসিফায়ারকে প্রশিক্ষণ দিই এবং আমার একটি গুণাবলীর মান রয়েছে যার সম্ভাবনা শূন্য। আমি পরে যদি নতুন ডেটাতে শ্রেণিবিন্যাসের পূর্বাভাস দিতে চাই তবে আমি কীভাবে এটি পরিচালনা করব? সমস্যাটি হ'ল, গণনায় যদি শূন্য থাকে তবে পুরো পণ্যটি শূন্য …

14 classification naive-bayes-classifier

1

পাইথনের মানচিত্রে হিটম্যাপ

মোড অ্যানালিটিকাদের একটি দুর্দান্ত হিটম্যাপ বৈশিষ্ট্য রয়েছে ( https://commune.modeanalytics.com/gallery/geographic-heat-map/ )। তবে এটি মানচিত্রের তুলনায় উপযুক্ত নয় (প্রতি রিপোর্টে কেবল একটি)। তারা যা অনুমতি দেয় তা হ'ল ডেটা একটি মোড়ানো পাইথন নোটবুকের কাছে সহজেই টানানো। এবং তারপরে পাইথনের যে কোনও চিত্র সহজেই একটি প্রতিবেদনে যুক্ত করা যায়। সুতরাং আমার প্রশ্নটি হল: …

14 python visualization geospatial

5

আধুনিক আর এবং / বা পাইথন গ্রন্থাগারগুলি কি এসকিউএলকে অচল করে দেয়?

আমি একটি অফিসে কাজ করি যেখানে এসকিউএল সার্ভারটি ডেটা প্রক্রিয়াকরণ থেকে শুরু করে মুংগিং পর্যন্ত আমাদের যা কিছু করি তার মেরুদণ্ড। আমার সহকর্মী আগত তথ্যগুলিকে পদ্ধতিগতভাবে প্রক্রিয়াজাত করার জন্য জটিল ফাংশন এবং সঞ্চিত প্রক্রিয়াগুলি রচনায় দক্ষ হয় যাতে এটি মানক করা যায় এবং রিপোর্ট, ভিজ্যুয়ালাইজেশন এবং বিশ্লেষণ প্রকল্পগুলিতে কাজ করা …

14 python r data-cleaning data sql

1

সর্বাধিক পুলিং স্তরগুলির মাধ্যমে পিছনে প্রচার

আমার এই প্রশ্নের একটি ছোট উপ- প্রশ্ন রয়েছে । আমি বুঝতে পারি যে সর্বাধিক পুলিং স্তরের মাধ্যমে ব্যাক-প্রসারণ করার সময় গ্রেডিয়েন্টটি এমনভাবে ফিরে যায় যে পূর্ববর্তী স্তরের নিউরন যা সর্বোচ্চ হিসাবে নির্বাচিত হয়েছিল সমস্ত গ্রেডিয়েন্ট পায়। আমি যে সম্পর্কে 100% নিশ্চিত নই তা হ'ল পরবর্তী স্তরটির গ্রেডিয়েন্ট কীভাবে পুলিং স্তরে …

14 machine-learning neural-network convnet backpropagation

3

Doc2vec (gensim) - আমি কীভাবে অদেখা বাক্যগুলির লেবেল অনুমান করতে পারি?

https://radimrehurek.com/gensim/models/doc2vec.html উদাহরণস্বরূপ, যদি আমরা ডক 2 ওয়েভ দিয়ে প্রশিক্ষিত হয়ে থাকি "আআআআএএএএএএএএএএএএ" "" লেবেল 1 " "BbbbbbBBBBBbbbb" - "লেবেল 2" আমরা "aaaAAAAAaaaaAA" ডক 2vec ব্যবহার করে 1 লেবেলটি নির্ধারণ করতে পারি? আমি জানি ডক 2vec শব্দ ভেক্টর এবং লেবেল ভেক্টরকে প্রশিক্ষণ দিতে পারে। এই ভেক্টরগুলি ব্যবহার করে, আমরা কোন লেবেলে …

14 gensim

1

একটি (গতিশীল) বেয়েস নেটওয়ার্ক এবং এইচএমএম-এর মধ্যে পার্থক্য কী?

আমি পড়েছি যে এইচএমএস, পার্টিকাল ফিল্টার এবং কালম্যান ফিল্টারগুলি গতিশীল বায়েস নেটওয়ার্কগুলির বিশেষ বিষয়। তবে আমি কেবল এইচএমএমগুলিকেই জানি এবং আমি গতিশীল বায়েস নেটওয়ার্কগুলির মধ্যে পার্থক্য দেখতে পাই না। কেউ দয়া করে ব্যাখ্যা করতে পারেন? আপনার উত্তরটি নিম্নলিখিতগুলির মতো হতে পারে তবে এটি চমৎকার হবে তবে বেইস নেটওয়ার্কগুলির জন্য: লুকানো …

14 bayesian-networks pgm

3

ভারসাম্যহীন ক্লাসের সাথে, আমাকে কী আমার বৈধতা / পরীক্ষার ডেটাসেটের নমুনার অধীনে ব্যবহার করতে হবে?

আমি মেশিন লার্নিংয়ের একটি শিক্ষানবিশ এবং আমি একটি পরিস্থিতির মুখোমুখি হয়েছি। আইপিন ইউ ডেটাসেটের সাথে আমি রিয়েল টাইম বিডিং সমস্যা নিয়ে কাজ করছি এবং আমি ক্লিকের পূর্বাভাস দেওয়ার চেষ্টা করছি। জিনিসটি হ'ল আপনি যেমন জানেন যে ডেটাসেটটি খুব ভারসাম্যহীন: প্রায় 1 টি ইতিবাচক উদাহরণের জন্য 1300 নেতিবাচক উদাহরণ (ক্লিক নয়) …

14 machine-learning dataset sampling

2

হাই-ডাইমেনশনাল ডেটা: দরকারী কৌশলগুলি কী কী তা জানুন?

মাত্রিকতার বিভিন্ন অভিশাপের কারণে , প্রচলিত ভবিষ্যদ্বাণীমূলক প্রযুক্তির অনেকের যথার্থতা এবং গতি উচ্চ মাত্রিক ডেটাতে অবনমিত হয়। উচ্চ-মাত্রিক ডেটা কার্যকরভাবে মোকাবেলা করতে সহায়তা করে এমন কিছু দরকারী কৌশল / কৌশল / হিউরিস্টিক্স কী কী? উদাহরণ স্বরূপ, নির্দিষ্ট পরিসংখ্যান / মডেলিং পদ্ধতিগুলি উচ্চ-মাত্রিক ডেটাসেটগুলিতে ভাল সম্পাদন করে? আমরা কিছু নির্দিষ্ট (যা …

14 machine-learning statistics dimensionality-reduction

2

এ / বি পরীক্ষার ফলাফলগুলি বিশ্লেষণ করে যা সাধারণভাবে বিতরণ করা হয় না, স্বতন্ত্র টি-পরীক্ষা ব্যবহার করে

আমার কাছে একটি এ / বি পরীক্ষার ফলাফলের একটি সেট রয়েছে (একটি নিয়ন্ত্রণ গ্রুপ, একটি বৈশিষ্ট্য গোষ্ঠী) যা কোনও সাধারণ বিতরণের উপযুক্ত নয়। প্রকৃতপক্ষে বিতরণটি ল্যান্ডাউ বিতরণের সাথে আরও সাদৃশ্যপূর্ণ। আমি বিশ্বাস করি যে স্বাধীন টি-টেস্টের প্রয়োজন হয় যে নমুনাগুলি কমপক্ষে প্রায় সাধারণভাবে বিতরণ করা উচিত, যা আমাকে টি-টেস্টকে তাত্পর্য …

14 dataset statistics ab-test

3

পি-ভ্যালু কখন প্রতারক হয়?

আমাদের কীভাবে ডেটা শর্তগুলির জন্য নজর রাখা উচিত, যেখানে পি-মানগুলি পরিসংখ্যানিক তাত্পর্যটি নির্ধারণের সেরা উপায় নাও হতে পারে? এই বিভাগে আসা কোনও নির্দিষ্ট ধরণের সমস্যা রয়েছে?

14 bigdata statistics

3

চিত্রের আকার পরিবর্তন এবং সিএনএন এর জন্য প্যাডিং

আমি চিত্র শনাক্তকরণের জন্য একটি সিএনএন প্রশিক্ষণ দিতে চাই। প্রশিক্ষণের জন্য চিত্রগুলির নির্দিষ্ট আকার নেই। উদাহরণস্বরূপ, আমি সিএনএন-এর ইনপুট আকার 50x100 (উচ্চতা x প্রস্থ) হওয়া চাই। যখন আমি কিছু ছোট আকারের চিত্রগুলি (উদাহরণস্বরূপ 32x32) ইনপুট আকারে পরিবর্তন করি, তখন চিত্রটির সামগ্রীটি অনুভূমিকভাবে খুব বেশি প্রসারিত হয়, তবে কিছু মাঝারি আকারের …

14 machine-learning image-classification preprocessing image-recognition

1

সিদ্ধান্ত গাছ: পাতা-ভিত্তিক (সেরা-প্রথম) এবং স্তর-ভিত্তিক গাছের ট্রাসস

সংখ্যা 1: লাইটজিবিএমের বর্ণনাটি যেভাবে গাছটি প্রসারিত করা হয়েছে সে সম্পর্কে আমি বিভ্রান্ত হয়ে পড়েছি । তারা বলে: বেশিরভাগ সিদ্ধান্ত গাছ শেখার অ্যালগরিদমগুলি নীচের চিত্রের মতো স্তর (গভীরতা) অনুসারে গাছ বৃদ্ধি করে: প্রশ্ন 1 : কোন "সর্বাধিক" অ্যালগরিদমগুলি এভাবে প্রয়োগ করা হয়? যতদূর আমি জানি সি 4.5 এবং কার্ট ডিএফএস …

14 decision-trees xgboost

3

এলএসটিএম স্ট্যাকিংয়ের সুবিধা?

আমি ভাবছি কোন পরিস্থিতিতে এলএসটিএম স্ট্যাক করা সুবিধাজনক?

14 machine-learning neural-network deep-learning lstm

3

যদি ম্যাক্স পুলিং কেবল যেভাবেই চিত্রের নিচে নমুনা নিতে চলেছে তবে কেন দৃolute়প্রতিজ্ঞ?

প্রান্ত সনাক্তকরণের মতো কিছু করার জন্য ফিল্টার প্রয়োগ করার ধারণাটি একটি দুর্দান্ত ধারণা। উদাহরণস্বরূপ, আপনি একটি image এর একটি চিত্র নিতে পারেন some কিছু ফিল্টার দিয়ে, আপনি রূপান্তরিত চিত্রগুলি দিয়ে শেষ করতে পারেন যা মূল চিত্রের বিভিন্ন বৈশিষ্ট্যকে জোর দেয়। মূল 7: নেটওয়ার্ক হিসাবে অভিজ্ঞ হতে পারে: প্রতিটি চিত্র কীভাবে …

14 neural-network

4

প্রাক-প্রশিক্ষিত মডেল ওজন সহ একটি নতুন ওয়ার্ড টুভেল মডেলকে কীভাবে সূচনা করবেন?

ওয়ার্ড টু ওয়েક્ટર মডেলটি ব্যবহার এবং প্রশিক্ষণের জন্য আমি পাইথনে জেনসিম লাইব্রেরিটি ব্যবহার করছি। সম্প্রতি, আমি কিছু প্রাক প্রশিক্ষিত ওয়ার্ড টু ওয়েভ মডেল (গুগল নিউডাটাসেট প্রিটেইনড মডেল) দিয়ে আমার মডেল ওজন সূচনা করার দিকে তাকিয়ে ছিলাম। আমি কয়েক সপ্তাহ ধরে এটির সাথে লড়াই করে যাচ্ছি। এখন, আমি সবেমাত্র অনুসন্ধান করেছি …

14 python nlp word-embeddings word2vec gensim