তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

1
নাইভ বেয়েস ক্লাসিফায়ার গণনায় শূন্য ফ্যাক্টর কীভাবে পরিচালনা করবেন?
যদি আমার একটি প্রশিক্ষণের ডেটা সেট থাকে এবং আমি এটিতে একটি নাইভ বয়েস ক্লাসিফায়ারকে প্রশিক্ষণ দিই এবং আমার একটি গুণাবলীর মান রয়েছে যার সম্ভাবনা শূন্য। আমি পরে যদি নতুন ডেটাতে শ্রেণিবিন্যাসের পূর্বাভাস দিতে চাই তবে আমি কীভাবে এটি পরিচালনা করব? সমস্যাটি হ'ল, গণনায় যদি শূন্য থাকে তবে পুরো পণ্যটি শূন্য …

1
পাইথনের মানচিত্রে হিটম্যাপ
মোড অ্যানালিটিকাদের একটি দুর্দান্ত হিটম্যাপ বৈশিষ্ট্য রয়েছে ( https://commune.modeanalytics.com/gallery/geographic-heat-map/ )। তবে এটি মানচিত্রের তুলনায় উপযুক্ত নয় (প্রতি রিপোর্টে কেবল একটি)। তারা যা অনুমতি দেয় তা হ'ল ডেটা একটি মোড়ানো পাইথন নোটবুকের কাছে সহজেই টানানো। এবং তারপরে পাইথনের যে কোনও চিত্র সহজেই একটি প্রতিবেদনে যুক্ত করা যায়। সুতরাং আমার প্রশ্নটি হল: …

5
আধুনিক আর এবং / বা পাইথন গ্রন্থাগারগুলি কি এসকিউএলকে অচল করে দেয়?
আমি একটি অফিসে কাজ করি যেখানে এসকিউএল সার্ভারটি ডেটা প্রক্রিয়াকরণ থেকে শুরু করে মুংগিং পর্যন্ত আমাদের যা কিছু করি তার মেরুদণ্ড। আমার সহকর্মী আগত তথ্যগুলিকে পদ্ধতিগতভাবে প্রক্রিয়াজাত করার জন্য জটিল ফাংশন এবং সঞ্চিত প্রক্রিয়াগুলি রচনায় দক্ষ হয় যাতে এটি মানক করা যায় এবং রিপোর্ট, ভিজ্যুয়ালাইজেশন এবং বিশ্লেষণ প্রকল্পগুলিতে কাজ করা …
14 python  r  data-cleaning  data  sql 

1
সর্বাধিক পুলিং স্তরগুলির মাধ্যমে পিছনে প্রচার
আমার এই প্রশ্নের একটি ছোট উপ- প্রশ্ন রয়েছে । আমি বুঝতে পারি যে সর্বাধিক পুলিং স্তরের মাধ্যমে ব্যাক-প্রসারণ করার সময় গ্রেডিয়েন্টটি এমনভাবে ফিরে যায় যে পূর্ববর্তী স্তরের নিউরন যা সর্বোচ্চ হিসাবে নির্বাচিত হয়েছিল সমস্ত গ্রেডিয়েন্ট পায়। আমি যে সম্পর্কে 100% নিশ্চিত নই তা হ'ল পরবর্তী স্তরটির গ্রেডিয়েন্ট কীভাবে পুলিং স্তরে …

3
Doc2vec (gensim) - আমি কীভাবে অদেখা বাক্যগুলির লেবেল অনুমান করতে পারি?
https://radimrehurek.com/gensim/models/doc2vec.html উদাহরণস্বরূপ, যদি আমরা ডক 2 ওয়েভ দিয়ে প্রশিক্ষিত হয়ে থাকি "আআআআএএএএএএএএএএএএ" "" লেবেল 1 " "BbbbbbBBBBBbbbb" - "লেবেল 2" আমরা "aaaAAAAAaaaaAA" ​​ডক 2vec ব্যবহার করে 1 লেবেলটি নির্ধারণ করতে পারি? আমি জানি ডক 2vec শব্দ ভেক্টর এবং লেবেল ভেক্টরকে প্রশিক্ষণ দিতে পারে। এই ভেক্টরগুলি ব্যবহার করে, আমরা কোন লেবেলে …
14 gensim 

1
একটি (গতিশীল) বেয়েস নেটওয়ার্ক এবং এইচএমএম-এর মধ্যে পার্থক্য কী?
আমি পড়েছি যে এইচএমএস, পার্টিকাল ফিল্টার এবং কালম্যান ফিল্টারগুলি গতিশীল বায়েস নেটওয়ার্কগুলির বিশেষ বিষয়। তবে আমি কেবল এইচএমএমগুলিকেই জানি এবং আমি গতিশীল বায়েস নেটওয়ার্কগুলির মধ্যে পার্থক্য দেখতে পাই না। কেউ দয়া করে ব্যাখ্যা করতে পারেন? আপনার উত্তরটি নিম্নলিখিতগুলির মতো হতে পারে তবে এটি চমৎকার হবে তবে বেইস নেটওয়ার্কগুলির জন্য: লুকানো …

3
ভারসাম্যহীন ক্লাসের সাথে, আমাকে কী আমার বৈধতা / পরীক্ষার ডেটাসেটের নমুনার অধীনে ব্যবহার করতে হবে?
আমি মেশিন লার্নিংয়ের একটি শিক্ষানবিশ এবং আমি একটি পরিস্থিতির মুখোমুখি হয়েছি। আইপিন ইউ ডেটাসেটের সাথে আমি রিয়েল টাইম বিডিং সমস্যা নিয়ে কাজ করছি এবং আমি ক্লিকের পূর্বাভাস দেওয়ার চেষ্টা করছি। জিনিসটি হ'ল আপনি যেমন জানেন যে ডেটাসেটটি খুব ভারসাম্যহীন: প্রায় 1 টি ইতিবাচক উদাহরণের জন্য 1300 নেতিবাচক উদাহরণ (ক্লিক নয়) …

2
হাই-ডাইমেনশনাল ডেটা: দরকারী কৌশলগুলি কী কী তা জানুন?
মাত্রিকতার বিভিন্ন অভিশাপের কারণে , প্রচলিত ভবিষ্যদ্বাণীমূলক প্রযুক্তির অনেকের যথার্থতা এবং গতি উচ্চ মাত্রিক ডেটাতে অবনমিত হয়। উচ্চ-মাত্রিক ডেটা কার্যকরভাবে মোকাবেলা করতে সহায়তা করে এমন কিছু দরকারী কৌশল / কৌশল / হিউরিস্টিক্স কী কী? উদাহরণ স্বরূপ, নির্দিষ্ট পরিসংখ্যান / মডেলিং পদ্ধতিগুলি উচ্চ-মাত্রিক ডেটাসেটগুলিতে ভাল সম্পাদন করে? আমরা কিছু নির্দিষ্ট (যা …

2
এ / বি পরীক্ষার ফলাফলগুলি বিশ্লেষণ করে যা সাধারণভাবে বিতরণ করা হয় না, স্বতন্ত্র টি-পরীক্ষা ব্যবহার করে
আমার কাছে একটি এ / বি পরীক্ষার ফলাফলের একটি সেট রয়েছে (একটি নিয়ন্ত্রণ গ্রুপ, একটি বৈশিষ্ট্য গোষ্ঠী) যা কোনও সাধারণ বিতরণের উপযুক্ত নয়। প্রকৃতপক্ষে বিতরণটি ল্যান্ডাউ বিতরণের সাথে আরও সাদৃশ্যপূর্ণ। আমি বিশ্বাস করি যে স্বাধীন টি-টেস্টের প্রয়োজন হয় যে নমুনাগুলি কমপক্ষে প্রায় সাধারণভাবে বিতরণ করা উচিত, যা আমাকে টি-টেস্টকে তাত্পর্য …

3
পি-ভ্যালু কখন প্রতারক হয়?
আমাদের কীভাবে ডেটা শর্তগুলির জন্য নজর রাখা উচিত, যেখানে পি-মানগুলি পরিসংখ্যানিক তাত্পর্যটি নির্ধারণের সেরা উপায় নাও হতে পারে? এই বিভাগে আসা কোনও নির্দিষ্ট ধরণের সমস্যা রয়েছে?

3
চিত্রের আকার পরিবর্তন এবং সিএনএন এর জন্য প্যাডিং
আমি চিত্র শনাক্তকরণের জন্য একটি সিএনএন প্রশিক্ষণ দিতে চাই। প্রশিক্ষণের জন্য চিত্রগুলির নির্দিষ্ট আকার নেই। উদাহরণস্বরূপ, আমি সিএনএন-এর ইনপুট আকার 50x100 (উচ্চতা x প্রস্থ) হওয়া চাই। যখন আমি কিছু ছোট আকারের চিত্রগুলি (উদাহরণস্বরূপ 32x32) ইনপুট আকারে পরিবর্তন করি, তখন চিত্রটির সামগ্রীটি অনুভূমিকভাবে খুব বেশি প্রসারিত হয়, তবে কিছু মাঝারি আকারের …

1
সিদ্ধান্ত গাছ: পাতা-ভিত্তিক (সেরা-প্রথম) এবং স্তর-ভিত্তিক গাছের ট্রাসস
সংখ্যা 1: লাইটজিবিএমের বর্ণনাটি যেভাবে গাছটি প্রসারিত করা হয়েছে সে সম্পর্কে আমি বিভ্রান্ত হয়ে পড়েছি । তারা বলে: বেশিরভাগ সিদ্ধান্ত গাছ শেখার অ্যালগরিদমগুলি নীচের চিত্রের মতো স্তর (গভীরতা) অনুসারে গাছ বৃদ্ধি করে: প্রশ্ন 1 : কোন "সর্বাধিক" অ্যালগরিদমগুলি এভাবে প্রয়োগ করা হয়? যতদূর আমি জানি সি 4.5 এবং কার্ট ডিএফএস …


3
যদি ম্যাক্স পুলিং কেবল যেভাবেই চিত্রের নিচে নমুনা নিতে চলেছে তবে কেন দৃolute়প্রতিজ্ঞ?
প্রান্ত সনাক্তকরণের মতো কিছু করার জন্য ফিল্টার প্রয়োগ করার ধারণাটি একটি দুর্দান্ত ধারণা। উদাহরণস্বরূপ, আপনি একটি image এর একটি চিত্র নিতে পারেন some কিছু ফিল্টার দিয়ে, আপনি রূপান্তরিত চিত্রগুলি দিয়ে শেষ করতে পারেন যা মূল চিত্রের বিভিন্ন বৈশিষ্ট্যকে জোর দেয়। মূল 7: নেটওয়ার্ক হিসাবে অভিজ্ঞ হতে পারে: প্রতিটি চিত্র কীভাবে …

4
প্রাক-প্রশিক্ষিত মডেল ওজন সহ একটি নতুন ওয়ার্ড টুভেল মডেলকে কীভাবে সূচনা করবেন?
ওয়ার্ড টু ওয়েક્ટર মডেলটি ব্যবহার এবং প্রশিক্ষণের জন্য আমি পাইথনে জেনসিম লাইব্রেরিটি ব্যবহার করছি। সম্প্রতি, আমি কিছু প্রাক প্রশিক্ষিত ওয়ার্ড টু ওয়েভ মডেল (গুগল নিউডাটাসেট প্রিটেইনড মডেল) দিয়ে আমার মডেল ওজন সূচনা করার দিকে তাকিয়ে ছিলাম। আমি কয়েক সপ্তাহ ধরে এটির সাথে লড়াই করে যাচ্ছি। এখন, আমি সবেমাত্র অনুসন্ধান করেছি …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.