তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
ভারসাম্যহীন হিসাবে কখন আমাদের একটি ডেটাসেট বিবেচনা করা উচিত?
আমি এমন পরিস্থিতির মুখোমুখি হচ্ছি যেখানে কোনও ডেটাসেটে ইতিবাচক এবং নেতিবাচক উদাহরণগুলির সংখ্যা ভারসাম্যহীন। আমার প্রশ্ন হ'ল, থাম্বের এমন কোনও নিয়ম রয়েছে যা আমাদের জানান যে কখন আমাদের ডেটাসেটে একরকম ভারসাম্য বজায় রাখার জন্য বৃহত বিভাগটি সাবমেল করা উচিত। উদাহরণ: যদি ইতিবাচক উদাহরণগুলির সংখ্যা 1000 এবং নেতিবাচক উদাহরণগুলির সংখ্যা 10,000 …

5
মেশিন লার্নিংয়ে ডাইমেনশন-হপ্পিং
মেশিন লার্নিংয়ের ক্ষেত্রে ডাইমেনশন হপিং সমস্যাটি কী (কনভোলশনাল নিউরাল নেটওয়ার্ক এবং চিত্রের স্বীকৃতিতে ঘটে)? আমি এটি সম্পর্কে গুগল করেছি তবে আমি যা পাই তা হ'ল পদার্থবিজ্ঞানের উপাদানগুলির আকৃতি বিকৃতি সম্পর্কিত তথ্য। কেউ যদি মেশিন লার্নিং সম্পর্কিত উদাহরণ সহ এটি ব্যাখ্যা করেন তবে এটি আমার পক্ষে আরও সহায়ক হবে। কেউ কি …

1
কেরাস ব্যবহার করে গভীর শিক্ষার জন্য ডেটা পুনরায় আকার দেওয়া
আমি কেরাসের একজন শিক্ষানবিস এবং লাইব্রেরিটি আসলে কীভাবে কাজ করে তা বোঝার জন্য আমি এমএনআইএস্ট উদাহরণ দিয়ে শুরু করেছি। কেরাস উদাহরণ ফোল্ডারে এমএনআইএসটি সমস্যার কোড স্নিপেটটি দেওয়া হয়েছে: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Activation, …

2
কোনও এসকিউএল টেবিলে স্বয়ংক্রিয়ভাবে বিড়ম্বনা সনাক্তকরণের সরঞ্জামগুলি?
আমার কাছে একটি বড় এসকিউএল টেবিল রয়েছে যা মূলত একটি লগ। ডেটাটি বেশ জটিল এবং আমি সমস্ত ডেটা আমাকে না বুঝে ব্যতিক্রমগুলি সনাক্ত করার জন্য কোনও উপায় অনুসন্ধান করার চেষ্টা করছি। অ্যানোমালি সনাক্তকরণের জন্য আমি প্রচুর সরঞ্জাম পেয়েছি তবে তাদের বেশিরভাগের জন্য "মিডল ম্যান" প্রকারের প্রয়োজন, যেমন ইলাস্টিক অনুসন্ধান, স্প্লঙ্ক …

2
পাইথন মেশিন লার্নিং / ডেটা সায়েন্স প্রকল্পের কাঠামো
পাইথন মেশিন লার্নিং প্রকল্পটি কীভাবে সংগঠিত করা উচিত সে সম্পর্কে আমি তথ্য খুঁজছি। পাইথন স্বাভাবিক প্রকল্পের জন্য আছে Cookiecutter এবং R জন্য ProjectTemplate । এটি আমার বর্তমান ফোল্ডার কাঠামো, তবে আমি জপিটার নোটবুকগুলি প্রকৃত পাইথন কোডের সাথে মিশ্রিত করছি এবং এটি খুব পরিষ্কার বলে মনে হয় না। . ├── cache …
10 python 

3
বেইস নেটওয়ার্কে প্রান্তের দিকটি কি অপ্রাসঙ্গিক?
আজ, একটি বক্তৃতায় দাবি করা হয়েছিল যে বেয়েস নেটওয়ার্কের প্রান্তগুলির দিকটি আসলেই গুরুত্বপূর্ণ নয়। তাদের কার্যকারিতা উপস্থাপন করার দরকার নেই। এটা স্পষ্ট যে আপনি কোনও বয়েস নেটওয়ার্কে কোনও একক প্রান্ত পরিবর্তন করতে পারবেন না। উদাহরণস্বরূপ, যাক সঙ্গে ভী = { বনাম 1 , V 2 , V 3 } এবং …

2
ggvis বনাম ggplot2 + চকচকে; ইন্টারেক্টিভ ভিজুয়ালাইজেশনের জন্য কোনটি বেছে নেবেন?
ক্রসভিলেটেডে এখানে একই রকম প্রশ্ন রয়েছে এবং আমি উত্তরগুলি পড়েছি। আমার প্রশ্নটি কিছুটা আলাদা। আমি কেবল আমার ডেটা ভিজ্যুয়ালাইজ করতে চাই না এবং প্রকৃতপক্ষে যা আমি ভিজ্যুয়ালাইজ করতে চাই তা উভয়ই প্যাকেজের মাধ্যমে ভিজ্যুয়ালাইজ করা সহজ নয়। আমার প্লটটিতে আমার দুটি সেট পয়েন্ট রয়েছে ( স্থানাঙ্ক)। আমি প্রান্তগুলি যুক্ত করতে …

2
আর-তে ডেটা সায়েন্সের জন্য সফটওয়্যার টেস্টিং
আমার অজগর কোডটি পরীক্ষা করার সময় আমি প্রায়শই নাক, ​​টক্স বা ইউনিটেস্ট ব্যবহার করি , বিশেষত যখন এটি অন্য মডিউল বা কোডের অন্যান্য অংশের সাথে সংহত করতে হয়। যাইহোক, এখন আমি এমএল মডেলিং এবং বিকাশের জন্য পাইথনের চেয়ে আর ব্যবহার করে বেশি খুঁজে পেয়েছি। আমি বুঝতে পেরেছি যে আমি সত্যিকার …

1
হারটিগান-ওয়াং কে-মানে পদ্ধতি এবং অন্যান্য অ্যালগরিদমে রূপান্তর
আমি মূলত ভাষার statsপ্যাকেজে কার্যকর হওয়া বিভিন্ন কে-মানে ক্লাস্টারিং অ্যালগরিদমগুলি বোঝার চেষ্টা করছি R। আমি লয়েডের অ্যালগরিদম এবং ম্যাককুইনের অনলাইন অ্যালগরিদম বুঝতে পারি। আমি তাদের বোঝার উপায়টি নিম্নরূপ: লয়েডের অ্যালগরিদম: প্রাথমিকভাবে 'কে' র্যান্ডম পর্যবেক্ষণগুলি বেছে নেওয়া হয় যা 'কে' ক্লাস্টারের সেন্ট্রয়েড হিসাবে কাজ করবে। তারপরে সেন্ট্রয়েডগুলি একত্রিত হওয়া পর্যন্ত নিম্নলিখিত …
10 r  clustering  k-means 

2
সমস্যার জায়গাগুলি অনেক বড় হলে এআই কীভাবে অভিনয় করতে শিখবে
আমি পরীক্ষা এবং উদাহরণের মাধ্যমে সবচেয়ে ভাল শিখি। আমি স্নায়ুবহুল নেটওয়ার্কগুলি সম্পর্কে শিখছি এবং (আমার মনে হয়) শ্রেণিবিন্যাস এবং প্রতিরোধের সম্পর্কে খুব ভাল বোঝাপড়া এবং তদারকি করা এবং নিরীক্ষণযোগ্য শিক্ষণও রয়েছে, তবে আমি এমন কিছু বিষয়টিতে হোঁচট খেয়েছি যা আমি চুপ করতে পারি না; আমি যদি কোনও এআইকে একটি জটিল …

1
মেশিন লার্নিং ব্যবহার করে সার্ভার লগ বিশ্লেষণ
আমার এই অ্যাপ্লিকেশনটির সার্ভার লগ বিশ্লেষণ করার জন্য আমাকে এই কাজটি অর্পণ করা হয়েছিল যাতে ব্যতিক্রম লগ, ডাটাবেস লগ ইভেন্ট লগ ইত্যাদি রয়েছে। আমি মেশিন লার্নিংয়ে নতুন, আমরা ইলাস্টিক অনুসন্ধান এবং স্পার্কস এমএলিব (বা প্রেডিকশন) এর সাথে স্পার্ক ব্যবহার করি A কোন ব্যবহারকারী পরবর্তী ব্যতিক্রম ঘটতে পারে এবং কোন বৈশিষ্ট্যটিতে …

1
ট্রান্সফর্মিং অটো এনকোডার্স
আমি সবেমাত্র জেনোফ হিন্টনের কাগজটি স্বয়ংক্রিয় সংস্থাগুলি পরিবর্তনের বিষয়ে পড়েছি হিন্টন, ক্রিজেভস্কি এবং ওয়াং: অটো-এনকোডারগুলির রূপান্তর । কৃত্রিম নিউরাল নেটওয়ার্কস এবং মেশিন লার্নিংয়ে, ২০১১। এবং বেশ কিছু এরকম কিছু নিয়ে খেলতে চাই। তবে এটি পড়ে আমি কীভাবে বাস্তবে এটি বাস্তবায়ন করতে পারি সে সম্পর্কে কাগজটি থেকে পর্যাপ্ত বিবরণ পেতে পারি …

1
পাঠ্য-শ্রেণিবদ্ধকরণ-সমস্যা: ওয়ার্ড 2ভেক / এনএন কি সেরা পদ্ধতির?
আমি এমন একটি সিস্টেম ডিজাইন করতে চাই যা পাঠ্যের অনুচ্ছেদে দেওয়া হয়েছে এটি শ্রেণীবদ্ধ করতে এবং প্রসঙ্গটি সনাক্ত করতে সক্ষম হবে: ব্যবহারকারী উত্পন্ন পাঠ্য অনুচ্ছেদ (মতামত / প্রশ্ন / উত্তর মত) দিয়ে প্রশিক্ষিত প্রশিক্ষণ সেটের প্রতিটি আইটেম ট্যাগ করা হবে। যেমন উদাহরণস্বরূপ ("বিভাগ 1", "পাঠ্য অনুচ্ছেদ") শত শত বিভাগ থাকবে …

5
আরএসটির জন্য এলএসটিএম বা অন্যান্য আরএনএন প্যাকেজ
আমি এলএসটিএম মডেলগুলি থেকে শেক্সপিয়ারকে পাঠ্যের মতো উত্পাদন করে কিছু চিত্তাকর্ষক ফলাফল দেখেছি। আমি ভাবছিলাম যে কোনও এলএসটিএম প্যাকেজ আর এর জন্য বিদ্যমান আছে I (সম্ভবত কিছু পারফরম্যান্স ইস্যু রয়েছে যা ব্যাখ্যা করে যে কেন এই প্রোগ্রামগুলিকে আর এর চেয়ে বেশি পছন্দ করা হয়) আপনি কি আর এর জন্য কোনও …
10 r  neural-network  rnn 

2
পান্ডাস ডেটা ফ্রেমে সারিগুলিতে পুনরাবৃত্তি করে নতুন কলাম তৈরি করা হচ্ছে
আমার কাছে এর মতো একটি পান্ডাস ডেটা ফ্রেম রয়েছে (এক্স 11): আসলে আমার কাছে ডেক্স 99 পর্যন্ত 99 কলাম রয়েছে dx1 dx2 dx3 dx4 0 25041 40391 5856 0 1 25041 40391 25081 5856 2 25041 40391 42822 0 3 25061 40391 0 0 4 25041 40391 0 5856 5 …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.