তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

2
বৈধতা হ্রাস এবং নির্ভুলতা স্থির থাকে remain
আমি এই কাগজটি মেডিকেল ইমেজের সেটগুলিতে প্রয়োগ করার চেষ্টা করছি । আমি কেরাসে এটি করছি। নেটওয়ার্কটিতে মূলত 4 টি রূপান্তর এবং সর্বাধিক-পুল স্তর থাকে যার পরে একটি সম্পূর্ণ সংযুক্ত স্তর এবং নরম সর্বাধিক শ্রেণিবদ্ধ হয়। আমি যতদূর জানি, আমি কাগজে উল্লিখিত আর্কিটেকচারটি অনুসরণ করেছি। যাইহোক, বৈধতা হ্রাস এবং নির্ভুলতা কেবল …

3
পান্ডাসে শ্রেণিবদ্ধ কলামগুলি গণ রূপান্তর করুন (এক-গরম এনকোডিং নয়)
আমার কাছে টন শ্রেণিবদ্ধ কলামগুলির সাথে পান্ডাস ডেটাফ্রেম রয়েছে, যা আমি বিজ্ঞান-শিখার সাথে সিদ্ধান্ত গাছে ব্যবহার করার পরিকল্পনা করছি। আমি তাদেরকে সংখ্যাসূচক মানগুলিতে রূপান্তর করতে হবে (একটি উষ্ণ ভেক্টর নয়)। আমি এটি সাইকিট-লার্ন থেকে LabelEncoder দিয়ে করতে পারি। সমস্যাটি হচ্ছে তাদের মধ্যে অনেকগুলি রয়েছে এবং আমি সেগুলি ম্যানুয়ালি রূপান্তর করতে …

3
ভারসাম্যহীন ডেটার জন্য টেনসরফ্লো অ্যাডজাস্টিং ব্যয় ফাংশন
আমার অত্যন্ত ভারসাম্যহীন ডেটা সহ শ্রেণিবিন্যাসের সমস্যা রয়েছে। আমি পড়েছি যে ওভার ও আন্ডার স্যাম্পলিংয়ের পাশাপাশি আন্ডারপ্রেডেড শ্রেণিবদ্ধ আউটপুটগুলির জন্য ব্যয় পরিবর্তন করা আরও ভাল ফিটিংয়ের দিকে নিয়ে যাবে। এটি করার আগে টেনসরফ্লো প্রতিটি ইনপুটকে সংখ্যাগরিষ্ঠ গোষ্ঠী হিসাবে শ্রেণীবদ্ধ করে (এবং 90% এর বেশি নির্ভুলতা অর্জন করত, যেমনটি অর্থহীন)। আমি …

1
কেরাসে কাস্টম পারফরম্যান্স মেট্রিক কীভাবে সংজ্ঞায়িত করবেন?
আমি নিম্নলিখিত অনুসারে কেরাসে একটি কাস্টম মেট্রিক ফিউশন (এফ 1-স্কোর) সংজ্ঞায়নের চেষ্টা করেছি: def f1_score(tags, predicted): tags = set(tags) predicted = set(predicted) tp = len(tags & predicted) fp = len(predicted) - tp fn = len(tags) - tp if tp>0: precision=float(tp)/(tp+fp) recall=float(tp)/(tp+fn) return 2*((precision*recall)/(precision+recall)) else: return 0 এখন পর্যন্ত, এত ভাল, …

2
শব্দ স্বীকৃতির জন্য স্পেকট্রোগ্রামের সাথে গভীর শিখন
আমি বর্ণালী ব্যবহার করে শব্দ (উদাহরণস্বরূপ প্রাণীর শব্দ) শ্রেণিবদ্ধ করার সম্ভাবনাটি সন্ধান করছিলাম। ধারণাটি হল স্পেকট্রামে বিভাগগুলি এবং একটি (বা অনেকগুলি) শ্রেণীর লেবেলগুলি আউটপুট সনাক্ত করতে একটি গভীর সমঝোতা সংক্রান্ত নিউরাল নেটওয়ার্কগুলি ব্যবহার করা। এটি কোনও নতুন ধারণা নয় (উদাহরণস্বরূপ তিমি সাউন্ড শ্রেণিবিন্যাস বা সঙ্গীত শৈলীর স্বীকৃতি দেখুন )। আমি …

3
আমি কীভাবে শ্রেণিবদ্ধভাবে ডেটা এবং সংখ্যাসূচক তথ্যগুলির মধ্যে পার্থক্য করতে পারি?
আমি এমন কাউকে জানি যে এমন একটি প্রকল্পে কাজ করছেন যা কলাম বা ডেটা ধরণের বিবেচনা না করে ডেটা ফাইল অন্তর্ভুক্ত করার সাথে জড়িত। কাজটি হ'ল সংখ্যার ডেটাতে যে কোনও সংখ্যক কলাম এবং বিভিন্ন ডেটা ধরণের এবং আউটপুট সংক্ষিপ্ত পরিসংখ্যান সহ একটি ফাইল নেওয়া। তবে নির্দিষ্ট নম্বর-ভিত্তিক ডেটার জন্য কীভাবে …

3
এক্সবিস্টের আনুমানিক বিভাজন পয়েন্ট প্রস্তাব বুঝতে সহায়তা প্রয়োজন
পটভূমি: মধ্যে xgboost টিটিt পুনরাবৃত্তির চেষ্টা একটি গাছ মাপসই চটিচটিf_t সর্বাঙ্গে এনএনn উদাহরণ যা উদ্দেশ্য নিম্নলিখিত ছোট করায়: Σi = 1এন[ ছআমিচটি( এক্সআমি) + 12জআমিচ2টি( এক্সআমি) ]Σআমি=1এন[ছআমিচটি(এক্সআমি)+ +12জআমিচটি2(এক্সআমি)]\sum_{i=1}^n[g_if_t(x_i) + \frac{1}{2}h_if_t^2(x_i)] যেখানে ছআমি, এইচআমিছআমি,জআমিg_i, h_i প্রথম অর্ডার ও আমাদের পূর্ববর্তী সেরা মূল্যায়নের উপর দ্বিতীয় ক্রম ডেরাইভেটিভস হয় Y (পুনরাবৃত্তির থেকে টি …
12 xgboost  gbm 

1
সাইকিট-লার্ন সহ এলোমেলো বনগুলিতে বৈশিষ্ট্য আমদানি ব্যবহার করে বৈশিষ্ট্য নির্বাচন
আমি এলোমেলো বনগুলিতে সাইকিট-লার্ন সহ বৈশিষ্ট্য আমদানির প্লট করেছি । এলোমেলো বন ব্যবহার করে পূর্বাভাস উন্নত করতে, কীভাবে আমি বৈশিষ্ট্যগুলি অপসারণের জন্য প্লটের তথ্য ব্যবহার করতে পারি? অর্থাৎ কীভাবে স্পট তথ্যের উপর ভিত্তি করে কোনও বৈশিষ্ট্য অকার্যকর বা এলোমেলো বনগুলির কর্মক্ষমতা আরও খারাপ হ্রাস কিনা তা স্পষ্ট করবেন কীভাবে? প্লটটি …

3
এনএলটিকে এনইআর সম্পর্কিত সহায়তা
আমি পাইথনটি ব্যবহার করার জন্য কিছুক্ষণ NLTK এ কাজ করছি। আমি যে সমস্যার মুখোমুখি হচ্ছি তা হ'ল এগুলি আমার কাস্টম ডেটা দিয়ে NLTK এ NER প্রশিক্ষণ দেওয়ার জন্য কোনও সহায়তা পাওয়া যায় না। তারা ম্যাক্সেন্ট ব্যবহার করেছে এবং এটি ACE কর্পাসে প্রশিক্ষিত করেছে। আমি ওয়েবে প্রচুর অনুসন্ধান করেছি কিন্তু এনএলটিকে'র …

4
ওয়েবে সরাসরি এডাব্লুএস এস 3-তে একটি বড় ডেটাসেট ডাউনলোড করা
ইউআরএল থেকে অ্যামাজন এস 3-তে কোনও বড় ডেটাसेट আমদানি করা সম্ভব কিনা তা কি কেউ জানেন? মূলত, আমি একটি বিশাল ফাইল ডাউনলোড করা এবং তারপরে এটি ওয়েব পোর্টালের মাধ্যমে এস 3 এ পুনরায় আপলোড করা এড়াতে চাই। আমি কেবল এস 3 এ ডাউনলোড ইউআরএল সরবরাহ করতে চাই এবং তাদের ফাইল …
12 dataset  aws 

2
অসমাপ্ত ব্যবধানে সময় সিরিজ মডেলিং
আমার একটানা পরিবর্তনশীল, অনিয়মিত বিরতিতে এক বছরের জন্য নমুনাযুক্ত। কিছু দিনের প্রতি ঘন্টায় একাধিক পর্যবেক্ষণ থাকে, অন্য সময়কালে কয়েক দিনের জন্য কিছুই থাকে না। এটি সময় সিরিজের নিদর্শনগুলি সনাক্ত করা বিশেষত কঠিন করে তোলে, কারণ কিছু মাস (উদাহরণস্বরূপ অক্টোবর) অত্যন্ত নমুনাযুক্ত হয়, অন্যগুলি হয় না। আমার প্রশ্ন হল এই সময়ের …

3
কিভাবে একটি সামাজিক নেটওয়ার্কের বৃদ্ধি অ্যানিমেট করতে?
যখন নতুন নোড / প্রান্ত এতে যুক্ত করা হয় তখন কীভাবে সামাজিক নেটওয়ার্ক পরিবর্তিত হয় তা ভিজ্যুয়ালিয়াল করার জন্য আমি একটি লাইব্রেরি / সরঞ্জামের সন্ধান করছি। বিদ্যমান সমাধানগুলির মধ্যে একটি হ'ল সোনিয়া: সোশ্যাল নেটওয়ার্ক ইমেজ অ্যানিমেটার । এটি আপনাকে এই মত সিনেমা বানাতে দিন । সোনিয়ার ডকুমেন্টেশন বলছে যে এটি …

2
লিডার বোর্ড স্কোরের খনির প্রবাহে সহায়তার জন্য ওপেনসোর্স সরঞ্জামসমূহ
একটি অনলাইন গেমটিতে ব্যবহারকারীদের স্কোরকে উপস্থাপন করে এমন টিউপস সমন্বিত একটি স্ট্রিম বিবেচনা করুন (user, new_score)। স্ট্রিমে প্রতি সেকেন্ডে 100-1,000 নতুন উপাদান থাকতে পারে। গেমটিতে 200K থেকে 300K অনন্য খেলোয়াড় রয়েছে। আমি কিছু স্থায়ী জিজ্ঞাসা চাই: কোন খেলোয়াড় এক ঘন্টার স্লাইডিং উইন্ডোতে এক্স স্কোরের বেশি পোস্ট করেছেন কোন প্লেয়াররা এক …

3
কীভাবে একটি বিশাল ডাটাবেসে কোনও ক্যোয়ারী নগণ্য বিলম্ব সহ ফিরে আসে?
উদাহরণস্বরূপ, গুগলে কোনও কিছু অনুসন্ধান করার সময়, ফলাফলগুলি তাত্ক্ষণিকভাবে ফিরে আসে। আমি বুঝতে পেরেছি যে গুগল অ্যালগোরিদম ইত্যাদির সাথে পৃষ্ঠাগুলি বাছাই করে এবং সূচনা করে তবে প্রতিটি একক সম্ভাব্য ক্যোয়ারির ফলাফলের সূচীকরণের জন্য এটি অপরিহার্য কল্পনা করি (এবং ফলাফলগুলি ব্যক্তিগতকৃত হয়, যা এটি আরও বেশি অক্ষম রেন্ডার করে)? তদুপরি, গুগলের …
12 bigdata  google  search 

1
আমার কয়টি এলএসটিএম সেল ব্যবহার করা উচিত?
আমার ব্যবহার করা উচিত ন্যূনতম, সর্বাধিক এবং "যুক্তিসঙ্গত" পরিমাণগুলির সাথে সম্পর্কিত কোনও নিয়ামক (বা প্রকৃত নিয়ম) কি আছে? বিশেষত আমি টেনসরফ্লো এবং num_unitsসম্পত্তি থেকে বেসিকএলএসটিএমসেল সম্পর্কিত করছি । অনুগ্রহ করে ধরে নিই যে আমার দ্বারা শ্রেণিবদ্ধকরণের সমস্যা রয়েছে: t - number of time steps n - length of input vector …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.