তথ্য বিজ্ঞান data-mining

4

কে-অর্থ: প্রাথমিক সেন্ট্রয়েডগুলির একটি দক্ষ সেট চয়ন করার কয়েকটি ভাল উপায় কী?

যখন সেন্ট্রয়েডের এলোমেলো সূচনা ব্যবহৃত হয়, তখন কে-অর্থের বিভিন্ন রান বিভিন্ন মোট এসএসই তৈরি করে। এবং এটি অ্যালগরিদমের পারফরম্যান্সে গুরুত্বপূর্ণ। এই সমস্যাটি সমাধানের দিকে কার্যকর কিছু উপায় কী? সাম্প্রতিক পদ্ধতির প্রশংসা করা হয়।

17 data-mining clustering k-means

5

সামুদ্রিক হটম্যাপটি আরও বড় করুন

আমি corr()একটি আসল df এর বাইরে একটি df তৈরি করি । corr()Df প্রয়োগ আউট 70 এক্স 70 এসে তা হিটম্যাপ ঠাহর করা অসম্ভব ... sns.heatmap(df)। যদি আমি এটি প্রদর্শনের চেষ্টা করি corr = df.corr(), টেবিলটি স্ক্রিনের সাথে খাপ খায় না এবং আমি সমস্ত সম্পর্কিততা দেখতে পাচ্ছি। dfএটির আকার নির্বিশেষে পুরো …

17 visualization pandas plotting machine-learning neural-network svm decision-trees svm efficiency python linear-regression machine-learning nlp topic-model lda named-entity-recognition naive-bayes-classifier association-rules fuzzy-logic kaggle deep-learning tensorflow inception classification feature-selection feature-engineering machine-learning scikit-learn tensorflow keras encoding nlp text-mining nlp rnn python neural-network feature-extraction machine-learning predictive-modeling python r linear-regression clustering r ggplot2 neural-network neural-network training python neural-network deep-learning rnn predictive-modeling databases sql programming distribution dataset cross-validation neural-network deep-learning rnn machine-learning machine-learning python deep-learning data-mining tensorflow visualization tools sql embeddings orange feature-extraction unsupervised-learning gan machine-learning python data-mining pandas machine-learning data-mining bigdata apache-spark apache-hadoop deep-learning python convnet keras aggregation clustering k-means r random-forest decision-trees reference-request visualization data pandas plotting neural-network keras rnn theano deep-learning tensorflow inception predictive-modeling deep-learning regression sentiment-analysis nlp encoding deep-learning python scikit-learn lda convnet keras predictive-modeling regression overfitting regression svm prediction machine-learning similarity word2vec information-retrieval word-embeddings neural-network deep-learning rnn

3

ভারসাম্যহীন, ভিন্ন ভিন্ন নেতিবাচক পটভূমিতে এক-শ্রেণীর বৈষম্যমূলক শ্রেণিবিন্যাস?

আমি একটি নির্দিষ্ট শ্রেণীর (নিউরোপেপটাইড হরমোন পূর্ববর্তী) এর অন্তর্গত হিসাবে {প্রোটিন} ক্রম শ্রেণিবদ্ধ করার জন্য, একটি বিদ্যমান তত্ত্বাবধানে শ্রেণিবদ্ধকারীকে উন্নত করতে কাজ করছি। প্রায় ১৩ মিলিয়ন প্রোটিন সিকোয়েন্সের ("অজানা / দুর্বল মন্তব্যযুক্ত ব্যাকগ্রাউন্ড") এর ব্যাকগ্রাউন্ডের বিপরীতে বা প্রায় ১০০,০০০ পর্যালোচনা করা হয়েছে, প্রাসঙ্গিক প্রোটিন রয়েছে যা বিভিন্ন ধরণের সংখ্যার সাথে …

16 machine-learning data-mining python classification

2

আইটেম ভিত্তিক এবং মাহাউটে ব্যবহারকারী ভিত্তিক সুপারিশের পার্থক্য

আমি জানতে চাই যে ঠিক কীভাবে ব্যবহারকারী ভিত্তিক এবং আইটেম ভিত্তিক সুপারিশ একে অপরের থেকে পৃথক। এটি এটি সংজ্ঞায়িত করে ব্যবহারকারী ভিত্তিক : অনুরূপ ব্যবহারকারীদের সন্ধান করে আইটেমগুলির প্রস্তাব দিন। এটি ব্যবহারকারীদের গতিশীল প্রকৃতির কারণে স্কেল করা প্রায়শই শক্ত। আইটেম-ভিত্তিক : আইটেমগুলির মধ্যে সাদৃশ্য গণনা করুন এবং সুপারিশ করুন। আইটেমগুলি …

15 machine-learning data-mining algorithms recommender-system

4

সিদ্ধান্ত গাছ বনাম কেএনএন

কোন ক্ষেত্রে সিদ্ধান্ত গাছ এবং অন্যান্য ক্ষেত্রে কেএনএন ব্যবহার করা ভাল? কেন নির্দিষ্ট কিছু ক্ষেত্রে তাদের একটি ব্যবহার করবেন? এবং অন্য ক্ষেত্রে বিভিন্ন ক্ষেত্রে? (এর কার্যকারিতা দেখে, অ্যালগরিদমে নয়) কারও সম্পর্কে কিছু ব্যাখ্যা বা রেফারেন্স আছে?

15 machine-learning data-mining decision-trees

3

নকশাকাগুলি কেন এত অযৌক্তিক কার্যকর

দেখে মনে হচ্ছে এটি অচল হয়ে পড়েছে যে শিক্ষার্থীদের একটি ঝাঁকুনি সেরা সম্ভাব্য মডেল ফলাফলের দিকে নিয়ে যায় - এবং এটি খুব বিরল হয়ে উঠছে, উদাহরণস্বরূপ, একক মডেলদের যেমন কাগলের মতো প্রতিযোগিতা জয়ের জন্য। কেন ছাঁকনিগুলি এত ঘৃণ্য কার্যকর তার জন্য কোনও তাত্ত্বিক ব্যাখ্যা আছে?

14 machine-learning data-mining predictive-modeling

2

শ্রেণিবদ্ধ / ক্লাস্টার ব্যবহারকারীর প্রোফাইলগুলিতে বৈশিষ্ট্য ব্যবহার করে

আমার কাছে একটি ওয়েবসাইট থেকে পণ্য ক্রয়ের ব্যবহারকারীদের একটি ডেটাসেট রয়েছে। আমার বৈশিষ্ট্যগুলি হ'ল ব্যবহারকারীর আইডি, ব্যবহারকারীর অঞ্চল (রাষ্ট্র), পণ্যের আইডি, পণ্যের আইওয়ার্ড আইডি, ওয়েবসাইটের কীওয়ার্ড আইডি এবং পণ্যের ব্যয় বিক্রয় পরিমাণ। লক্ষ্যটি হ'ল "পুরুষ যুবক গেমার" বা "বাড়ির মা থাকুন" এর মতো ব্যবহারকারীরা কারা পরিচয় হিসাবে কোনও পণ্য এবং …

14 machine-learning data-mining classification clustering

1

অস্পষ্ট টোকেনগুলির ক্রমিকায় একটি ব্যাকরণ সনাক্ত করুন

আমার কাছে পাঠ্য দলিল রয়েছে যা মূলত আইটেমের তালিকা থাকে। প্রতিটি আইটেম বিভিন্ন ধরণের বিভিন্ন টোকেনের একটি গ্রুপ: ফার্স্টনাম, লাস্টনেম, জন্ম তারিখ, ফোন নম্বর, শহর, পেশা, ইত্যাদি etc. একটি টোকেন শব্দের একটি গ্রুপ group আইটেম বিভিন্ন লাইনে থাকা থাকতে পারে। কোনও দস্তাবেজের আইটেমগুলির প্রায় একই টোকেন সিনট্যাক্স রয়েছে তবে অগত্যা …

13 data-mining clustering text-mining time-series correlation

1

নিও 4 জ বনাম ওরিয়েন্টডিবি বনাম টাইটান

আমি সামাজিক সম্পর্ক খনির সম্পর্কিত একটি ডেটা-সায়েন্স প্রকল্পে কাজ করছি এবং কিছু গ্রাফ ডাটাবেসে ডেটা সংরক্ষণ করার প্রয়োজন রয়েছে। প্রাথমিকভাবে আমি Neo4j ডাটাবেস হিসাবে বেছে নিয়েছি। তবে এটি Seo Neo4j ভাল স্কেল না। বিকল্প আমি খুঁজে পেয়েছি হ'ল টাইটান এবং oriebtDB। আমি এই তিনটি ডাটাবেসের সাথে এই তুলনাটি পেরিয়েছি, তবে …

13 data-mining graphs databases social-network-analysis

4

বড় ডেটা কেস স্টাডি বা কেস উদাহরণ ব্যবহার করুন

আমি প্রচুর ব্লগ পড়েছি different বিভিন্ন ধরণের শিল্প কীভাবে বিগ ডেটা অ্যানালিটিক ব্যবহার করছে সে সম্পর্কে নিবন্ধ। তবে এই নিবন্ধগুলির বেশিরভাগই উল্লেখ করতে ব্যর্থ এই সংস্থাগুলি কী কী ডেটা ব্যবহার করেছিল। তথ্য আকার ছিল কি ডেটা প্রক্রিয়া করার জন্য তারা কী ধরণের সরঞ্জাম প্রযুক্তি ব্যবহার করেছিল তারা কী সমস্যার মুখোমুখি …

13 data-mining bigdata usecase

1

একটি হট এনকোডিং এবং একটি এনকোডিং ছেড়ে দেওয়ার মধ্যে পার্থক্য কী?

আমি একটি উপস্থাপনাটি পড়ছি এবং এটি একটি ছাড়ার এনকোডিং ব্যবহার না করার পরামর্শ দিচ্ছে, তবে এটি একটি গরম এনকোডিং সহ ঠিক আছে। আমি ভেবেছিলাম তারা দুজনই এক রকম ছিল। তাদের মধ্যে পার্থক্য কি কেউ বর্ণনা করতে পারেন?

13 machine-learning data-mining feature-selection feature-extraction feature-engineering

2

কাগজের ক্রম বিমূর্তের জন্য কি কোনও এপিআই রয়েছে?

আমার কাছে যদি কাগজের নামের খুব দীর্ঘ তালিকা থাকে তবে আমি কীভাবে ইন্টারনেট বা কোনও ডাটাবেস থেকে এই কাগজপত্রের বিমূর্ততা পেতে পারি? কাগজের নামগুলি "জনস্বাস্থ্যের ডোমেনের জন্য ওয়েব মাইনিংয়ে ইউটিলিটি অব ইউটিলিটি" এর মতো। কেউ কি এমন কোনও এপিআই জানেন যা আমাকে সমাধান দিতে পারে? আমি গুগল স্কলারকে হামাগুড়ি দেওয়ার …

13 data-mining machine-learning

2

এয়ারলাইন ভাড়া - প্রতিযোগিতামূলক মূল্য-নির্ধারণ আচরণ এবং মূল্য সম্পর্কিত সম্পর্ক সনাক্ত করতে কোন বিশ্লেষণ ব্যবহার করা উচিত?

আমি এয়ারলাইন্সের দাম নির্ধারণের আচরণটি তদন্ত করতে চাই - বিশেষত বিমান সংস্থা প্রতিযোগীদের মূল্য নির্ধারণে কীভাবে প্রতিক্রিয়া দেখায়। যেহেতু আমি বলতে চাই আরও জটিল বিশ্লেষণ সম্পর্কে আমার জ্ঞানটি যথেষ্ট সীমাবদ্ধ আমি তথ্যের সামগ্রিক দৃষ্টিভঙ্গি সংগ্রহ করার জন্য বেশিরভাগ মৌলিক পদ্ধতিই করেছি। এর মধ্যে সাধারণ গ্রাফ রয়েছে যা ইতিমধ্যে অনুরূপ নিদর্শনগুলি …

12 data-mining dataset regression correlation visualization

2

ঘন ঘন নিদর্শন খননে এখনও এফপিগ্রোথকে "শিল্পের রাজ্য" হিসাবে বিবেচনা করা হয়?

যতদূর আমি ঘন ঘন প্যাটার্ন মাইনিং (এফপিএম) সমস্যা সমাধানের জন্য অ্যালগরিদমগুলির বিকাশ জানি, উন্নতির রাস্তায় কয়েকটি প্রধান চেকপয়েন্ট রয়েছে। প্রথমত, এগ্রিওরি অ্যালগরিদম 1993 সালে অগ্রওয়াল এট আল দ্বারা প্রস্তাবিত হয়েছিল । সমস্যাটির আনুষ্ঠানিককরণের পাশাপাশি। অ্যালগরিদম ডেটা বজায় রাখার জন্য একটি ল্যাটিস ব্যবহার করে সেটগুলি (পাওয়ারসেট) থেকে কিছু সেট স্ট্রিপ-অফ করতে …

12 bigdata data-mining efficiency state-of-the-art

2

এলোমেলো বন শ্রেণিবদ্ধকরণের জন্য আমি কীভাবে শ্রেণিবদ্ধ ডেটা ফিট করতে পারি?

র‌্যান্ডম ফরেস্ট অ্যালগরিদম প্রয়োগ করে আমার প্রশিক্ষণের ডেটাসেটের যথার্থতা খুঁজে পাওয়া দরকার। তবে আমার ডেটা সেটের ধরণটি উভয় শ্রেণিবদ্ধ এবং সংখ্যাসূচক। আমি যখন এই ডেটা ফিট করার চেষ্টা করেছি, তখন আমি একটি ত্রুটি পেয়েছি। 'ইনপুটটিতে NaN, অনন্ত বা dtype (' float32 ')' এর চেয়ে খুব বড় একটি মান রয়েছে। সমস্যা …

12 python data-mining random-forest

প্রশ্ন ট্যাগ «data-mining»