প্রশ্ন ট্যাগ «data-mining»

একটি ক্রিয়াকলাপ যা বৃহত, জটিল ডেটা সেটগুলিতে নিদর্শন চায়। এটি সাধারণত অ্যালগরিদমিক কৌশলগুলিকে জোর দেয় তবে সেই লক্ষের সাথে সম্পর্কিত কোনও দক্ষতা, অ্যাপ্লিকেশনগুলি বা পদ্ধতিগুলিও জড়িত থাকতে পারে।

13
কে-মিনস মিশ্রিত সংখ্যা এবং শ্রেণিবদ্ধ ডেটার জন্য ক্লাস্টারিং
আমার ডেটা সেটে বেশ কয়েকটি সংখ্যক অ্যাট্রিবিউট এবং একটি শ্রেণিবদ্ধ রয়েছে। বলুন NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, যেখানে CategoricalAttrতিনটি সম্ভাব্য মান এক লাগে: CategoricalAttrValue1, CategoricalAttrValue2বা CategoricalAttrValue3। আমি অক্টাভে https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ এর জন্য ডিফল্ট কে-ই মানে ক্লাস্টারিং অ্যালগরিদম বাস্তবায়ন ব্যবহার করছি । এটি শুধুমাত্র সংখ্যার ডেটা নিয়ে কাজ করে। সুতরাং আমার প্রশ্ন: …

8
পাইথনে ওপেন সোর্স অ্যানোমালি ডিটেকশন
সমস্যার পটভূমি: আমি এমন একটি প্রকল্পে কাজ করছি যা আইটি মনিটরিং স্পেসে (আইটি স্পেস সম্পর্কে আমার সর্বোত্তম বোঝার জন্য) খুঁজে পাওয়া অনুরূপ লগ ফাইলগুলিতে জড়িত। এই লগ ফাইলগুলি টাইম-সিরিজ ডেটা, বিভিন্ন পরামিতিগুলির কয়েকশ / হাজারে সারিতে সংগঠিত। প্রতিটি প্যারামিটার সংখ্যাসূচক (ভাসা) এবং প্রতিটি সময় পয়েন্টের জন্য একটি তুচ্ছ / নন-ত্রুটিযুক্ত …

2
সমর্থন ভেক্টর মেশিনগুলি এখনও তাদের কুলুঙ্গিতে "শিল্পের রাজ্য" হিসাবে বিবেচিত হয়?
এই প্রশ্নটি আমি একটি অন্য মন্তব্যে দেখেছি এমন মন্তব্যের জবাবে। মন্তব্যটি ছিল কোর্সেরায় মেশিন লার্নিং কোর্স সিলেবাস সম্পর্কে, এবং "এসভিএমগুলি আজকাল এত বেশি ব্যবহার করা হয় না" এর ধারায়। আমি কেবলমাত্র প্রাসঙ্গিক বক্তৃতাগুলি নিজেই শেষ করেছি, এবং এসভিএমগুলি সম্পর্কে আমার বোঝা হ'ল তারা শ্রেণিবদ্ধকরণের জন্য একটি শক্তিশালী এবং দক্ষ লার্নিং …

5
নথির মধ্যে দূরত্ব গণনার কয়েকটি মানক উপায় কী?
আমি যখন "ডকুমেন্ট" বলি তখন আমার উইকিপিডিয়া নিবন্ধ এবং নিউজ স্টোরিগুলির মতো ওয়েব পৃষ্ঠাগুলি মনে থাকে। আমি উত্তরগুলি পছন্দ করি ভ্যানিলা লেজিকাল দূরত্বের মেট্রিকগুলি বা অত্যাধুনিক সিমেটিক দূরত্বের মেট্রিকগুলি উত্তরগুলির জন্য আরও দৃference় পছন্দ সহ giving

1
এক্সজিবিস্ট স্কলারন গ্রেডিয়েন্টবুস্টিং ক্লাসিফায়ারের চেয়ে এত দ্রুত কেন?
আমি 100 সংখ্যার বৈশিষ্ট্য সহ 50 কে উদাহরণের মাধ্যমে গ্রেডিয়েন্ট বুস্টিং মডেলটি প্রশিক্ষণের চেষ্টা করছি। XGBClassifierআমার মেশিনে 43 সেকেন্ডের মধ্যে 500 গাছ হ্যান্ডল করে, যখন GradientBoostingClassifier1 মিনিট 2 সেকেন্ডের মধ্যে কেবল 10 টি গাছ (!) পরিচালনা করে :( আমি কয়েক ঘন্টা লাগবে বলে 500 গাছ বাড়ানোর চেষ্টা করতে বিরক্ত করিনি। …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

6
কীভাবে বড় ডেটা সহ এসভিডি এবং পিসিএ করবেন?
আমার কাছে প্রচুর ডেটা রয়েছে (প্রায় 8 জিবি)। আমি এটি বিশ্লেষণ করতে মেশিন লার্নিং ব্যবহার করতে চাই। সুতরাং, আমি মনে করি দক্ষতার জন্য ডেটা মাত্রিকতা হ্রাস করার জন্য আমার এসভিডি তখন পিসিএ ব্যবহার করা উচিত। তবে ম্যাটল্যাব এবং অকটাভ এত বড় ডেটাসেট লোড করতে পারে না। এত বড় ডেটা দিয়ে …

3
গিনি সহগ বনাম গিনি অপরিষ্কার - সিদ্ধান্ত গাছ
সমস্যা সিদ্ধান্ত গাছের বিল্ডিং বোঝায়। উইকিপিডিয়া অনুসারে ' গিনি সহগ ' কে ' গিনি অপূর্ণতা ' দিয়ে বিভ্রান্ত করা উচিত নয় । তবে সিদ্ধান্ত গাছ তৈরি করার সময় উভয় ব্যবস্থা ব্যবহার করা যেতে পারে - আইটেমগুলির সেট বিভক্ত করার সময় এগুলি আমাদের পছন্দগুলিকে সমর্থন করতে পারে। 1) 'গিনি অপরিষ্কার' - …

3
কেন আমাদের এক্সজিবিস্ট এবং র্যান্ডম ফরেস্টের প্রয়োজন?
আমি কয়েকটি ধারণা সম্পর্কে পরিষ্কার ছিল না: এক্সজিবিস্ট দুর্বল শিক্ষার্থীদের শক্তিশালী শিক্ষায় রূপান্তর করে। এটি করার সুবিধা কী? কেবল একটি গাছ ব্যবহারের পরিবর্তে অনেক দুর্বল শিক্ষার্থীদের সংমিশ্রণ? র্যান্ডম ফরেস্ট গাছ তৈরির জন্য গাছ থেকে বিভিন্ন নমুনা ব্যবহার করে। কেবলমাত্র একক গাছ ব্যবহারের পরিবর্তে এই পদ্ধতির সুবিধা কী?

3
এনএলপি এবং মেশিন লার্নিং সম্প্রদায়গুলি গভীর শিক্ষায় আগ্রহী কেন?
আমি আশা করি আপনি আমাকে সহায়তা করতে পারবেন, কারণ এই বিষয়ে আমার কিছু প্রশ্ন রয়েছে। আমি গভীর শিক্ষার ক্ষেত্রে নতুন এবং কিছু টিউটোরিয়াল করার সময় আমি ধারণাগুলি একে অপরের থেকে সম্পর্কিত বা আলাদা করতে পারি না।

4
সুপ্ত বৈশিষ্ট্যগুলির অর্থ?
আমি সুপারিশকারী সিস্টেমগুলির জন্য ম্যাট্রিক্স ফ্যাক্টেরাইজেশন সম্পর্কে শিখছি এবং আমি শব্দটি latent featuresখুব ঘন ঘন ঘটতে দেখছি তবে আমি এর অর্থ কী তা বুঝতে অক্ষম। বৈশিষ্ট্যটি কী তা আমি জানি তবে সুপ্ত বৈশিষ্ট্যগুলির ধারণাটি আমি বুঝতে পারি না। দয়া করে এটি ব্যাখ্যা করতে পারেন? বা কমপক্ষে আমাকে কোনও কাগজ / …

4
ডেটা সায়েন্স কি ডেটা মাইনিংয়ের মতো?
আমি নিশ্চিত যে এই ফোরামে আলোচিত হবে ডেটা বিজ্ঞানের বেশ কয়েকটি প্রতিশব্দ বা কমপক্ষে সম্পর্কিত ক্ষেত্র রয়েছে যেখানে বড় ডেটা বিশ্লেষণ করা হয়। আমার বিশেষ প্রশ্নটি ডেটা মাইনিংয়ের ক্ষেত্রে। আমি কয়েক বছর আগে ডেটা মাইনিংয়ে স্নাতক শ্রেণি নিয়েছি। ডেটা সায়েন্স এবং ডেটা মাইনিংয়ের মধ্যে পার্থক্যগুলি কী কী এবং বিশেষত ডেটা …

2
Seriesতু বা অন্যান্য নিদর্শনগুলিতে পরিবর্তিত সময় সিরিজের সাথে কীভাবে ডিল করবেন?
পটভূমি আমি শক্তি মিটার রিডিংয়ের একটি টাইম সিরিজের ডেটা সেট নিয়ে কাজ করছি। সিরিজের দৈর্ঘ্য মিটার অনুসারে পরিবর্তিত হয় - কারও কারও কাছে আমার বেশ কয়েক বছর থাকে, অন্যরা কেবল কয়েক মাস থাকে Many অনেকগুলি উল্লেখযোগ্য seasonতু প্রদর্শন করে এবং প্রায়শই একাধিক স্তর - দিন, সপ্তাহ বা বছরের মধ্যে। আমি …

1
হেল্পিংজার দূরত্ব কী এবং কখন এটি ব্যবহার করবেন?
হেল্পিংজার দূরত্বে (সরল ভাষায়) আসলে কী ঘটে তা জানতে আগ্রহী। তদুপরি, আমি হেল্পিংজার দূরত্ব ব্যবহার করতে পারি এমন কী ধরণের সমস্যাগুলি তা জানতে আগ্রহী? হেল্পিংজার দূরত্ব ব্যবহারের সুবিধা কী কী?

4
কোন একক ঘটনা অনুদায়ী ডেটা প্রভাবিত করে এমন সম্ভাবনা বিশ্লেষণ করতে আমার কোন পরিসংখ্যানের মডেল ব্যবহার করা উচিত
একটি নির্দিষ্ট ঘটনাটি কিছু দ্রাঘিমাংশের ডেটা প্রভাবিত করে এমন সম্ভাবনা বিশ্লেষণ করার জন্য আমি একটি সূত্র, পদ্ধতি বা মডেল ব্যবহার করার চেষ্টা করছি। গুগলে কী সন্ধান করতে হবে তা আমি খুব কষ্ট করে আবিষ্কার করছি। এখানে একটি উদাহরণের চিত্র: চিত্র যে আপনি এমন একটি ব্যবসায়ের মালিক যার প্রতি দিন গড়ে …

1
ওয়ার্ড 2ভেক বনাম সেনটেন্স 2 ভেক বনাম ডক 2ভেক
আমি সম্প্রতি পদ জুড়ে এসেছিল Word2Vec , Sentence2Vec এবং Doc2Vec এবং বিভ্রান্ত হিসাবে আমি ভেক্টর শব্দার্থবিদ্যা নতুন am ধরনের। কেউ কি এই পদ্ধতির পার্থক্যগুলি সহজ কথায় ব্যাখ্যা করতে পারেন? প্রতিটি পদ্ধতির জন্য সবচেয়ে উপযুক্ত কাজগুলি কি কি?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.