তথ্য বিজ্ঞান clustering

2

ইউজারজেন্ট, আইপি, সেশন_আইডি দ্বারা অনন্য দর্শকদের ক্লাস্টারিং

ফর্মটিতে ওয়েবসাইট অ্যাক্সেসের ডেটা দেওয়া হয়েছে session_id, ip, user_agentএবং নীচের শর্তাবলী অনুসরণ করে optionচ্ছিকভাবে টাইমস্ট্যাম্প দিয়ে কীভাবে আপনি অনন্য দর্শনার্থীদের মধ্যে সেশন সেরাভাবে ক্লাস্টার করবেন? session_id: প্রতিটি নতুন দর্শনার্থীর দেওয়া আইডি। এটির মেয়াদ শেষ হয় না, তবে ব্যবহারকারী যদি কুকিজ গ্রহণ না করে / কুকিজ সাফ করে / ব্রাউজার পরিবর্তন …

15 clustering

2

শ্রেণিবদ্ধ / ক্লাস্টার ব্যবহারকারীর প্রোফাইলগুলিতে বৈশিষ্ট্য ব্যবহার করে

আমার কাছে একটি ওয়েবসাইট থেকে পণ্য ক্রয়ের ব্যবহারকারীদের একটি ডেটাসেট রয়েছে। আমার বৈশিষ্ট্যগুলি হ'ল ব্যবহারকারীর আইডি, ব্যবহারকারীর অঞ্চল (রাষ্ট্র), পণ্যের আইডি, পণ্যের আইওয়ার্ড আইডি, ওয়েবসাইটের কীওয়ার্ড আইডি এবং পণ্যের ব্যয় বিক্রয় পরিমাণ। লক্ষ্যটি হ'ল "পুরুষ যুবক গেমার" বা "বাড়ির মা থাকুন" এর মতো ব্যবহারকারীরা কারা পরিচয় হিসাবে কোনও পণ্য এবং …

14 machine-learning data-mining classification clustering

2

10 ^ 10 পয়েন্টের জন্য অ্যালগরিদমের মতো দ্রুত কে-মানে?

আমি 10-মাত্রিক পয়েন্টের সেটটিতে কে-মানে ক্লাস্টারিং করতে চাইছি। ধরা: 10 ^ 10 পয়েন্ট আছে । আমি বৃহত্তম ক্লাস্টারগুলির কেন্দ্র এবং আকারের সন্ধান করছি (আসুন 10 থেকে 100 টি ক্লাস্টার বলি); প্রতিটি পয়েন্টটি কী ক্লাস্টারে শেষ হবে তা নিয়ে আমি মাথা ঘামাই না k আমি কেবল একটি অনুরূপ প্রভাব অনুসন্ধান করছি, …

14 clustering k-means

1

অস্পষ্ট টোকেনগুলির ক্রমিকায় একটি ব্যাকরণ সনাক্ত করুন

আমার কাছে পাঠ্য দলিল রয়েছে যা মূলত আইটেমের তালিকা থাকে। প্রতিটি আইটেম বিভিন্ন ধরণের বিভিন্ন টোকেনের একটি গ্রুপ: ফার্স্টনাম, লাস্টনেম, জন্ম তারিখ, ফোন নম্বর, শহর, পেশা, ইত্যাদি etc. একটি টোকেন শব্দের একটি গ্রুপ group আইটেম বিভিন্ন লাইনে থাকা থাকতে পারে। কোনও দস্তাবেজের আইটেমগুলির প্রায় একই টোকেন সিনট্যাক্স রয়েছে তবে অগত্যা …

13 data-mining clustering text-mining time-series correlation

1

গ্রাহকদের 2 টি বৈশিষ্ট্য এবং ইভেন্টের একটি সিরিজ ভিত্তিতে শ্রেণীবদ্ধ করুন

আমি যে অ্যালগরিদমটি ডিজাইন করছি তাতে আমার পরবর্তী পদক্ষেপটি কী হতে হবে সে সম্পর্কে আমার সহায়তা দরকার। এনডিএগুলির কারণে, আমি অনেক কিছুই প্রকাশ করতে পারি না, তবে আমি জেনেরিক এবং বোধগম্য হওয়ার চেষ্টা করব। মূলত, অ্যালগরিদমে বেশ কয়েকটি পদক্ষেপের পরে আমার কাছে এটি রয়েছে: আমার কাছে থাকা প্রতিটি গ্রাহকের জন্য …

12 classification clustering time-series

1

মিমহ্যাশিং বনাম সিমহ্যাশিং

ধরুন আমার কাছে পাঁচটি সেট রয়েছে আমি ক্লাস্টার করতে চাই। আমি বুঝতে পারি যে এখানে বর্ণিত সিমহ্যাশিং কৌশল: https://moultano.wordpress.com/2010/01/21/simple-simhashing-3kbzhsxyg4467-6/ তিন ক্লাস্টার উত্পাদ পারেনি ( {A}, {B,C,D}এবং {E}), উদাহরণস্বরূপ, যদি তার ফলাফল ছিল: A -> h01 B -> h02 C -> h02 D -> h02 E -> h03 একইভাবে, এমএমডিএস বইয়ের …

12 clustering similarity

1

আমার কয়টি এলএসটিএম সেল ব্যবহার করা উচিত?

আমার ব্যবহার করা উচিত ন্যূনতম, সর্বাধিক এবং "যুক্তিসঙ্গত" পরিমাণগুলির সাথে সম্পর্কিত কোনও নিয়ামক (বা প্রকৃত নিয়ম) কি আছে? বিশেষত আমি টেনসরফ্লো এবং num_unitsসম্পত্তি থেকে বেসিকএলএসটিএমসেল সম্পর্কিত করছি । অনুগ্রহ করে ধরে নিই যে আমার দ্বারা শ্রেণিবদ্ধকরণের সমস্যা রয়েছে: t - number of time steps n - length of input vector …

12 rnn machine-learning r predictive-modeling random-forest python language-model sentiment-analysis encoding machine-learning deep-learning neural-network dataset caffe classification xgboost multiclass-classification unbalanced-classes time-series descriptive-statistics python r clustering machine-learning python deep-learning tensorflow machine-learning python predictive-modeling probability scikit-learn svm machine-learning python classification gradient-descent regression research python neural-network deep-learning convnet keras python tensorflow machine-learning deep-learning tensorflow python r bigdata visualization rstudio pandas pyspark dataset time-series multilabel-classification machine-learning neural-network ensemble-modeling kaggle machine-learning linear-regression cnn convnet machine-learning tensorflow association-rules machine-learning predictive-modeling training model-selection neural-network keras deep-learning deep-learning convnet image-classification predictive-modeling prediction machine-learning python classification predictive-modeling scikit-learn machine-learning python random-forest sampling training recommender-system books python neural-network nlp deep-learning tensorflow python matlab information-retrieval search search-engine deep-learning convnet keras machine-learning python cross-validation sampling machine-learning

1

অবিচ্ছিন্ন অনলাইন ক্লাস্টার সনাক্তকরণের সমাধান?

আমি আপনাকে একটি অনুমান অনলাইন ক্লাস্টারিং অ্যাপ্লিকেশনটির একটি উদাহরণ দেখাব: সময় n পয়েন্ট 1,2,3,4 নীল ক্লাস্টার এ বরাদ্দ করা হয় এবং পয়েন্ট খ, 5,6,7 রেড ক্লাস্টার বি বরাদ্দ করা হয়। সময় n + 1 এ একটি নতুন পয়েন্ট a প্রবর্তিত হয় যা নীল ক্লাস্টার A এর জন্য নির্ধারিত হয় তবে …

11 machine-learning clustering

4

পাঠ্য প্রক্রিয়াকরণে ক্লাস্টারিং ব্যবহার করা

হাই, ডেটা সায়েন্স স্ট্যাকের মধ্যে এটি আমার প্রথম প্রশ্ন। আমি পাঠ্য শ্রেণিবিন্যাসের জন্য একটি অ্যালগরিদম তৈরি করতে চাই। ধরুন আমার কাছে টেক্সট এবং নিবন্ধগুলির একটি বিশাল সেট রয়েছে। প্রায় 5000 টি সরল পাঠ্য বলি। চারটি এবং উপরের অক্ষরের শব্দের ফ্রিকোয়েন্সি নির্ধারণ করতে আমি প্রথমে একটি সাধারণ ফাংশন ব্যবহার করি। আমি …

11 text-mining clustering

3

বৈজ্ঞানিক গণনার জন্য সেরা ভাষা [বন্ধ]

বন্ধ । এই প্রশ্নটি আরও ফোকাস করা প্রয়োজন । এটি বর্তমানে উত্তর গ্রহণ করছে না। এই প্রশ্নটি উন্নত করতে চান? প্রশ্নটি আপডেট করুন যাতে এটি কেবলমাত্র এই পোস্টটি সম্পাদনা করে একটি সমস্যার উপর দৃষ্টি নিবদ্ধ করে । 5 বছর আগে বন্ধ । দেখে মনে হয় বেশিরভাগ ভাষায় বেশ কয়েকটি বৈজ্ঞানিক …

10 efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system

1

হারটিগান-ওয়াং কে-মানে পদ্ধতি এবং অন্যান্য অ্যালগরিদমে রূপান্তর

আমি মূলত ভাষার statsপ্যাকেজে কার্যকর হওয়া বিভিন্ন কে-মানে ক্লাস্টারিং অ্যালগরিদমগুলি বোঝার চেষ্টা করছি R। আমি লয়েডের অ্যালগরিদম এবং ম্যাককুইনের অনলাইন অ্যালগরিদম বুঝতে পারি। আমি তাদের বোঝার উপায়টি নিম্নরূপ: লয়েডের অ্যালগরিদম: প্রাথমিকভাবে 'কে' র্যান্ডম পর্যবেক্ষণগুলি বেছে নেওয়া হয় যা 'কে' ক্লাস্টারের সেন্ট্রয়েড হিসাবে কাজ করবে। তারপরে সেন্ট্রয়েডগুলি একত্রিত হওয়া পর্যন্ত নিম্নলিখিত …

10 r clustering k-means

3

লগ ফাইল বিশ্লেষণ: মান অংশ থেকে তথ্য অংশ বের করা

আমি আমাদের পণ্যগুলির একটিতে বেশ কয়েকটি লগ ফাইলে একটি ডেটা সেট তৈরি করার চেষ্টা করছি। বিভিন্ন লগ ফাইলগুলির নিজস্ব বিন্যাস এবং নিজস্ব সামগ্রী রয়েছে; আমি তাদের সফলভাবে একসাথে গ্রুপ করেছি, কেবলমাত্র এক ধাপ বাকি ... আসলে, লগ "বার্তা" সেরা তথ্য। আমার কাছে এই সমস্ত বার্তাগুলির বিস্তৃত তালিকা নেই এবং সেগুলির …

10 text-mining clustering

1

ক্লাস্টারিং গ্রাহকের ডেটা ইলাস্টিক অনুসন্ধানে সঞ্চিত

আমার কাছে একগুচ্ছ গ্রাহক প্রোফাইল রয়েছে elasticsearchক্লাস্টারের। এই প্রোফাইলগুলি এখন আমাদের ইমেল সাবস্ক্রিপশনের জন্য লক্ষ্য গোষ্ঠী তৈরির জন্য ব্যবহৃত হয়। স্থিতিস্থাপক দিকযুক্ত অনুসন্ধানের ক্ষমতাগুলি ব্যবহার করে লক্ষ্য গোষ্ঠীগুলি এখন ম্যানুয়ালি গঠিত হয় (যেমন 23 বছরের সকল পুরুষ গ্রাহককে একটি গাড়ি এবং 3 বাচ্চা সহ পান) get আমি কীভাবে আকর্ষণীয় গোষ্ঠীগুলির …

10 data-mining clustering

2

লেটেন্ট ডিরিচলেট বরাদ্দ থেকে প্রাপ্ত বিষয়গুলি ব্যবহার করে দস্তাবেজগুলির ক্লাস্টারিং

আমি একটি প্রকল্পের জন্য লেটেন্ট ডিরিচলেট বরাদ্দ ব্যবহার করতে চাই এবং আমি জিনসিম লাইব্রেরি সহ পাইথন ব্যবহার করছি। বিষয়গুলি সন্ধান করার পরে আমি কে-মানেগুলির মতো অ্যালগরিদম ব্যবহার করে দস্তাবেজগুলি ক্লাস্টার করতে চাই (আদর্শভাবে আমি ওভারল্যাপিং ক্লাস্টারগুলির জন্য একটি ভাল ব্যবহার করতে চাই যাতে কোনও প্রস্তাবনা স্বাগত হয়)। আমি বিষয়গুলি পরিচালনা …

9 python clustering lda

4

পাঠ্য শ্রেণিবদ্ধ প্রশিক্ষণ ডেটাসেটের পরামর্শ দিন

কোনও পাঠ্য শ্রেণিবদ্ধ প্রশিক্ষণ দেওয়ার জন্য কোন অবাধে উপলভ্য ডেটাসেটগুলি ব্যবহার করতে পারি? আমরা তার জন্য সর্বাধিক সম্পর্কিত বিষয়বস্তুর সুপারিশ করে আমাদের ব্যবহারকারীদের ব্যস্ততা বাড়ানোর চেষ্টা করছি, তাই আমরা ভেবেছিলাম আমরা যদি ইতিমধ্যে শ্রেণিবদ্ধ পোস্টের এলোমেলো সংখ্যার পোস্টে তার প্রতিক্রিয়া পেয়ে আমরা তার বিষয়বস্তুকে প্রবৃত্ত করার দ্বারা প্রস্তাবিত শব্দের একটি …

9 machine-learning classification dataset clustering text-mining

প্রশ্ন ট্যাগ «clustering»