তথ্য বিজ্ঞান categorical-data

13

কে-মিনস মিশ্রিত সংখ্যা এবং শ্রেণিবদ্ধ ডেটার জন্য ক্লাস্টারিং

আমার ডেটা সেটে বেশ কয়েকটি সংখ্যক অ্যাট্রিবিউট এবং একটি শ্রেণিবদ্ধ রয়েছে। বলুন NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, যেখানে CategoricalAttrতিনটি সম্ভাব্য মান এক লাগে: CategoricalAttrValue1, CategoricalAttrValue2বা CategoricalAttrValue3। আমি অক্টাভে https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ এর জন্য ডিফল্ট কে-ই মানে ক্লাস্টারিং অ্যালগরিদম বাস্তবায়ন ব্যবহার করছি । এটি শুধুমাত্র সংখ্যার ডেটা নিয়ে কাজ করে। সুতরাং আমার প্রশ্ন: …

133 data-mining clustering octave k-means categorical-data

3

ওয়ান হট এনকোডিং বনাম লেবেলএনকোডার বনাম ডিকটেক্টরিজর কখন ব্যবহার করবেন?

আমি কিছুক্ষণের জন্য বিভাগীয় ডেটা সহ মডেলগুলি তৈরি করে চলেছি এবং যখন এই পরিস্থিতিতে আমি মডেল তৈরির আগে এই ডেটাটি রূপান্তর করতে বিজ্ঞান-শিখার লেবেল এনকোডার ফাংশনটি ব্যবহার করে মূলত ডিফল্ট হয়েছি। আমি মধ্যে পার্থক্য বুঝতে OHE, LabelEncoderএবং DictVectorizorযা তারা ডেটাতে করছেন পরিপ্রেক্ষিতে, কিন্তু কি আমার কাছে পরিষ্কার নয় যখন অন্য …

95 scikit-learn categorical-data feature-engineering

3

নিউরাল নেটওয়ার্ক প্রশিক্ষণের জন্য শ্রেণিবদ্ধ এবং অবিচ্ছিন্ন ইনপুট বৈশিষ্ট্যগুলিকে কীভাবে একত্রিত করবেন

ধরুন আমাদের কাছে দুটি ধরণের ইনপুট বৈশিষ্ট্য রয়েছে, শ্রেণিবদ্ধ এবং অবিচ্ছিন্ন। শ্রেণিবদ্ধ ডেটাগুলিকে ওয়ান-হট কোড এ হিসাবে উপস্থাপন করা যেতে পারে, যখন অবিচ্ছিন্ন ডেটা এন-ডাইমেনশন স্পেসে কেবল একটি ভেক্টর বি হয়। দেখে মনে হয় যে কেবল কনট্যাট (এ, বি) ব্যবহার করা ভাল পছন্দ নয় কারণ এ, বি সম্পূর্ণ ভিন্ন ধরণের …

16 neural-network feature-selection categorical-data feature-construction

2

আমাদের কেন একটি ডামি ভেরিয়েবল বাতিল করা দরকার?

আমি শিখেছি যে, একটি রিগ্রেশন মডেল তৈরি করার জন্য, আমাদের বিভাগীয় ভেরিয়েবলগুলি ডামি ভেরিয়েবলগুলিতে রূপান্তরিত করে তাদের যত্ন নিতে হবে। উদাহরণস্বরূপ, যদি আমাদের ডেটা সেটে, অবস্থানের মতো ভেরিয়েবল থাকে: Location ---------- Californian NY Florida আমাদের এগুলিকে রূপান্তর করতে হবে: 1 0 0 0 1 0 0 0 1 যাইহোক, এটি …

16 machine-learning regression categorical-data

1

রিগ্রেশনের জন্য উচ্চ কার্ডিনালিটি শ্রেণিবদ্ধ বৈশিষ্ট্যগুলির সাথে বৈশিষ্ট্যটির গুরুত্ব (সংখ্যাসূচক নিম্নোক্ত পরিবর্তনশীল)

রিগ্রেশন সমস্যার জন্য কিছু অভিজ্ঞতাবাদী বৈশিষ্ট্য নির্বাচন করার জন্য আমি র্যান্ডম অরণ্য থেকে বৈশিষ্ট্য আমদানি ব্যবহার করার চেষ্টা করছিলাম যেখানে সমস্ত বৈশিষ্ট্যগুলি শ্রেণিবদ্ধ এবং তাদের অনেকের অনেকগুলি স্তর রয়েছে (100-1000 এর ক্রম অনুসারে)। এক-হট এনকোডিং প্রতিটি স্তরের জন্য একটি ডামি ভেরিয়েবল তৈরি করে এই বৈশিষ্ট্যটি আমদানি প্রতিটি স্তরের জন্য এবং …

12 scikit-learn feature-selection random-forest xgboost categorical-data

3

পান্ডাসে শ্রেণিবদ্ধ কলামগুলি গণ রূপান্তর করুন (এক-গরম এনকোডিং নয়)

আমার কাছে টন শ্রেণিবদ্ধ কলামগুলির সাথে পান্ডাস ডেটাফ্রেম রয়েছে, যা আমি বিজ্ঞান-শিখার সাথে সিদ্ধান্ত গাছে ব্যবহার করার পরিকল্পনা করছি। আমি তাদেরকে সংখ্যাসূচক মানগুলিতে রূপান্তর করতে হবে (একটি উষ্ণ ভেক্টর নয়)। আমি এটি সাইকিট-লার্ন থেকে LabelEncoder দিয়ে করতে পারি। সমস্যাটি হচ্ছে তাদের মধ্যে অনেকগুলি রয়েছে এবং আমি সেগুলি ম্যানুয়ালি রূপান্তর করতে …

12 scikit-learn pandas categorical-data labels

3

আমি কীভাবে শ্রেণিবদ্ধভাবে ডেটা এবং সংখ্যাসূচক তথ্যগুলির মধ্যে পার্থক্য করতে পারি?

আমি এমন কাউকে জানি যে এমন একটি প্রকল্পে কাজ করছেন যা কলাম বা ডেটা ধরণের বিবেচনা না করে ডেটা ফাইল অন্তর্ভুক্ত করার সাথে জড়িত। কাজটি হ'ল সংখ্যার ডেটাতে যে কোনও সংখ্যক কলাম এবং বিভিন্ন ডেটা ধরণের এবং আউটপুট সংক্ষিপ্ত পরিসংখ্যান সহ একটি ফাইল নেওয়া। তবে নির্দিষ্ট নম্বর-ভিত্তিক ডেটার জন্য কীভাবে …

12 categorical-data numerical

3

অজগরটির জন্য কি বাক্সের বাইরে খুব ভাল ভাষার মডেল রয়েছে?

আমি একটি অ্যাপ্লিকেশন প্রোটোটাইপ করছি এবং কিছু উত্পন্ন বাক্যগুলিতে বিভ্রান্তি গণনা করতে আমার একটি ভাষা মডেল প্রয়োজন। অজগরটিতে কি আমি সহজেই ব্যবহার করতে পারি এমন কোনও প্রশিক্ষিত ভাষার মডেল রয়েছে? কিছু সাধারণ মত model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior …

11 python nlp language-model r statistics linear-regression machine-learning classification random-forest xgboost python sampling data-mining orange predictive-modeling recommender-system statistics dimensionality-reduction pca machine-learning python deep-learning keras reinforcement-learning neural-network image-classification r dplyr deep-learning keras tensorflow lstm dropout machine-learning sampling categorical-data data-imputation machine-learning deep-learning machine-learning-model dropout deep-network pandas data-cleaning data-science-model aggregation python neural-network reinforcement-learning policy-gradients r dataframe dataset statistics prediction forecasting r k-means python scikit-learn labels python orange cloud-computing machine-learning neural-network deep-learning rnn recurrent-neural-net logistic-regression missing-data deep-learning autoencoder apache-hadoop time-series data preprocessing classification predictive-modeling time-series machine-learning python feature-selection autoencoder deep-learning keras tensorflow lstm word-embeddings predictive-modeling prediction machine-learning-model machine-learning classification binary theory machine-learning neural-network time-series lstm rnn neural-network deep-learning keras tensorflow convnet computer-vision

2

কীভাবে শ্রেণিবিন্যস্ত তথ্যকে পিএসপার্কে সংখ্যাসূচক তথ্যতে রূপান্তর করতে হয়

আমি পাইপার্ক অ্যাপ্লিকেশনগুলির সাথে কাজ করার জন্য আইপিথন নোটবুকটি ব্যবহার করছি। 50k রেঞ্জের আয়ের আওতাধীন কিনা তা নির্ধারণ করতে আমার কাছে প্রচুর শ্রেণীবদ্ধ কলাম সহ একটি সিএসভি ফাইল রয়েছে। আমি আয়ের সীমা নির্ধারণ করতে সমস্ত ইনপুট গ্রহণ করে একটি শ্রেণিবদ্ধকরণ অ্যালগরিদম সম্পাদন করতে চাই। আমাকে ম্যাপযুক্ত ভেরিয়েবলগুলিতে ভেরিয়েবলের একটি অভিধান …

11 python apache-spark categorical-data pyspark

3

বৈজ্ঞানিক গণনার জন্য সেরা ভাষা [বন্ধ]

বন্ধ । এই প্রশ্নটি আরও ফোকাস করা প্রয়োজন । এটি বর্তমানে উত্তর গ্রহণ করছে না। এই প্রশ্নটি উন্নত করতে চান? প্রশ্নটি আপডেট করুন যাতে এটি কেবলমাত্র এই পোস্টটি সম্পাদনা করে একটি সমস্যার উপর দৃষ্টি নিবদ্ধ করে । 5 বছর আগে বন্ধ । দেখে মনে হয় বেশিরভাগ ভাষায় বেশ কয়েকটি বৈজ্ঞানিক …

10 efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system

3

স্থির নয় এমন শ্রেণিবদ্ধ তথ্য দিয়ে আমি কীভাবে শ্রেণিবদ্ধকরণ করব?

শ্রেণিবদ্ধ এবং সংখ্যাসূচক উভয় ডেটা নিয়েই আমার একটি শ্রেণিবদ্ধকরণ সমস্যা আছে। আমি যে সমস্যার মুখোমুখি হচ্ছি তা হ'ল আমার শ্রেণিবদ্ধ ডেটা স্থির নয়, এর অর্থ হ'ল নতুন প্রার্থী যার লেবেলটি আমি ভবিষ্যদ্বাণী করতে চাই তার একটি নতুন বিভাগ থাকতে পারে যা আগে দেখা যায়নি। উদাহরণ হিসেবে বলা যায়, আমার শ্রেণীগত …

10 machine-learning classification categorical-data

প্রশ্ন ট্যাগ «categorical-data»