তথ্য বিজ্ঞান

2

কেন আমাদের ডাটা ভারসাম্যহাল পরিচালনা করতে হবে?

আমাদের কেন ভারসাম্যহীনতার ভারসাম্য মোকাবেলা করতে হবে তা জানতে হবে। আমি কীভাবে এটির মোকাবিলা করতে এবং সমস্যা সমাধানের বিভিন্ন পদ্ধতি যা স্যাম্পলিং বা ডাউন স্যাম্পলিংয়ের মাধ্যমে বা স্মোট ব্যবহার করে সমাধান করা যায় তা আমি জানি। উদাহরণস্বরূপ, যদি আমার মধ্যে বিরল রোগ হয় 100 এর মধ্যে 1 শতাংশ, এবং বলি …

12 classification dataset sampling class-imbalance

4

নিউরাল নেটওয়ার্কের সাথে ব্যতিক্রমগুলি সনাক্ত করা

আমার কাছে একটি বৃহত বহুমাত্রিক ডেটাসেট রয়েছে যা প্রতিদিন উত্পন্ন হয়। আগের দিনের তুলনায় কোনও ধরণের 'বিড়ম্বনা' সনাক্ত করার জন্য কী ভাল পন্থা হতে পারে? এটি কি একটি উপযুক্ত সমস্যা যা নিউরাল নেটওয়ার্কগুলির সাথে সমাধান করা যেতে পারে? কোন পরামর্শ প্রশংসা করা হয়। অতিরিক্ত তথ্য: কোনও উদাহরণ নেই, সুতরাং পদ্ধতিটি …

12 tensorflow keras anomaly-detection

4

টিফ-আইডিএফ এবং কোসিন সাদৃশ্যগুলির বিকল্পগুলি যখন ভিন্ন ভিন্ন ফর্ম্যাটের ডকুমেন্টগুলির সাথে তুলনা করে

আমি একটি ছোট, ব্যক্তিগত প্রকল্পে কাজ করছি যা ব্যবহারকারীর কাজের দক্ষতা গ্রহণ করে এবং সেই দক্ষতার উপর ভিত্তি করে তাদের জন্য সবচেয়ে আদর্শ ক্যারিয়ারের পরামর্শ দেয়। আমি এটি অর্জনের জন্য কাজের তালিকার একটি ডাটাবেস ব্যবহার করি। এই মুহুর্তে কোডটি নিম্নলিখিতভাবে কাজ করে: 1) তালিকায় উল্লেখ করা দক্ষতাগুলি নিষ্ক্রিয় করতে প্রতিটি …

12 nlp text-mining similarity cosine-distance

2

বৈধতা হ্রাস এখনও হ্রাস সঙ্গে এমনকি overfitting ঘটতে পারে?

কেরাসে আমার একটি কনসিউশনাল + এলএসটিএম মডেল রয়েছে, এটি (রেফ 1) এর অনুরূপ, যা আমি কাগল প্রতিযোগিতার জন্য ব্যবহার করছি। আর্কিটেকচারটি নীচে দেখানো হয়েছে। আমি এটিকে আমার লেবেলযুক্ত 11000 নমুনার সেটটিতে প্রশিক্ষণ দিয়েছি (দুটি শ্রেণি, প্রাথমিক প্রাদুর্ভাব 9 ~: 1, সুতরাং আমি 1% এর প্রায় 1/1 অনুপাতকে উপস্থাপন করেছি) 20% …

12 keras cross-validation overfitting

3

শ্রেণিবিন্যাসের জন্য আরবিএম কীভাবে ব্যবহার করবেন?

এই মুহুর্তে আমি সীমাবদ্ধ বোল্টজমান মেশিনগুলির সাথে খেলছি এবং যেহেতু আমি এতে আছি আমি এটির সাথে হাতের লিখিত অঙ্কগুলি শ্রেণিবদ্ধ করার চেষ্টা করব। আমি যে মডেলটি তৈরি করেছি তা এখন বেশ অভিনব জেনারেটরি মডেল তবে এটি কীভাবে আরও এগিয়ে যেতে হয় তা আমি জানি না। ইন এই নিবন্ধটি লেখকের বলুন, …

12 classification rbm

1

একটি সাধারণ স্ব-ড্রাইভিং আরসি গাড়িটির জন্য তদারকি করা শিখন বনাম রিইনফোর্সমেন্ট লার্নিং

আমি মজা করার জন্য একটি রিমোট-কন্ট্রোলড স্ব ড্রাইভিং গাড়ি তৈরি করছি। আমি চালিত কম্পিউটার হিসাবে একটি রাস্পবেরি পাই ব্যবহার করছি; এবং গাড়ির চারপাশে প্রতিক্রিয়া জানাতে আমি বিভিন্ন প্লাগ-ইন ব্যবহার করছি, যেমন একটি রাস্পবেরি পাই ক্যামেরা এবং দূরত্ব সেন্সর। আমি ভিডিও ফ্রেমগুলিকে টেনারগুলিতে পরিণত করতে ওপেনসিভি ব্যবহার করছি এবং আমি রাস্তার …

12 reinforcement-learning supervised-learning

2

পিসিএ করার সময় কত মাত্রা কমাতে হবে?

কিভাবে পিসিএ জন্য কে নির্বাচন করবেন? কে হ'ল প্রজেক্টের সংখ্যা নীচে। একমাত্র প্রয়োজনীয়তা হল খুব বেশি তথ্য না হারাতে। আমি বুঝতে পারি এটি ডেটার উপর নির্ভর করে তবে কে বেছে নেওয়ার সময় কোন বৈশিষ্ট্যগুলি বিবেচনা করা উচিত সে সম্পর্কে একটি সাধারণ সাধারণ ওভারভিউয়ের জন্য আমি আরও সন্ধান করছি।

12 pca

1

গ্রাহকদের 2 টি বৈশিষ্ট্য এবং ইভেন্টের একটি সিরিজ ভিত্তিতে শ্রেণীবদ্ধ করুন

আমি যে অ্যালগরিদমটি ডিজাইন করছি তাতে আমার পরবর্তী পদক্ষেপটি কী হতে হবে সে সম্পর্কে আমার সহায়তা দরকার। এনডিএগুলির কারণে, আমি অনেক কিছুই প্রকাশ করতে পারি না, তবে আমি জেনেরিক এবং বোধগম্য হওয়ার চেষ্টা করব। মূলত, অ্যালগরিদমে বেশ কয়েকটি পদক্ষেপের পরে আমার কাছে এটি রয়েছে: আমার কাছে থাকা প্রতিটি গ্রাহকের জন্য …

12 classification clustering time-series

5

নিউরাল নেটওয়ার্কগুলির জন্য সেরা জুলিয়া গ্রন্থাগার

আমি এই গ্রন্থাগারটি বেসিক নিউরাল নেটওয়ার্ক নির্মাণ এবং বিশ্লেষণের জন্য ব্যবহার করে আসছি। তবে মাল্টি-লেয়ার্ড নিউরাল নেটওয়ার্ক ইত্যাদির জন্য এটির সমর্থন নেই etc. সুতরাং, আমি জুলিয়ায় উন্নত নিউরাল নেটওয়ার্কগুলি এবং ডিপ লার্নিংয়ের জন্য কোনও দুর্দান্ত গ্রন্থাগার সম্পর্কে জানতে চাই।

12 machine-learning neural-network julia

1

মিমহ্যাশিং বনাম সিমহ্যাশিং

ধরুন আমার কাছে পাঁচটি সেট রয়েছে আমি ক্লাস্টার করতে চাই। আমি বুঝতে পারি যে এখানে বর্ণিত সিমহ্যাশিং কৌশল: https://moultano.wordpress.com/2010/01/21/simple-simhashing-3kbzhsxyg4467-6/ তিন ক্লাস্টার উত্পাদ পারেনি ( {A}, {B,C,D}এবং {E}), উদাহরণস্বরূপ, যদি তার ফলাফল ছিল: A -> h01 B -> h02 C -> h02 D -> h02 E -> h03 একইভাবে, এমএমডিএস বইয়ের …

12 clustering similarity

2

এয়ারলাইন ভাড়া - প্রতিযোগিতামূলক মূল্য-নির্ধারণ আচরণ এবং মূল্য সম্পর্কিত সম্পর্ক সনাক্ত করতে কোন বিশ্লেষণ ব্যবহার করা উচিত?

আমি এয়ারলাইন্সের দাম নির্ধারণের আচরণটি তদন্ত করতে চাই - বিশেষত বিমান সংস্থা প্রতিযোগীদের মূল্য নির্ধারণে কীভাবে প্রতিক্রিয়া দেখায়। যেহেতু আমি বলতে চাই আরও জটিল বিশ্লেষণ সম্পর্কে আমার জ্ঞানটি যথেষ্ট সীমাবদ্ধ আমি তথ্যের সামগ্রিক দৃষ্টিভঙ্গি সংগ্রহ করার জন্য বেশিরভাগ মৌলিক পদ্ধতিই করেছি। এর মধ্যে সাধারণ গ্রাফ রয়েছে যা ইতিমধ্যে অনুরূপ নিদর্শনগুলি …

12 data-mining dataset regression correlation visualization

7

ডেটা বিজ্ঞানীর একটি 'পুরাতন নাম' কী?

'ডেটা সায়েন্স' এবং 'ডেটা সায়েন্টিস্ট' এর মতো পদগুলি আজকাল ক্রমবর্ধমান ব্যবহৃত হচ্ছে। অনেক সংস্থা 'তথ্য বিজ্ঞানী' নিয়োগ করছে। তবে আমি মনে করি না এটি সম্পূর্ণ নতুন কাজ। অতীত থেকে ডেটা বিদ্যমান ছিল এবং কারও কাছে ডেটা নিয়ে কাজ করতে হয়েছিল। আমার ধারণা 'ডেটা সায়েন্টিস্ট' শব্দটি আরও জনপ্রিয় হয়ে উঠেছে কারণ …

12 bigdata

1

হ্যাশিং ট্রিক - আসলে কী ঘটে

যখন এমএল অ্যালগরিদম, উদাহরণস্বরূপ ভোপাল ওয়াবিট বা কিছু কম্প্যাক্টরাইজেশন মেশিনগুলি রেট প্রতিযোগিতা ( ক্যাগল ) এর মাধ্যমে ক্লিক করে , বৈশিষ্ট্যগুলি 'হ্যাশড' উল্লেখ করে, তখন মডেলটির প্রকৃত অর্থ কী? আসুন বলি যে এখানে একটি ভেরিয়েবল রয়েছে যা একটি ইন্টারনেট অ্যাডের আইডি উপস্থাপন করে যা '236BG231' এর মতো মান গ্রহণ করে। …

12 machine-learning predictive-modeling kaggle

2

ইমোজি জন্য সংবেদন ডেটা

পরীক্ষা নিরীক্ষা জন্য আমরা ব্যবহার করতে চান সেটি ইমোজি / একটি স্থল সত্য হিসাবে অনেক টুইট সহজ পরিমাণগত senitment বিশ্লেষণ জন্য তথ্য প্রশিক্ষণ এমবেড। NLP ভাল কাজ করার জন্য টুইটগুলি সাধারণত খুব কাঠামোগত হয়। যাইহোক, ইউনিকোড 6.0 এ 722 ইমোজি রয়েছে এবং সম্ভবত ইউনিকোড 7.0 তে আরও 250 টি যুক্ত …

12 machine-learning classification parsing

3

কাঠামোগত কাঠামোগত শ্রেণিবদ্ধকরণ

আমি অপ্রচলিত টেক্সট ডকুমেন্টগুলি, অর্থাৎ অজানা কাঠামোর ওয়েব সাইটগুলিকে শ্রেণিবদ্ধ করতে যাচ্ছি। আমি যে শ্রেণিতে শ্রেণিবদ্ধ করছি তার সংখ্যা সীমিত (এই মুহুর্তে, আমি বিশ্বাস করি যে এখানে আরও তিনটির বেশি নেই)। আমি কীভাবে শুরু করতে পারি তার জন্য কারও কাছে কোনও পরামর্শ আছে? "শব্দের ব্যাগ" এখানে কি সম্ভব? পরে, আমি …

12 machine-learning classification text-mining beginner