তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

2
কেন আমাদের ডাটা ভারসাম্যহাল পরিচালনা করতে হবে?
আমাদের কেন ভারসাম্যহীনতার ভারসাম্য মোকাবেলা করতে হবে তা জানতে হবে। আমি কীভাবে এটির মোকাবিলা করতে এবং সমস্যা সমাধানের বিভিন্ন পদ্ধতি যা স্যাম্পলিং বা ডাউন স্যাম্পলিংয়ের মাধ্যমে বা স্মোট ব্যবহার করে সমাধান করা যায় তা আমি জানি। উদাহরণস্বরূপ, যদি আমার মধ্যে বিরল রোগ হয় 100 এর মধ্যে 1 শতাংশ, এবং বলি …

4
নিউরাল নেটওয়ার্কের সাথে ব্যতিক্রমগুলি সনাক্ত করা
আমার কাছে একটি বৃহত বহুমাত্রিক ডেটাসেট রয়েছে যা প্রতিদিন উত্পন্ন হয়। আগের দিনের তুলনায় কোনও ধরণের 'বিড়ম্বনা' সনাক্ত করার জন্য কী ভাল পন্থা হতে পারে? এটি কি একটি উপযুক্ত সমস্যা যা নিউরাল নেটওয়ার্কগুলির সাথে সমাধান করা যেতে পারে? কোন পরামর্শ প্রশংসা করা হয়। অতিরিক্ত তথ্য: কোনও উদাহরণ নেই, সুতরাং পদ্ধতিটি …

4
টিফ-আইডিএফ এবং কোসিন সাদৃশ্যগুলির বিকল্পগুলি যখন ভিন্ন ভিন্ন ফর্ম্যাটের ডকুমেন্টগুলির সাথে তুলনা করে
আমি একটি ছোট, ব্যক্তিগত প্রকল্পে কাজ করছি যা ব্যবহারকারীর কাজের দক্ষতা গ্রহণ করে এবং সেই দক্ষতার উপর ভিত্তি করে তাদের জন্য সবচেয়ে আদর্শ ক্যারিয়ারের পরামর্শ দেয়। আমি এটি অর্জনের জন্য কাজের তালিকার একটি ডাটাবেস ব্যবহার করি। এই মুহুর্তে কোডটি নিম্নলিখিতভাবে কাজ করে: 1) তালিকায় উল্লেখ করা দক্ষতাগুলি নিষ্ক্রিয় করতে প্রতিটি …

2
বৈধতা হ্রাস এখনও হ্রাস সঙ্গে এমনকি overfitting ঘটতে পারে?
কেরাসে আমার একটি কনসিউশনাল + এলএসটিএম মডেল রয়েছে, এটি (রেফ 1) এর অনুরূপ, যা আমি কাগল প্রতিযোগিতার জন্য ব্যবহার করছি। আর্কিটেকচারটি নীচে দেখানো হয়েছে। আমি এটিকে আমার লেবেলযুক্ত 11000 নমুনার সেটটিতে প্রশিক্ষণ দিয়েছি (দুটি শ্রেণি, প্রাথমিক প্রাদুর্ভাব 9 ~: 1, সুতরাং আমি 1% এর প্রায় 1/1 অনুপাতকে উপস্থাপন করেছি) 20% …

3
শ্রেণিবিন্যাসের জন্য আরবিএম কীভাবে ব্যবহার করবেন?
এই মুহুর্তে আমি সীমাবদ্ধ বোল্টজমান মেশিনগুলির সাথে খেলছি এবং যেহেতু আমি এতে আছি আমি এটির সাথে হাতের লিখিত অঙ্কগুলি শ্রেণিবদ্ধ করার চেষ্টা করব। আমি যে মডেলটি তৈরি করেছি তা এখন বেশ অভিনব জেনারেটরি মডেল তবে এটি কীভাবে আরও এগিয়ে যেতে হয় তা আমি জানি না। ইন এই নিবন্ধটি লেখকের বলুন, …

1
একটি সাধারণ স্ব-ড্রাইভিং আরসি গাড়িটির জন্য তদারকি করা শিখন বনাম রিইনফোর্সমেন্ট লার্নিং
আমি মজা করার জন্য একটি রিমোট-কন্ট্রোলড স্ব ড্রাইভিং গাড়ি তৈরি করছি। আমি চালিত কম্পিউটার হিসাবে একটি রাস্পবেরি পাই ব্যবহার করছি; এবং গাড়ির চারপাশে প্রতিক্রিয়া জানাতে আমি বিভিন্ন প্লাগ-ইন ব্যবহার করছি, যেমন একটি রাস্পবেরি পাই ক্যামেরা এবং দূরত্ব সেন্সর। আমি ভিডিও ফ্রেমগুলিকে টেনারগুলিতে পরিণত করতে ওপেনসিভি ব্যবহার করছি এবং আমি রাস্তার …

2
পিসিএ করার সময় কত মাত্রা কমাতে হবে?
কিভাবে পিসিএ জন্য কে নির্বাচন করবেন? কে হ'ল প্রজেক্টের সংখ্যা নীচে। একমাত্র প্রয়োজনীয়তা হল খুব বেশি তথ্য না হারাতে। আমি বুঝতে পারি এটি ডেটার উপর নির্ভর করে তবে কে বেছে নেওয়ার সময় কোন বৈশিষ্ট্যগুলি বিবেচনা করা উচিত সে সম্পর্কে একটি সাধারণ সাধারণ ওভারভিউয়ের জন্য আমি আরও সন্ধান করছি।
12 pca 

1
গ্রাহকদের 2 টি বৈশিষ্ট্য এবং ইভেন্টের একটি সিরিজ ভিত্তিতে শ্রেণীবদ্ধ করুন
আমি যে অ্যালগরিদমটি ডিজাইন করছি তাতে আমার পরবর্তী পদক্ষেপটি কী হতে হবে সে সম্পর্কে আমার সহায়তা দরকার। এনডিএগুলির কারণে, আমি অনেক কিছুই প্রকাশ করতে পারি না, তবে আমি জেনেরিক এবং বোধগম্য হওয়ার চেষ্টা করব। মূলত, অ্যালগরিদমে বেশ কয়েকটি পদক্ষেপের পরে আমার কাছে এটি রয়েছে: আমার কাছে থাকা প্রতিটি গ্রাহকের জন্য …

5
নিউরাল নেটওয়ার্কগুলির জন্য সেরা জুলিয়া গ্রন্থাগার
আমি এই গ্রন্থাগারটি বেসিক নিউরাল নেটওয়ার্ক নির্মাণ এবং বিশ্লেষণের জন্য ব্যবহার করে আসছি। তবে মাল্টি-লেয়ার্ড নিউরাল নেটওয়ার্ক ইত্যাদির জন্য এটির সমর্থন নেই etc. সুতরাং, আমি জুলিয়ায় উন্নত নিউরাল নেটওয়ার্কগুলি এবং ডিপ লার্নিংয়ের জন্য কোনও দুর্দান্ত গ্রন্থাগার সম্পর্কে জানতে চাই।

1
মিমহ্যাশিং বনাম সিমহ্যাশিং
ধরুন আমার কাছে পাঁচটি সেট রয়েছে আমি ক্লাস্টার করতে চাই। আমি বুঝতে পারি যে এখানে বর্ণিত সিমহ্যাশিং কৌশল: https://moultano.wordpress.com/2010/01/21/simple-simhashing-3kbzhsxyg4467-6/ তিন ক্লাস্টার উত্পাদ পারেনি ( {A}, {B,C,D}এবং {E}), উদাহরণস্বরূপ, যদি তার ফলাফল ছিল: A -> h01 B -> h02 C -> h02 D -> h02 E -> h03 একইভাবে, এমএমডিএস বইয়ের …

2
এয়ারলাইন ভাড়া - প্রতিযোগিতামূলক মূল্য-নির্ধারণ আচরণ এবং মূল্য সম্পর্কিত সম্পর্ক সনাক্ত করতে কোন বিশ্লেষণ ব্যবহার করা উচিত?
আমি এয়ারলাইন্সের দাম নির্ধারণের আচরণটি তদন্ত করতে চাই - বিশেষত বিমান সংস্থা প্রতিযোগীদের মূল্য নির্ধারণে কীভাবে প্রতিক্রিয়া দেখায়। যেহেতু আমি বলতে চাই আরও জটিল বিশ্লেষণ সম্পর্কে আমার জ্ঞানটি যথেষ্ট সীমাবদ্ধ আমি তথ্যের সামগ্রিক দৃষ্টিভঙ্গি সংগ্রহ করার জন্য বেশিরভাগ মৌলিক পদ্ধতিই করেছি। এর মধ্যে সাধারণ গ্রাফ রয়েছে যা ইতিমধ্যে অনুরূপ নিদর্শনগুলি …

7
ডেটা বিজ্ঞানীর একটি 'পুরাতন নাম' কী?
'ডেটা সায়েন্স' এবং 'ডেটা সায়েন্টিস্ট' এর মতো পদগুলি আজকাল ক্রমবর্ধমান ব্যবহৃত হচ্ছে। অনেক সংস্থা 'তথ্য বিজ্ঞানী' নিয়োগ করছে। তবে আমি মনে করি না এটি সম্পূর্ণ নতুন কাজ। অতীত থেকে ডেটা বিদ্যমান ছিল এবং কারও কাছে ডেটা নিয়ে কাজ করতে হয়েছিল। আমার ধারণা 'ডেটা সায়েন্টিস্ট' শব্দটি আরও জনপ্রিয় হয়ে উঠেছে কারণ …
12 bigdata 

1
হ্যাশিং ট্রিক - আসলে কী ঘটে
যখন এমএল অ্যালগরিদম, উদাহরণস্বরূপ ভোপাল ওয়াবিট বা কিছু কম্প্যাক্টরাইজেশন মেশিনগুলি রেট প্রতিযোগিতা ( ক্যাগল ) এর মাধ্যমে ক্লিক করে , বৈশিষ্ট্যগুলি 'হ্যাশড' উল্লেখ করে, তখন মডেলটির প্রকৃত অর্থ কী? আসুন বলি যে এখানে একটি ভেরিয়েবল রয়েছে যা একটি ইন্টারনেট অ্যাডের আইডি উপস্থাপন করে যা '236BG231' এর মতো মান গ্রহণ করে। …

2
ইমোজি জন্য সংবেদন ডেটা
পরীক্ষা নিরীক্ষা জন্য আমরা ব্যবহার করতে চান সেটি ইমোজি / একটি স্থল সত্য হিসাবে অনেক টুইট সহজ পরিমাণগত senitment বিশ্লেষণ জন্য তথ্য প্রশিক্ষণ এমবেড। NLP ভাল কাজ করার জন্য টুইটগুলি সাধারণত খুব কাঠামোগত হয়। যাইহোক, ইউনিকোড 6.0 এ 722 ইমোজি রয়েছে এবং সম্ভবত ইউনিকোড 7.0 তে আরও 250 টি যুক্ত …

3
কাঠামোগত কাঠামোগত শ্রেণিবদ্ধকরণ
আমি অপ্রচলিত টেক্সট ডকুমেন্টগুলি, অর্থাৎ অজানা কাঠামোর ওয়েব সাইটগুলিকে শ্রেণিবদ্ধ করতে যাচ্ছি। আমি যে শ্রেণিতে শ্রেণিবদ্ধ করছি তার সংখ্যা সীমিত (এই মুহুর্তে, আমি বিশ্বাস করি যে এখানে আরও তিনটির বেশি নেই)। আমি কীভাবে শুরু করতে পারি তার জন্য কারও কাছে কোনও পরামর্শ আছে? "শব্দের ব্যাগ" এখানে কি সম্ভব? পরে, আমি …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.