তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
বৈশিষ্ট্য আমদানির প্রসঙ্গে সিদ্ধান্তের গাছটিকে ব্যাখ্যা করা
আমি কীভাবে স্কলারন দিয়ে নির্মিত সিদ্ধান্ত গাছ শ্রেণিবদ্ধকরণের মডেলটির সিদ্ধান্ত প্রক্রিয়াটি পুরোপুরি বুঝতে পারি তা বোঝার চেষ্টা করছি। আমি যে দুটি প্রধান দিকটি দেখছি তা হ'ল গাছের গ্রাফিজ উপস্থাপনা এবং বৈশিষ্ট্য আমদানির তালিকা। আমি যা বুঝতে পারি না তা হল গাছের প্রসঙ্গে কীভাবে বৈশিষ্ট্যটির গুরুত্ব নির্ধারণ করা হয়। উদাহরণস্বরূপ, বৈশিষ্ট্য …

3
আমি কীভাবে বড় বিভ্রান্তির ম্যাট্রিকগুলি সহজভাবে পড়তে পারি?
আমি সম্প্রতি 369 ক্লাস সহ একটি ডেটাসেট ( লিঙ্ক ) প্রকাশ করেছি । শ্রেণিবদ্ধকরণ কাজটি কতটা কঠিন তার অনুভূতি পেতে আমি তাদের উপর বেশ কয়েকটি পরীক্ষা চালিয়েছি। সাধারণত, আমি এটি পছন্দ করি যদি কোনও ধরণের ত্রুটি হচ্ছে তা দেখার জন্য যদি বিভ্রান্তির ম্যাট্রিক থাকে। যাইহোক, একটি ম্যাট্রিক্স ব্যবহারিক নয়।369 × …

2
কেন শিখার হার আমার নিউরাল নেটওয়ার্কের ওজনকে স্কাইরকেটে ডেকে আনছে?
আমি কিছুটা গবেষণার জন্য সাধারণ নিউরাল নেটওয়ার্কগুলি লিখতে টেনসরফ্লো ব্যবহার করছি এবং প্রশিক্ষণের সময় 'ন্যান' ওজন নিয়ে আমার অনেক সমস্যা হয়েছিল। অপটিমাইজার পরিবর্তন করা, ক্ষতির পরিবর্তন, উপাত্তের আকার ইত্যাদির মতো অনেকগুলি বিভিন্ন সমাধান আমি চেষ্টা করেছি তবে কোনও লাভ হয়নি। অবশেষে, আমি লক্ষ করেছি যে শিক্ষার হারে পরিবর্তন আমার ওজনে …

2
Word2vec এ শব্দের ভেক্টরের বৈশিষ্ট্য
আমি অনুভূতি বিশ্লেষণ করার চেষ্টা করছি। শব্দগুলিকে শব্দ ভেক্টরগুলিতে রূপান্তর করার জন্য আমি word2vec মডেলটি ব্যবহার করছি। ধরা যাক 'বাক্য' নামের একটি তালিকায় আমার সমস্ত বাক্য রয়েছে এবং আমি এই বাক্যগুলিকে নীচে ওয়ার্ড টুভেচ করে দিচ্ছি: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) আমি যেহেতু ভেক্টর শব্দের কাছে …

1
বেনামে পরিমাপ করা সংখ্যার পূর্বাভাসকারীদের সাথে কীভাবে নামার.ই প্রতিযোগিতাটি পাবেন?
নিউমার.ই এখন কিছুটা সময় হয়ে গেছে এবং ওয়েবে কেবলমাত্র কয়েকটি পোস্ট বা অন্যান্য আলোচনা রয়েছে বলে মনে হচ্ছে। সিস্টেম সময়ে সময়ে পরিবর্তিত হয়েছে এবং আজ সেটআপটি নিম্নলিখিত: [0,1] এবং বাইনারি টার্গেটে অবিচ্ছিন্ন মান সহ 21 টি বৈশিষ্ট্য সহ ট্রেন (এন = 96 কে) এবং পরীক্ষা (এন = 33 কে) ডেটা। …

1
এলোমেলো বন এবং লিনিয়ার রিগ্রেশন এর মাধ্যমে বৈশিষ্ট্যটির গুরুত্ব আলাদা
বৈশিষ্ট্যগুলি র‌্যাঙ্ক করার জন্য লাসো প্রয়োগ করেছেন এবং নিম্নলিখিত ফলাফল পেয়েছেন: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 নোট করুন যে ডেটা সেটটিতে 3 টি লেবেল রয়েছে। বিভিন্ন লেবেলের বৈশিষ্ট্যগুলির র‌্যাঙ্কিং একই। তারপরে একই তথ্য সেটটিতে এলোমেলো বন প্রয়োগ করা হয়েছে: rank feature score …

3
নিউরাল নেটওয়ার্কগুলিতে নিয়মিতকরণ পদ্ধতি নির্বাচন করা
নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণ দেওয়ার সময়, নেটওয়ার্কটি নিয়মিত করার জন্য কমপক্ষে 4 টি উপায় রয়েছে: এল 1 নিয়মিতকরণ এল 2 নিয়মিতকরণ বাদ পড়া ব্যাচ নরমালাইজেশন অবশ্যই ওজন ভাগ করে নেওয়া এবং সংযোগের সংখ্যা হ্রাস করার মতো অন্যান্য জিনিস, যা কঠোর অর্থে নিয়মিতকরণ নাও হতে পারে। তবে কীভাবে কেউ এই নিয়মিতকরণের কোনটি …

3
কোনটি, যদি কোনও, মেশিন লার্নিং অ্যালগরিদমগুলি ব্যাখ্যাযোগ্যতা এবং পূর্বাভাসের মধ্যে একটি ভাল ট্রেড অফ হিসাবে গৃহীত হয়?
গ্রেডিয়েন্ট বুস্টিং মেশিন বা নিউরাল নেটওয়ার্কগুলির মতো অ্যালগরিদমগুলিকে বর্ণনা করে মেশিন লার্নিং পাঠ্যগুলি প্রায়শই মন্তব্য করে যে এই মডেলগুলি পূর্বাভাসে ভাল, তবে এটি ব্যাখ্যাযোগ্যতা বা ব্যাখ্যার ক্ষতির মূল্যে আসে। বিপরীতে, একক সিদ্ধান্ত গাছ এবং শাস্ত্রীয় রিগ্রেশন মডেলগুলিকে ব্যাখ্যায় ভাল হিসাবে চিহ্নিত করা হয়, তবে এলোমেলো বন বা এসভিএম এর মতো …

3
এমন পরিস্থিতিতে পরিস্থিতিটির জন্য ব্যবহারকারীরা কী প্রস্তাবনা ইঞ্জিনে কেবল সমস্ত আইটেমের একটি অংশ দেখতে পাচ্ছেন?
আমি একটি দস্তাবেজ পরিচালন সিস্টেমে একটি সুপারিশ বৈশিষ্ট্য যুক্ত করতে চাই । এটি এমন একটি সার্ভার যেখানে বেশিরভাগ সংস্থার নথি সংরক্ষণ করা হয়। কর্মচারীরা ওয়েব ইন্টারফেসটি ব্রাউজ করে এবং তারা যে নথিগুলি চান তা ডাউনলোড করতে (বা অনলাইনে পড়তে) ক্লিক করুন। প্রতিটি কর্মীর কেবলমাত্র সমস্ত দস্তাবেজের একটি উপসেট অ্যাক্সেস রয়েছে: …

2
সহযোগী ফিল্টারিংয়ের জন্য বেঞ্চমার্ক ডেটাসেট
আমি সহযোগী ফিল্টারিংয়ের জন্য একটি নতুন অ্যালগরিদম পরীক্ষা করতে চাই । একটি সাধারণ ব্যবহারের ক্ষেত্রে নির্দিষ্ট ব্যবহারকারীর অনুরূপ ব্যবহারকারীদের পছন্দগুলির উপর ভিত্তি করে চলচ্চিত্রগুলি সুপারিশ করা হয়। গবেষকরা প্রায়শই তাদের অ্যালগোরিদমগুলি পরীক্ষা করতে ব্যবহার করেন এমন কিছু সাধারণ বেঞ্চমার্ক ডেটাसेट কী কী? আমি জানি যে কম্পিউটার ভিশনের মধ্যে লোকেরা প্রায়শই …

1
একটি এসভিএম এবং কবজ ক্ষতির মধ্যে কী সম্পর্ক?
আমার সহকর্মী এবং আমি লজিস্টিক রিগ্রেশন এবং একটি এসভিএম এর মধ্যে পার্থক্যটি ঘিরে আমাদের মাথা গুটিয়ে দেওয়ার চেষ্টা করছি। স্পষ্টতই তারা বিভিন্ন উদ্দেশ্যমূলক ক্রিয়াকে অপ্টিমাইজ করছে। কোনও এসভিএম কি এতটা সহজ যে এটি বৈষম্যমূলক শ্রেণিবদ্ধকারী যা কেবল কব্জা ক্ষতিটিকে অনুকূল করে তোলে? নাকি এর চেয়ে জটিল? সাপোর্ট ভেক্টররা কীভাবে খেলতে …

3
সাইকিট-লার্নে র্যান্ডম ফরেস্ট রেজিস্ট্রার থেকে ওজন (সূত্র) রফতানি করুন
আমি পাইথন (র্যান্ডম ফরেস্ট রেজিস্ট্রার) এর সাইকিট লার্নের সাথে একটি পূর্বাভাস মডেল প্রশিক্ষণ দিয়েছি এবং ম্যানুয়াল পূর্বাভাসের জন্য একটি এক্সেল সরঞ্জাম তৈরি করতে আমি প্রতিটি বৈশিষ্ট্যের ওজন একরকম বের করতে চাই। আমি যে জিনিসটি পেয়েছি তা হ'ল model.feature_importances_তবে এটি কোনও লাভ করে না। এটি অর্জন করার কোনও উপায় আছে কি? …

2
অন্যান্য নিয়মাবলী বনাম ড্রপআউট পরীক্ষা করে এমন গবেষণা রয়েছে?
এমন কি কোনও পত্রিকা প্রকাশিত হয়েছে যা নিউরাল নেটওয়ার্কগুলির নিয়মিতকরণ পদ্ধতির পার্থক্য দেখায়, বিশেষত বিভিন্ন ডোমেনগুলিতে (বা কমপক্ষে বিভিন্ন ডেটাসেট)? আমি জিজ্ঞাসা করছি কারণ বর্তমানে আমার এই অনুভূতিটি রয়েছে যে বেশিরভাগ লোকেরা কম্পিউটার ভিশনকে নিয়মিতকরণের জন্য কেবল ড্রপআউট ব্যবহার করেন। নিয়মিতকরণের বিভিন্ন উপায় ব্যবহার করার কোনও কারণ আছে (না) আছে …

7
পাইথন লাইব্রেরি যা মাল্টি-লেবেল শ্রেণিবিন্যাসের জন্য বিভ্রান্তির ম্যাট্রিক্স গণনা করতে পারে
আমি পাইথন লাইব্রেরির সন্ধান করছি যা মাল্টি-লেবেল শ্রেণিবিন্যাসের জন্য বিভ্রান্তির ম্যাট্রিক্স গণনা করতে পারে । অবগতির জন্য: সাইকিট শিখুন বিভ্রান্তির ম্যাট্রিক্সের জন্য মাল্টি-লেবেল সমর্থন করে না ) মাল্টিক্লাস এবং মাল্টিলেবল সমস্যাটির মধ্যে পার্থক্য কী

3
সেন্টিমেন্ট বিশ্লেষণ টিউটোরিয়াল
আমি অনুভূতি বিশ্লেষণ এবং যে কোনও ভাষা (আর, পাইথন ইত্যাদি) ব্যবহার করে কীভাবে এটি প্রয়োগ করব তা বোঝার চেষ্টা করছি। আমি জানতে চাই যে টিউটোরিয়ালের জন্য ইন্টারনেটে কোনও ভাল জায়গা আছে যা আমি অনুসরণ করতে পারি। আমি গুগল করেছিলাম, তবে আমি খুব বেশি সন্তুষ্ট হইনি কারণ সেগুলি টিউটোরিয়াল নয় বরং …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.