তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
শব্দ 2vec কীভাবে অদেখা শব্দগুলি সনাক্ত করতে এবং ইতিমধ্যে প্রশিক্ষিত ডেটার সাথে তাদের সম্পর্কিত করতে ব্যবহার করা যেতে পারে
আমি ওয়ার্ড টুভেক জেনসিম মডেলটিতে কাজ করছিলাম এবং এটি সত্যিই আকর্ষণীয় মনে হয়েছিল। মডেলটির সাথে চেক করার সময় কোনও অজানা / অদেখা শব্দটি প্রশিক্ষিত মডেল থেকে কীভাবে অনুরূপ পদ পেতে সক্ষম হবে তা সন্ধান করতে আমি ছেদ করছি am এটা কি সম্ভব? এর জন্য কি ওয়ার্ড টুভেক করা যায়? বা …

3
ভারসাম্যহীন শ্রেণী - মিথ্যা নেতিবাচকতা কীভাবে হ্রাস করা যায়?
আমার কাছে একটি ডেটাসেট রয়েছে যাতে বাইনারি শ্রেণির বৈশিষ্ট্য রয়েছে। ক্লাস +1 (ক্যান্সার ধনাত্মক) সহ 623 টি উদাহরণ এবং শ্রেণি -1 (ক্যান্সার নেতিবাচক) সহ 101,671 টি দৃষ্টান্ত রয়েছে। আমি বিভিন্ন অ্যালগরিদম চেষ্টা করেছি (নাইভ বেইস, র‌্যান্ডম ফরেস্ট, এওডিই, সি 4.5) এবং তাদের সকলের কাছে অগ্রহণযোগ্য মিথ্যা নেতিবাচক অনুপাত রয়েছে। র‌্যান্ডম …

3
স্পার্কে আইপিথন / জুপিটারের সাথে ইস্যু করুন (অচেনা নাম)
আমি বাইরে বেরোনোর ​​আগে এবং কিছু হার্ডওয়্যার দিয়ে একটি ক্লাস্টার গড়ে তুলতে অর্থ ব্যয় করার আগে স্পার্কের সাথে পরীক্ষার জন্য ভিএমগুলির একটি সেট স্থাপনের কাজ করছি। তাত্ক্ষণিক দ্রষ্টব্য: আমি প্রয়োগকৃত মেশিন লার্নিংয়ের ব্যাকগ্রাউন্ড সহ একাডেমিক এবং ডেটা সায়েন্সে কিছুটা ছেড়ে দিয়ে কাজ করি। আমি কম্পিউটিংয়ের জন্য সরঞ্জামগুলি ব্যবহার করি, খুব …

4
এলোমেলো বনে কীভাবে অতিরিক্ত পোশাক এড়ানো যায়?
আমি এলোমেলো বনাঞ্চলে ওভারফিটিং এড়াতে চাই। এই ক্ষেত্রে, আমি কদাচিৎ, নোডসাইজ এবং ম্যাক্সনোড ইত্যাদি ব্যবহার করার ইচ্ছা করি আপনি কি দয়া করে আমাকে এই পরামিতিগুলির জন্য মানগুলি চয়ন করতে সহায়তা করতে পারেন? আমি আর ব্যবহার করছি এছাড়াও, যদি সম্ভব হয় তবে দয়া করে আমাকে বলুন কীভাবে আমি এলোমেলো অরণ্যের (আর …

7
লিঙ্কডইন ওয়েব স্ক্র্যাপিং
আমি সম্প্রতি লিঙ্কডইন এপিআইতে সংযোগের জন্য একটি নতুন আর প্যাকেজ আবিষ্কার করেছি । দুর্ভাগ্যক্রমে লিঙ্কডইন এপিআই শুরু হতে বেশ সীমাবদ্ধ বলে মনে হয়; উদাহরণস্বরূপ, আপনি কেবল সংস্থাগুলিতে প্রাথমিক তথ্য পেতে পারেন এবং এটি ব্যক্তিদের ডেটা থেকে আলাদা করা হয়। আমি কোনও প্রদত্ত সংস্থার সমস্ত কর্মচারীর ডেটা পেতে চাই, যা আপনি …

3
ক্ষেত্র সচেতন ফ্যাক্টরাইজেশন মেশিনগুলি
ফিল্ড-সচেতন ফ্যাক্টরীকরণ মেশিনগুলি (এফএফএম) কীভাবে স্ট্যান্ডার্ড ফ্যাক্টরাইজেশন মেশিনের (এফএম) তুলনা করা যায় তা কী কেউ ব্যাখ্যা করতে পারেন? মান: http://www.ismll.uni-hildesheim.de/pub/pdfs/Rendle2010FM.pdf "ফিল্ড সচেতন": http://www.csie.ntu.edu.tw/~r01922136/kaggle-2014-criteo.pdf

5
মাসিক, দৈনিক এবং সাপ্তাহিক ডেটা কীভাবে মার্জ করবেন?
গুগল ট্রেন্ডস সাপ্তাহিক ডেটা ফেরত দেয় তাই আমাকে তাদের আমার দৈনিক / মাসিক ডেটাতে মার্জ করার একটি উপায় খুঁজে বের করতে হবে। আমি এখন পর্যন্ত যা করেছি তা হ'ল প্রতিটি সিরিয়াকে প্রতিদিনের ডেটাতে নষ্ট করে দেওয়া, উদাহরণ হিসাবে: থেকে: 2013-03-03 - 2013-03-09 37 প্রতি: 2013-03-03 37 2013-03-04 37 2013-03-05 37 …

2
সার্ভার নিরীক্ষণের জন্য নিউরাল নেট
আমি সার্ভার মনিটরের অ্যালার্ম নিতে এবং সমস্যার মূল কারণ নির্ধারণের জন্য পাইব্রাইন খুঁজছি। আমি তত্ত্বাবধানে পড়াশোনা ব্যবহার করে এবং প্রশিক্ষণের ডেটা সেটগুলি তৈরি করে প্রশিক্ষণ দিয়ে খুশি। ডেটা এমন কিছু কাঠামোযুক্ত: সার্ভারের প্রকার A # 1 অ্যালার্ম টাইপ 1 অ্যালার্ম টাইপ 2 সার্ভারের প্রকার A # 2 অ্যালার্ম টাইপ 1 …

2
বিরল তথ্য সহ সমীকরণের একটি সিস্টেম সমাধান করা
আমি সমীকরণগুলির একটি সেট সমাধান করার চেষ্টা করছি যার 40 টি স্বাধীন ভেরিয়েবল (x1, ..., x40) এবং একটি নির্ভরশীল ভেরিয়েবল (y) রয়েছে। সমীকরণের মোট সংখ্যা (সারিগুলির সংখ্যা) 300 ডলার, এবং আমি 40 সহগের সেটের জন্য সমাধান করতে চাই যা y এবং পূর্বাভাসিত মানের মধ্যে মোট যোগফলের বর্গ ত্রুটি হ্রাস করে। …

1
আর-তে এমএলইয়ের জন্য ফিশার স্কোরিং v / s স্থানাঙ্ক বংশোদ্ভূত
আর বেস ফাংশন glm()এমএলইয়ের জন্য ফিশার্স স্কোরিং ব্যবহার করে, যখন উপস্থিতগুলি glmnetএকই সমীকরণটি সমাধান করার জন্য স্থানাংক বংশদ্ভুত পদ্ধতি ব্যবহার করে। স্থায়ী বংশোদ্ভূত ফিশার স্কোরিংয়ের চেয়ে বেশি সময় সাশ্রয়ী, কারণ ফিশার স্কোরিং কিছু অন্যান্য ম্যাট্রিক্স অপারেশন ছাড়াও দ্বিতীয় ক্রম ডেরিভেটিভ ম্যাট্রিক্স গণনা করে। যা সম্পাদন করতে ব্যয়বহুল করে তোলে, যখন …

1
অবিচ্ছিন্ন অনলাইন ক্লাস্টার সনাক্তকরণের সমাধান?
আমি আপনাকে একটি অনুমান অনলাইন ক্লাস্টারিং অ্যাপ্লিকেশনটির একটি উদাহরণ দেখাব: সময় n পয়েন্ট 1,2,3,4 নীল ক্লাস্টার এ বরাদ্দ করা হয় এবং পয়েন্ট খ, 5,6,7 রেড ক্লাস্টার বি বরাদ্দ করা হয়। সময় n + 1 এ একটি নতুন পয়েন্ট a প্রবর্তিত হয় যা নীল ক্লাস্টার A এর জন্য নির্ধারিত হয় তবে …

4
বৈশিষ্ট্য এক্সট্রাকশন প্রযুক্তি - ডেটার সিকোয়েন্সের সংক্ষিপ্তসার
আমি প্রায়শই একটি মডেল (শ্রেণিবদ্ধকরণ বা রিগ্রেশন) তৈরি করছি যেখানে আমার কাছে কিছু অনুমানকারী ভেরিয়েবল রয়েছে যা সিকোয়েন্স রয়েছে এবং আমি মডেলটিতে ভবিষ্যদ্বাণীকারী হিসাবে অন্তর্ভুক্তির জন্য সর্বোত্তম উপায়ে সংক্ষিপ্ত করার জন্য কৌশল প্রস্তাবনাগুলি সন্ধান করার চেষ্টা করছি। একটি দৃ concrete় উদাহরণ হিসাবে, বলুন যে কোনও গ্রাহক আগামী 90 দিনের মধ্যে …

3
কেবলমাত্র ইতিবাচক এবং লেবেলযুক্ত ডেটা সহ একটি বাইনারি শ্রেণিবদ্ধকারী তৈরি করুন
আমার কাছে দুটি ডেটাসেট রয়েছে, আমি কী সনাক্ত করতে চাই তার ইতিবাচক উদাহরণ সহ একটি এবং লেবেলযুক্ত দৃষ্টান্ত সহ একটি। আমি কোন পদ্ধতি ব্যবহার করতে পারি? উদাহরণ হিসাবে, ধরুন আমরা কয়েকটি কাঠামোগত ইমেল বৈশিষ্ট্যের ভিত্তিতে স্প্যাম ইমেল সনাক্ত করতে বুঝতে চাই understand আমাদের কাছে 10000 স্প্যাম ইমেলের একটি ডেটাসেট রয়েছে …

4
জিএলএম কোনও পরিসংখ্যান বা মেশিন লার্নিং মডেল?
আমি ভেবেছিলাম যে জেনারালাইজড লিনিয়ার মডেল (জিএলএম) একটি পরিসংখ্যান মডেল হিসাবে বিবেচিত হবে, তবে একটি বন্ধু আমাকে বলেছিল যে কিছু কাগজপত্র এটিকে মেশিন লার্নিংয়ের কৌশল হিসাবে শ্রেণিবদ্ধ করে। কোনটি সত্য (বা আরও নির্ভুল)? কোন ব্যাখ্যা প্রশংসা হবে।

4
শ্রেণিবিন্যাস বিধি উত্পন্ন করার জন্য অ্যালগরিদম
সুতরাং আমাদের কাছে এমন একটি মেশিন লার্নিং অ্যাপ্লিকেশনের সম্ভাবনা রয়েছে যা শ্রেণিবদ্ধদের দ্বারা সমাধান করা traditionalতিহ্যগত সমস্যা ডোমেনের সাথে মোটামুটি সুন্দরভাবে ফিট করে, অর্থাত্ আমাদের কাছে একটি আইটেম এবং একটি "বালতি" বর্ণিত বৈশিষ্ট্যগুলির একটি সেট রয়েছে যা তারা শেষ করে However নায়েভ বেয়েস বা অনুরূপ শ্রেণিবদ্ধের মতো সম্ভাব্যতার জন্য আমরা …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.