তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

2
সমর্থন ভেক্টর মেশিনগুলি এখনও তাদের কুলুঙ্গিতে "শিল্পের রাজ্য" হিসাবে বিবেচিত হয়?
এই প্রশ্নটি আমি একটি অন্য মন্তব্যে দেখেছি এমন মন্তব্যের জবাবে। মন্তব্যটি ছিল কোর্সেরায় মেশিন লার্নিং কোর্স সিলেবাস সম্পর্কে, এবং "এসভিএমগুলি আজকাল এত বেশি ব্যবহার করা হয় না" এর ধারায়। আমি কেবলমাত্র প্রাসঙ্গিক বক্তৃতাগুলি নিজেই শেষ করেছি, এবং এসভিএমগুলি সম্পর্কে আমার বোঝা হ'ল তারা শ্রেণিবদ্ধকরণের জন্য একটি শক্তিশালী এবং দক্ষ লার্নিং …

11
মাত্রা হ্রাস কি? বৈশিষ্ট্য নির্বাচন এবং নিষ্কাশন মধ্যে পার্থক্য কি?
উইকিপিডিয়া থেকে, মাত্রিকতা হ্রাস বা মাত্রা হ্রাস বিবেচনাধীন র্যান্ডম ভেরিয়েবলের সংখ্যা হ্রাস করার প্রক্রিয়া, এবং বৈশিষ্ট্য নির্বাচন এবং বৈশিষ্ট্য নিষ্কাশন মধ্যে বিভক্ত করা যেতে পারে। বৈশিষ্ট্য নির্বাচন এবং বৈশিষ্ট্য নিষ্কাশন মধ্যে পার্থক্য কি? প্রাকৃতিক ভাষা প্রক্রিয়াকরণ কার্যে মাত্রা হ্রাসের উদাহরণ কী?

5
যখন একটি মডেল আন্ডারফিট করা হয়?
যুক্তি প্রায়শই বলে যে কোনও মডেলকে সজ্জিত করে, এটি সাধারণকরণের ক্ষমতা বাড়িয়ে তোলে। এটি বলেছিল, কোনও মডেলকে স্পষ্টভাবে উপস্থাপনের কারণে মডেলগুলির ডেটা জটিলতা নির্বিশেষে আরও খারাপ হয়ে যায়। আপনি কীভাবে জানবেন যে যখন আপনার মডেলটি সঠিক ভারসাম্যকে আঘাত করেছে এবং এটি যে মডেলটির কাছে খোঁজ করছে সেই ডেটাটি উপযুক্ত নয়? …

4
1x1 কনভোলিউশনগুলি কীভাবে সম্পূর্ণ সংযুক্ত স্তর হিসাবে একই?
আমি সম্প্রতি 1x1 কনভোলিউশনে ইয়ান লেকানসের মন্তব্য পড়েছি : কনভলিউশনাল নেটগুলিতে, "সম্পূর্ণ-সংযুক্ত স্তরগুলি" বলে কোনও জিনিস নেই। এখানে কেবল 1x1 কনভ্যুশনাল কার্নেল এবং সম্পূর্ণ সংযোগ টেবিলের সাথে কনভলিউশন স্তর রয়েছে। এটি খুব কমই বোঝা যায় যে কনভনেটসের কোনও নির্দিষ্ট-আকারের ইনপুট লাগবে না। আপনি তাদের ইনপুটগুলিতে প্রশিক্ষণ দিতে পারেন যা কোনও …

3
আরএনএন বনাম সিএনএন একটি উচ্চ স্তরে
আমি পুনরাবৃত্তাকার নিউরাল নেটওয়ার্কগুলি (আরএনএন) এবং তাদের জাত এবং কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলি (সিএনএন) এবং তাদের জাতগুলি নিয়ে ভাবছিলাম। এই দুটি পয়েন্টটি কি ন্যায়সঙ্গত হবে: কোনও উপাদান (যেমন কোনও চিত্র) উপ-উপাদানগুলিতে (যেমন কোনও চিত্রের কোনও বস্তু যেমন চিত্রের মধ্যে থাকা সামগ্রীর রূপরেখা ইত্যাদি) ভাঙতে সিএনএন ব্যবহার করুন উপ-উপাদানগুলির সংমিশ্রণ তৈরি করতে …

8
ইন্টারনেট সংস্থাগুলি কেন ডেটা বিজ্ঞানী কাজের জন্য জাভা / পাইথন পছন্দ করে?
আমি পাইথন / জাভা অভিজ্ঞতা জিজ্ঞাসা করে ডেটা বিজ্ঞানীর জন্য কাজের বিবরণে অনেক বার দেখছি এবং আর অবজ্ঞা না করে নীচে লিংকডিনের মাধ্যমে আবেদন করা একটি সংস্থার চিফ ডেটা সায়েন্টিস্টের কাছ থেকে প্রাপ্ত একটি ব্যক্তিগত ইমেল আমার নীচে রয়েছে। এক্স, সংযোগ স্থাপন এবং আগ্রহ প্রকাশ করার জন্য ধন্যবাদ। আপনার কাছে …

2
ইউনিফর্ম আরম্ভের মাধ্যমে কখন (তিনি বা গ্লোরোট) সাধারণ সূচনা ব্যবহার করবেন? এবং ব্যাচ সাধারণকরণের সাথে এর প্রভাবগুলি কী কী?
আমি জানতাম যে রেসিডুয়াল নেটওয়ার্ক (রেসনেট) তাকে স্বাভাবিক প্রাথমিককরণ জনপ্রিয় করেছে। রেসনেটে, তিনি সাধারণ সূচনা ব্যবহৃত হয় , যখন প্রথম স্তরটি তিনি অভিন্ন সূচনা ব্যবহার করে। আমি রেসনেট পেপার এবং "ডেলিভিং ডিপ ইন রেকটিফায়ার্স" পেপার (তিনি ইনিশিয়ালাইজেশন পেপার) দিয়ে দেখেছি, তবে সাধারণ থিমের তুলনায় ইউনিফর্ম ডিআইআই-তে কোনও উল্লেখ পাইনি। এছাড়াও: …

8
ক্লাস্টারিং জিও লোকেশন স্থানাঙ্ক (ল্যাট, দীর্ঘ জোড়া)
জিওলোকেশন ক্লাস্টারিংয়ের জন্য সঠিক পন্থা এবং ক্লাস্টারিং অ্যালগরিদম কী? জিওলোকেশন স্থানাঙ্কগুলি ক্লাস্টার করতে আমি নিম্নলিখিত কোডটি ব্যবহার করছি: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y = kmeans2(whiten(coordinates), 3, iter = 20) plt.scatter(coordinates[:,0], …

9
পাইথন ব্যবহার করে পুনরুত্পাদনযোগ্য ডেটা বিজ্ঞানের জন্য সরঞ্জাম এবং প্রোটোকল
আমি পাইথন ব্যবহার করে একটি তথ্য বিজ্ঞান প্রকল্পে কাজ করছি। প্রকল্পের বিভিন্ন ধাপ রয়েছে। প্রতিটি পর্যায়ে পাইথন স্ক্রিপ্ট, সহায়ক ডেটা, কনফিগারেশন এবং প্যারামিটার ব্যবহার করে এবং অন্য একটি ডেটা সেট তৈরি করে একটি ডেটা সেট নেওয়া থাকে। আমি কোডটি গিটে সংরক্ষণ করি, যাতে সেই অংশটি coveredাকা থাকে। আমি শুনতে চাই: …

3
কীভাবে গভীর স্নায়ুর জালে আন্ডারফিটিংয়ের লড়াই করা যায়
যখন আমি কৃত্রিম নিউরাল নেটওয়ার্কগুলি (এনএন) দিয়ে শুরু করেছি তখন আমি ভেবেছিলাম যে আমাকে মূল সমস্যা হিসাবে ওভারফিটিংয়ের সাথে লড়াই করতে হবে। তবে অনুশীলনে আমি আমার এনএনকে 20% ত্রুটি হারের বাধা পেরিয়ে আনতে পারি না। আমি এলোমেলো বনেও আমার স্কোরকে হারাতে পারি না! আমি কোনও এনএনএনকে ডেটাতে ট্রেন্ড ক্যাপচার শুরু …

4
লেটেন্ট ডিরিচলেট বরাদ্দ বনাম হায়ারারিকাল ডিরিচলেট প্রক্রিয়া
লেটেন্ট ডিরিচলেট অলোকেশন (এলডিএ) এবং হায়ারার্কিকাল ডিরিচলেট প্রক্রিয়া (এইচডিপি) উভয়ই বিষয় মডেলিং প্রক্রিয়া। প্রধান পার্থক্যটি হল এলডিএর বিষয়গুলির সংখ্যার স্পেসিফিকেশন প্রয়োজন, এবং এইচডিপি হ'ল না। কেন যে এত? এবং উভয় বিষয় মডেলিং পদ্ধতিতে পার্থক্য, উপকার এবং কনস কী?
49 nlp  topic-model  lda 

8
ওভারফিটিং কেন মেশিন লার্নিংয়ে খারাপ?
যুক্তি প্রায়শই বলে যে কোনও মডেলকে বাছাইয়ের মাধ্যমে, এর সাধারণকরণের ক্ষমতা সীমিত হয়, যদিও এর অর্থ কেবলমাত্র কোনও নির্দিষ্ট জটিলতার পরে ওভারফিটিং কোনও মডেলকে উন্নতি করতে থামিয়ে দেয়। ওভারফিটিংয়ের ফলে কি ডেটাগুলির জটিলতা নির্বিশেষে মডেলগুলি আরও খারাপ হয়ে যায় এবং যদি তাই হয় তবে কেন এটি ঘটছে? সম্পর্কিত: উপরের প্রশ্নের …

4
নিউরাল নেটওয়ার্ক: কোন ব্যয়টি ব্যবহার করতে হবে?
আমি টেনসরফ্লো প্রধানত নিউরাল নেটওয়ার্কগুলির সাথে পরীক্ষার জন্য ব্যবহার করছি am যদিও আমি এখন বেশ কয়েকটি পরীক্ষা-নিরীক্ষা করেছি (এক্সওর-প্রবলেম, এমএনআইএসটি, কিছু রিগ্রেশন স্টাফ, ...), তবে আমি নির্দিষ্ট সমস্যার জন্য "সঠিক" ব্যয় ফাংশনটি বেছে নেওয়ার সাথে লড়াই করছি কারণ সামগ্রিকভাবে আমি একজন প্রাথমিক হিসাবে বিবেচিত হতে পারি। TensorFlow আমি আসার আগে …

9
এমন কোনও ডোমেইন আছে যেখানে বায়েশিয়ান নেটওয়ার্কগুলি নিউরাল নেটওয়ার্কগুলিকে ছাড়িয়ে যায়?
নিউরাল নেটওয়ার্কগুলি কম্পিউটার ভিশন টাস্কগুলিতে শীর্ষ ফলাফল পেয়েছে ( এমএনআইএসটি , আইএলএসভিআরসি , কাগল গ্যালাক্সি চ্যালেঞ্জ দেখুন )। তারা কম্পিউটার ভিশনে অন্য সমস্ত পদ্ধতির চেয়ে বেশি কার্যকর বলে মনে হচ্ছে। তবে অন্যান্য কাজগুলিও রয়েছে: Kaggle আণবিক কার্যকলাপ চ্যালেঞ্জ পেনশন : কাগল বৃষ্টির পূর্বাভাস , দ্বিতীয় স্থানও উপলব্ধি এবং উত্তোলন 2nd …

9
বি ভাষা জন্য উপযুক্ত ভাষা
আর এর অনেকগুলি লাইব্রেরি রয়েছে যা ডেটা অ্যানালাইসিসকে লক্ষ্য করে (যেমন জেএজিএস, বুগস, আর্টস ইত্যাদি ..), এবং জনপ্রিয় পাঠ্যপুস্তকগুলিতে যেমন উল্লেখ করা হয়েছে: জে.ক্রাশে, ব্যয়েসিয়ান ডেটা বিশ্লেষণ করা; বি। ল্যান্টজ, "মেশিন লার্নিং উইথ আর"। বিগ ডেটা হিসাবে বিবেচনা করার জন্য একটি ডেটাসেটের জন্য আমি 5 টিবির গাইডলাইন দেখেছি। আমার প্রশ্নটি …
48 bigdata  r 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.