তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

6
কনভুলেশনাল নিউরাল নেটওয়ার্কগুলি কেন কাজ করে?
আমি প্রায়শই লোকদের বলতে শুনেছি যে কেন কনভুলেশনাল নিউরাল নেটওয়ার্কগুলি এখনও কম বোঝা যায় না। এটি কি জানা যায় যে সমঝোতাজনিত নিউরাল নেটওয়ার্কগুলি সর্বদা স্তরগুলি উপরে উঠে যাওয়ার সাথে সাথে ক্রমবর্ধমান পরিশীলিত বৈশিষ্ট্যগুলি শিখতে থাকে? কী কারণে তাদের এমন বৈশিষ্ট্যগুলির স্তুপ তৈরি হয়েছিল এবং অন্যান্য ধরণের গভীর নিউরাল নেটওয়ার্কগুলির ক্ষেত্রেও …

4
ডেটা সায়েন্স কি ডেটা মাইনিংয়ের মতো?
আমি নিশ্চিত যে এই ফোরামে আলোচিত হবে ডেটা বিজ্ঞানের বেশ কয়েকটি প্রতিশব্দ বা কমপক্ষে সম্পর্কিত ক্ষেত্র রয়েছে যেখানে বড় ডেটা বিশ্লেষণ করা হয়। আমার বিশেষ প্রশ্নটি ডেটা মাইনিংয়ের ক্ষেত্রে। আমি কয়েক বছর আগে ডেটা মাইনিংয়ে স্নাতক শ্রেণি নিয়েছি। ডেটা সায়েন্স এবং ডেটা মাইনিংয়ের মধ্যে পার্থক্যগুলি কী কী এবং বিশেষত ডেটা …

6
গভীর শেখার বুনিয়াদি
আমি গভীর গবেষণার মূল বিষয়গুলি বিশদ সম্পর্কিত একটি কাগজ সন্ধান করছি। গভীরভাবে শেখার জন্য আদর্শভাবে অ্যান্ড্রু এনজি কোর্সের মতো। আপনি কি জানেন আমি এটি কোথায় পাব?

3
আপনি কীভাবে কাজের প্রত্যাশা পরিচালনা করবেন?
ডেটা সায়েন্স, মেশিন লার্নিং এবং চারপাশের সমস্ত সাফল্যের গল্পগুলির চারপাশের সমস্ত হুপলা সহ, অনেকগুলি ন্যায়সঙ্গত, পাশাপাশি অতিমাত্রায় বিভক্ত, ডেটা বিজ্ঞানী এবং তাদের ভবিষ্যদ্বাণীপূর্ণ মডেলগুলির কাছ থেকে প্রত্যাশা রয়েছে। পরিসংখ্যানবিদ, মেশিন লার্নিং বিশেষজ্ঞ এবং ডেটা সায়েন্টিস্টদের অনুশীলন করার ক্ষেত্রে আমার প্রশ্নটি - আপনি কীভাবে আপনার সংস্থার ব্যবসায়ীদের কাছ থেকে প্রত্যাশাগুলি পরিচালনা …

2
Seriesতু বা অন্যান্য নিদর্শনগুলিতে পরিবর্তিত সময় সিরিজের সাথে কীভাবে ডিল করবেন?
পটভূমি আমি শক্তি মিটার রিডিংয়ের একটি টাইম সিরিজের ডেটা সেট নিয়ে কাজ করছি। সিরিজের দৈর্ঘ্য মিটার অনুসারে পরিবর্তিত হয় - কারও কারও কাছে আমার বেশ কয়েক বছর থাকে, অন্যরা কেবল কয়েক মাস থাকে Many অনেকগুলি উল্লেখযোগ্য seasonতু প্রদর্শন করে এবং প্রায়শই একাধিক স্তর - দিন, সপ্তাহ বা বছরের মধ্যে। আমি …


2
প্যাসাল ভোক চ্যালেঞ্জের জন্য সনাক্তকরণ কার্যের জন্য এমএপি কীভাবে গণনা করা যায়?
পাস্কাল ভিওসি লিডারবোর্ডগুলির সনাক্তকরণ কার্যের জন্য এমএপি (গড় গড় যথার্থতা) গণনা কিভাবে করবেন? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 সেখানে বলা হয়েছে - পৃষ্ঠা 11 এ : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf গড় যথার্থতা (এপি) VOC2007 চ্যালেঞ্জের জন্য, আন্তঃবিবাহিত গড় যথার্থতা (সালটন এবং ম্যাকগিল 1986) উভয় শ্রেণিবিন্যাস এবং সনাক্তকরণের মূল্যায়ন করতে ব্যবহৃত হয়েছিল। প্রদত্ত টাস্ক এবং ক্লাসের জন্য, নির্ভুলতা …

4
কেরাস মডেলের সঠিকতা, এফ 1, নির্ভুলতা এবং পুনর্বিবেচনা কীভাবে পাবেন?
আমি আমার বাইনারি কেরাসক্ল্যাসিফায়ার মডেলের জন্য নির্ভুলতা, পুনরায় কল এবং এফ 1-স্কোর গণনা করতে চাই, তবে কোনও সমাধান খুঁজে পাই না। আমার আসল কোডটি এখানে: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, …

2
পান্ডায় দুটি কলাম দ্বারা শ্রেণিবদ্ধ মানগুলিকে কীভাবে যুক্ত করতে হয়
আমার কাছে এর মতো একটি পান্ডাস ডেটা ফ্রেম রয়েছে: df = pd.DataFrame({ 'Date': ['2017-1-1', '2017-1-1', '2017-1-2', '2017-1-2', '2017-1-3'], 'Groups': ['one', 'one', 'one', 'two', 'two'], 'data': range(1, 6)}) Date Groups data 0 2017-1-1 one 1 1 2017-1-1 one 2 2 2017-1-2 one 3 3 2017-1-2 two 4 4 2017-1-3 two 5 …

3
পাইস্পার্কে একাধিক ডেটা ফ্রেম সারি অনুসারে মার্জ করা
আমি 10 তথ্য ফ্রেম আছে pyspark.sql.dataframe.DataFrame, থেকে প্রাপ্ত randomSplitযেমন (td1, td2, td3, td4, td5, td6, td7, td8, td9, td10) = td.randomSplit([.1, .1, .1, .1, .1, .1, .1, .1, .1, .1], seed = 100)এখন আমি 9 যোগ দিতে চান td'একটি একক তথ্য ফ্রেম গুলি, আমি কিভাবে কি করা উচিত? আমি ইতিমধ্যে …

3
চক্রীয় অর্ডিনাল বৈশিষ্ট্যগুলিকে রূপান্তর করার একটি ভাল উপায় কী?
আমার বৈশিষ্ট্য হিসাবে আমি 'ঘন্টা' ক্ষেত্রটি করছি, তবে এটি একটি চক্রীয় মান নেয়। '23' এবং '0' ঘন্টা এর মতো তথ্য সংরক্ষণের জন্য আমি কীভাবে বৈশিষ্ট্যটির রূপান্তর করতে পারি close একটি উপায় যা আমি ভাবতে পারি তা হ'ল রূপান্তর করা: min(h, 23-h) Input: [0 1 2 3 4 5 6 7 …

3
আমি কীভাবে জেনসিমের সাথে ফাস্টটেক্সট প্রিটেইনড মডেলটি লোড করব?
আমি এখান থেকে fastText pretrained মডেল লোড করার চেষ্টা Fasttext মডেল । আমি wiki.simple.en ব্যবহার করছি from gensim.models.keyedvectors import KeyedVectors word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) কিন্তু, এটি নিম্নলিখিত ত্রুটিগুলি দেখায় Traceback (most recent call last): File "nltk_check.py", line 28, in <module> word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) File "P:\major_project\venv\lib\sitepackages\gensim\models\keyedvectors.py",line 206, in load_word2vec_format header …
21 nlp  gensim 

1
মিনি-ব্যাচের আকার চয়ন করার জন্য কি কোনও নিয়ম আছে?
নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণ দেওয়ার সময়, একটি হাইপারপ্যারামিটার হ'ল একটি মিনিব্যাচের আকার। সাধারণ পছন্দগুলি প্রতি মিনি ব্যাচটিতে 32, 64 এবং 128 টি উপাদান। মিনি-ব্যাচ কত বড় হতে হবে এমন কোনও নিয়ম / নির্দেশিকা রয়েছে? কোন প্রকাশনা যা প্রশিক্ষণের উপর প্রভাবটি তদন্ত করে?

3
একাধিক আউটপুট রিগ্রেশন জন্য নিউরাল নেটওয়ার্ক
আমার কাছে 34 টি ইনপুট কলাম এবং 8 আউটপুট কলামযুক্ত একটি ডেটাসেট রয়েছে। সমস্যাটি সমাধান করার একটি উপায় হ'ল 34 আউটপুট নেওয়া এবং প্রতিটি আউটপুট কলামের জন্য স্বতন্ত্র রিগ্রেশন মডেল তৈরি করা। আমি ভাবছি বিশেষত নিউরাল নেটওয়ার্ক ব্যবহার করে কেবলমাত্র একটি মডেল ব্যবহার করে এই সমস্যাটি সমাধান করা যেতে পারে। …

5
সিদ্ধান্ত গাছ অ্যালগোরিদম লিনিয়ার বা ননলাইনার হয়
সম্প্রতি আমার এক বন্ধুকে জিজ্ঞাসা করা হয়েছিল যে কোনও সিদ্ধান্তের ট্রি অ্যালগোরিদমগুলি একটি সাক্ষাত্কারে লিনিয়ার না ননলাইনার অ্যালগোরিদম কিনা। আমি এই প্রশ্নের উত্তর খোঁজার চেষ্টা করেছি কিন্তু সন্তোষজনক ব্যাখ্যা খুঁজে পেলাম না। এই প্রশ্নের সমাধান এবং উত্তর কি কেউ দিতে পারবেন? এছাড়াও, ননলাইনার মেশিন লার্নিং অ্যালগরিদমের আরও কয়েকটি উদাহরণ কী?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.