তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
শব্দ ভিত্তিক এবং চর-ভিত্তিক পাঠ্য উত্পন্ন আরএনএনগুলির মধ্যে পার্থক্য কী?
পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলির সাথে পাঠ্য প্রজন্ম সম্পর্কে পড়ার সময় আমি লক্ষ্য করেছি যে কিছু উদাহরণ শব্দ এবং অন্যের অক্ষরে অক্ষর অনুসারে পাঠ্য শব্দ উত্পন্ন করার জন্য বাস্তবে কেন তা উল্লেখ না করে প্রয়োগ করা হয়েছিল । সুতরাং, RNN মডেলের যে পাঠ্য ভবিষ্যদ্বাণী করা এর মধ্যে পার্থক্য কি প্রতি শব্দ ভিত্তি …

3
সীমাবদ্ধ বল্টজম্যান মেশিন (আরবিএম) এর পিছনে অন্তর্দৃষ্টি
আমি জিওফ হিন্টনের নিউরাল নেটওয়ার্ক কোর্সায়ার কোর্সে গিয়েছিলাম এবং সীমাবদ্ধ বল্টজম্যান মেশিনগুলির সাথে পরিচয় করিয়ে দিয়েছিলাম , তখনও আমি আরবিএমগুলির পিছনে অন্তর্দৃষ্টি বুঝতে পারি নি। আমাদের কেন এই যন্ত্রটিতে শক্তি গণনা করা দরকার? এবং এই মেশিনে সম্ভাবনার ব্যবহার কী? আমি এই দেখে ভিডিও । ভিডিওতে, তিনি কেবল গণনার পদক্ষেপের আগে …

4
আর: জিপিইউতে মেশিন লার্নিং
আর-এর জন্য এমন কোন মেশিন লার্নিং প্যাকেজ রয়েছে যা প্রশিক্ষণের গতি উন্নত করতে জিপিইউ ব্যবহার করতে পারে (পাইথনের পৃথিবী থেকে থিয়ানো এর মতো কিছু)? আমি দেখতে পেলাম যে গুটপুলস নামে একটি প্যাকেজ রয়েছে যা জিপিইউতে কোড প্রয়োগের অনুমতি দেয় তবে আমি মেশিন লার্নিংয়ের জন্য আরও একটি সম্পূর্ণ লাইব্রেরি খুঁজছি।

5
লুকানো মার্কভ মডেলগুলি বাস্তবায়নের জন্য পাইথন গ্রন্থাগার
লুকানো মার্কভ মডেলগুলি প্রয়োগ করতে আমি কী স্থিতিশীল পাইথন লাইব্রেরি ব্যবহার করতে পারি? আমার এটি যুক্তিসঙ্গতভাবে নথিভুক্ত করা দরকার, কারণ আমি এই মডেলটি আগে কখনও ব্যবহার করি নি। বিকল্পভাবে, এইচএমএম ব্যবহার করে কোনও ডেটা-সেট নিয়ে টাইম-সিরিজ বিশ্লেষণ করার জন্য আরও সরাসরি দৃষ্টিভঙ্গি থাকতে পারে?

4
স্কালা ব্যবহার করে ডেটা বিজ্ঞানের সরঞ্জাম Tools
আমি জানি স্পার্ক সম্পূর্ণরূপে স্কালার সাথে একীভূত। এটি ব্যবহারের ক্ষেত্রে বিশেষত বড় ডেটা সেটগুলির জন্য। অন্য কোন সরঞ্জামগুলির মধ্যে ভাল স্কালার সমর্থন রয়েছে? বৃহত্তর ডেটা সেটের জন্য স্কেলা কি সবচেয়ে উপযুক্ত? বা এটি ছোট ডেটা সেটগুলির জন্যও উপযুক্ত?

4
গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি কীভাবে নির্দিষ্ট করবেন?
অনেক তথ্য উত্স সমন্বিত আলগাভাবে কাঠামোগত ডেটার একটি সেট (যেমন ওয়েব টেবিল / লিঙ্কযুক্ত ওপেন ডেটা) ধরে নিন। ডেটা অনুসরণ করার পরে কোনও সাধারণ স্কিমা নেই এবং প্রতিটি উত্স মানগুলি বর্ণনা করার জন্য প্রতিশব্দ বৈশিষ্ট্য ব্যবহার করতে পারে (যেমন "জাতীয়তা" বনাম "জন্মানো")। আমার লক্ষ্য হ'ল এমন কিছু "গুরুত্বপূর্ণ" গুণাবলীর সন্ধান …

2
হাদোপ এবং নোএসকিউএল এর মধ্যে পার্থক্য কী
লোকদের তাদের ডেটা প্রক্রিয়া করতে সহায়তা করার জন্য অনেক সরঞ্জাম / ফ্রেমওয়ার্ক সম্পর্কে শুনেছি (বড় ডেটা পরিবেশ)। একটির নাম হাদোপ এবং অন্যটি নো এসকিউএল ধারণা। প্রসেসিং পয়েন্টে পার্থক্য কী? তারা পরিপূরক না?

2
উইন্ডো স্লাইডিং এলএসটিএম-এ ওভারফিটিংয়ের দিকে পরিচালিত করে?
আমি যদি আমার এলএসটিএমকে স্লাইডিং-উইন্ডো পদ্ধতির মাধ্যমে প্রশিক্ষণ দিই তবে কি আমি তার চেয়ে বেশি উপকার করব? লোকেরা কেন এটি এলএসটিএম এর জন্য ব্যবহার করে না বলে মনে হচ্ছে? সরলীকৃত উদাহরণের জন্য, ধরে নিন যে আমাদের অক্ষরের ক্রমটি পূর্বাভাস করতে হবে: A B C D E F G H I …

3
কেন আমরা স্কিউড ডেটাগুলিকে একটি সাধারণ বিতরণে রূপান্তর করি
আমি কাগল ( হাউস মূল্য সম্পর্কিত হিউম্যান অ্যানালগের কার্নেল: অ্যাডভান্স রিগ্রেশন টেকনিকস ) এর আবাসন মূল্য প্রতিযোগিতার একটি সমাধানের মধ্য দিয়ে যাচ্ছিলাম এবং এই অংশটি পেরিয়ে এসেছি: # Transform the skewed numeric features by taking log(feature + 1). # This will make the features more normal. from scipy.stats import skew …

4
দুটি শব্দের মধ্যে মিল
আমি একটি পাইথন গ্রন্থাগার সন্ধান করছি যা আমাকে দুটি শব্দ বা বাক্যের মধ্যে মিল খুঁজে পেতে সহায়তা করে। আমি অডিওতে পাঠ্য রূপান্তর করব যা এর ফলে কোনও ইংরেজি অভিধান বা নন অভিধানের শব্দ (গুলি) হবে (এটি কোনও ব্যক্তি বা সংস্থার নাম হতে পারে) এর পরে, আমার এটি একটি পরিচিত শব্দ …
15 nlp  nltk 

2
অ্যাক্টিভেশন ফাংশনগুলিকে একঘেয়ে হতে হবে কেন?
আমি বর্তমানে নিউরাল নেটওয়ার্কগুলিতে একটি পরীক্ষার জন্য প্রস্তুতি নিচ্ছি। প্রাক্তন পরীক্ষাগুলির বেশ কয়েকটি প্রোটোকলে আমি পড়েছি যে নিউরনের অ্যাক্টিভেশন ফাংশনগুলি (মাল্টিলেয়ার পারসেপ্ট্রনে) একঘেয়ে হতে হবে be আমি বুঝতে পারি যে অ্যাক্টিভেশন ফাংশনগুলি পৃথকযোগ্য হওয়া উচিত, একটি ডেরাইভেটিভ থাকতে হবে যা বেশিরভাগ পয়েন্টে 0 নয়, এবং অ-রৈখিক হওয়া উচিত। একঘেয়ে হয়ে …

5
অবদান রাখতে ওপেন সোর্স ডেটা বিজ্ঞান প্রকল্পগুলি
ওপেন সোর্স প্রকল্পগুলিতে অবদান সাধারণত নবাবিদের কিছুটা অনুশীলন করার একটি ভাল উপায় এবং অভিজ্ঞ ডেটা বিজ্ঞানী এবং বিশ্লেষকদের জন্য একটি নতুন ক্ষেত্র চেষ্টা করে। আপনি কোন প্রকল্পে অবদান রাখবেন? দয়া করে গিথুব-এ কিছু পরিচিতি + লিঙ্ক সরবরাহ করুন।

1
প্রদত্ত পাঠ্যের একটি নির্দিষ্ট অক্ষরের পরে স্ট্রিংগুলি সরিয়ে ফেলা হচ্ছে
আমার নীচের মত একটি ডেটাসেট আছে। আমি অক্ষর after এর পরে সমস্ত অক্ষর মুছে ফেলতে চাই © আমি আর এ কীভাবে করব? data_clean_phrase <- c("Copyright © The Society of Geomagnetism and Earth", "© 2013 Chinese National Committee ") data_clean_df <- as.data.frame(data_clean_phrase)
15 r  data-cleaning 

2
আইটেম ভিত্তিক এবং মাহাউটে ব্যবহারকারী ভিত্তিক সুপারিশের পার্থক্য
আমি জানতে চাই যে ঠিক কীভাবে ব্যবহারকারী ভিত্তিক এবং আইটেম ভিত্তিক সুপারিশ একে অপরের থেকে পৃথক। এটি এটি সংজ্ঞায়িত করে ব্যবহারকারী ভিত্তিক : অনুরূপ ব্যবহারকারীদের সন্ধান করে আইটেমগুলির প্রস্তাব দিন। এটি ব্যবহারকারীদের গতিশীল প্রকৃতির কারণে স্কেল করা প্রায়শই শক্ত। আইটেম-ভিত্তিক : আইটেমগুলির মধ্যে সাদৃশ্য গণনা করুন এবং সুপারিশ করুন। আইটেমগুলি …

2
কে-মানে বনাম অনলাইন কে-মানে
কে-মানে ক্লাস্টারিংয়ের জন্য একটি সুপরিচিত অ্যালগরিদম, তবে এই জাতীয় অ্যালগরিদমের একটি অনলাইন প্রকরণ (অনলাইন কে-মানে )ও রয়েছে। এই পদ্ধতির উপকারিতা এবং কনসগুলি কী কী এবং যখন প্রত্যেকটির পছন্দ করা উচিত?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.