তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

2
ব্যাচের আকারকে 2 পাওয়ার রাখার সুবিধা কী?
মেশিন লার্নিংয়ের মডেলগুলি প্রশিক্ষণ দেওয়ার সময়, মাঝে মাঝে ব্যাচের আকার 2 এর শক্তিতে রাখাই কেন সুবিধাজনক? আমি ভেবেছিলাম যে আপনার জিপিইউ মেমরি / র‌্যামের মধ্যে সবচেয়ে বড় ফিট এমন একটি আকার ব্যবহার করা ভাল। এই উত্তরে দাবি করা হয়েছে যে কিছু প্যাকেজের জন্য ব্যাচের আকার হিসাবে 2 এর শক্তি আরও …

1
প্রশিক্ষণের সময় ক্যালাস পার্থক্য বিট বিট এবং ক্ষতি মধ্যে ween
কেরাসে প্রশিক্ষণের মধ্যে val_lossএবং এর মধ্যে পার্থক্য কী loss? যেমন Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 কিছু সাইটগুলিতে আমি পড়েছি যে বৈধতার উপর, ড্রপআউট কাজ করছে না।

3
প্রাসঙ্গিকতার জন্য ক্লিক ফ্রিকোয়েন্সি অ্যাকাউন্ট?
র‌্যাঙ্ক তৈরি করার সময়, কোনও অনুসন্ধান ইঞ্জিন বা একটি প্রস্তাবিত সিস্টেমের জন্য বলুন, কোনও এন্ট্রির প্রাসঙ্গিকতা নির্ধারণ করতে ক্লিক ফ্রিকোয়েন্সি নির্ভর করা কি বৈধ?

1
অন্যান্য অ্যাক্টিভেশন ফাংশনগুলির তুলনায় রিলু কেন ভাল
এখানে উত্তরটি বিলুপ্ত হওয়া এবং বিস্ফোরিত গ্রেডিয়েন্টকে বোঝায় যেগুলি অ- sigmoidসক্রিয় ক্রিয়াকলাপে ছিল তবে আমার ধারণা, Reluএর একটি অসুবিধা রয়েছে এবং এটি তার প্রত্যাশিত মান। আউটপুটটির জন্য কোনও সীমাবদ্ধতা নেই Reluএবং সুতরাং এর প্রত্যাশিত মানটি শূন্য নয়। আমি সময় মনে রাখবেন সামনে জনপ্রিয়তা Reluযে tanhসবচেয়ে জনপ্রিয় ছিল মধ্যে মেশিন বিশেষজ্ঞদের …

3
স্বরলিপি এমএপি @ [5: .95] এর অর্থ কী?
সনাক্তকরণের জন্য, কোনও বস্তুর প্রস্তাব সঠিক ছিল কিনা তা নির্ধারণ করার একটি সাধারণ উপায় হ'ল ইন্টারসেকশন ওভার ইউনিয়ন (আইওইউ, আইইউ)। এই সেট লাগে প্রস্তাবিত বস্তুর পিক্সেল এবং সত্য বস্তু পিক্সেল সেট বি এবং হিসাব করে:একজনএকজনAবিবিB আমিও ইউ( ক , খ ) = এ ∩ বিএ ∪ বিআমিণইউ(একজন,বি)=একজন∩বিএকজন∪বিIoU(A, B) = \frac{A …

2
ডক 2ভেক - অনুচ্ছেদগুলি কীভাবে লেবেল করবেন (জেনসিম)
আমি ভাবছি কীভাবে জেনসিম-এ ডকুমেন্টের সাথে বাক্য / অনুচ্ছেদ / দস্তাবেজগুলি লেবেল করতে হবে - ব্যবহারিক দৃষ্টিকোণ থেকে। আপনার কি প্রতিটি বাক্য / অনুচ্ছেদ / ডকুমেন্টের নিজস্ব অনন্য লেবেল (যেমন "প্রেরণ করা হয়েছে 23") থাকা দরকার? আপনি যদি "সেন্টেন্ট_২৩" লেবেলযুক্ত একটি নির্দিষ্ট বাক্যটির সাথে কী শব্দ বা বাক্যগুলির সাদৃশ্যপূর্ণ তা …

3
ডিপ নিউরাল নেটওয়ার্কগুলিতে ব্যাগিং বনাম ড্রপআউট
ব্যাগিং একাধিক পূর্বাভাসকারীদের প্রজন্ম যা একক পূর্বাভাসকারী হিসাবে অভ্যাসযোগ্য। ড্রপআউট হ'ল এমন একটি কৌশল যা স্নায়ুবিক নেটওয়ার্কগুলিকে সমস্ত সম্ভাব্য সাবনেটওয়ার্কের গড় গড় শেখায়। সর্বাধিক গুরুত্বপূর্ণ কাগল এর প্রতিযোগিতা দেখে মনে হচ্ছে যে এই দুটি কৌশলগুলি প্রায়শই একসাথে ব্যবহৃত হয়। প্রকৃত বাস্তবায়ন ছাড়া আমি কোনও তাত্ত্বিক পার্থক্য দেখতে পাচ্ছি না। আমাদের …

4
কে-অর্থ: প্রাথমিক সেন্ট্রয়েডগুলির একটি দক্ষ সেট চয়ন করার কয়েকটি ভাল উপায় কী?
যখন সেন্ট্রয়েডের এলোমেলো সূচনা ব্যবহৃত হয়, তখন কে-অর্থের বিভিন্ন রান বিভিন্ন মোট এসএসই তৈরি করে। এবং এটি অ্যালগরিদমের পারফরম্যান্সে গুরুত্বপূর্ণ। এই সমস্যাটি সমাধানের দিকে কার্যকর কিছু উপায় কী? সাম্প্রতিক পদ্ধতির প্রশংসা করা হয়।

1
পাঠ্য ক্লাস্টারিংয়ের জন্য অ্যালগরিদম
আমি তাদের অর্থ দ্বারা গ্রুপে বিরাট পরিমাণে ক্লাস্টার করার একটি সমস্যা আছে। এটি আপনার সমস্যার মতো যখন আপনার প্রচুর বাক্য থাকে এবং তার অর্থ অনুসারে সেগুলি ভাগ করে নিতে চান। কোন অ্যালগরিদম এটি করার পরামর্শ দেওয়া হয়? আমি আগাম ক্লাস্টারের সংখ্যা জানি না (এবং আরও ডেটা আসার সাথে সাথে ক্লাস্টারগুলিও …

4
নিউরাল নেটওয়ার্কে অতিরিক্ত আউটপুট স্তর (দশমিক থেকে বাইনারি)
আমি অনলাইন বইয়ের একটি প্রশ্নের মাধ্যমে কাজ করছি: http://neuralnetworksanddeeplearning.com/chap1.html আমি বুঝতে পারি যে অতিরিক্ত আউটপুট স্তরটি যদি 5 আউটপুট নিউরনগুলির হয় তবে আমি সম্ভবত পূর্ববর্তী স্তরের জন্য 0.5 এবং প্রতি 0.5 টি ওজনের পক্ষপাত নির্ধারণ করতে পারি। তবে প্রশ্নটি এখন চার আউটপুট নিউরনের একটি নতুন স্তর জিজ্ঞাসা করবে - এটি …

3
নিকটতম প্রতিবেশীরা খুব উচ্চ মাত্রিক ডেটা অনুসন্ধান করে
আমার কাছে ব্যবহারকারীরা এবং তাদের পছন্দ মতো আইটেমগুলির একটি বিশাল স্পার্স ম্যাট্রিক্স রয়েছে (খুব কম মাত্রার স্পারসিটি সহ 1M ব্যবহারকারী এবং 100K আইটেমের ক্রমে)। আমি যে পদ্ধতিতে আমি এতে কেএনএন অনুসন্ধান করতে পারি তা অন্বেষণ করছি। আমার ডেটাসেটের আকার এবং আমি সম্পাদিত কিছু প্রাথমিক পরীক্ষাগুলি দেওয়া, আমার ধারনা হ'ল যে …

6
আর-এ ড্যাশবোর্ড তৈরি করতে আপনি কী ব্যবহার করেন?
আমার পর্যায়ক্রমিক (দৈনিক, মাসিক) ওয়েব অ্যানালিটিক্স ড্যাশবোর্ড রিপোর্ট তৈরি করা দরকার। এগুলি স্থির হবে এবং মিথস্ক্রিয়ের প্রয়োজন হবে না, সুতরাং লক্ষ্য আউটপুট হিসাবে একটি পিডিএফ ফাইল কল্পনা করুন। প্রতিবেদনে সারণী এবং চার্টগুলি মিশ্রিত করা হবে (প্রধানত স্পার্কলাইন এবং বুলেট গ্রাফগুলি ggplot2 দিয়ে তৈরি করা হয়েছে)। স্টিফেন ফাই / পারস্পেচুয়াল এজ …
17 r  visualization 

2
ডেটা সায়েন্সে কীভাবে নীতিশাস্ত্র প্রয়োগ করা উচিত
তাদের ব্যবহারকারীদের উপর তারা ফেসবুকের পরীক্ষা-নিরীক্ষা করে যা তারা ব্যবহারকারীর আবেগকে পরিবর্তন করতে পারে এবং এখন ঠিকঠাক করে দিতে পারে তা নিয়ে সাম্প্রতিক এক হৈ চৈ পড়েছিল । যদিও আমি পেশাদার তথ্য বিজ্ঞানী নই আমি ক্যাথি ও'নিলের বই 'ডুং ডেটা সায়েন্স' বই থেকে ডেটা সায়েন্সের নীতিশাস্ত্র সম্পর্কে পড়েছি এবং জানতে …

7
দশ লক্ষ শীর্ষে একটি গ্রাফ ভিজ্যুয়ালাইজ করা
1000000 শীর্ষে একটি গ্রাফটি ভিজ্যুয়ালাইজ করতে (শীর্ষে এবং প্রান্তগুলি আঁকুন) ব্যবহার করার জন্য সেরা সরঞ্জামটি কী? গ্রাফটিতে প্রায় 50000 প্রান্ত রয়েছে। এবং আমি পৃথক শীর্ষ এবং প্রান্তগুলির অবস্থান গণনা করতে পারি। আমি একটি এসভিজি উত্পন্ন করার জন্য একটি প্রোগ্রাম লেখার বিষয়ে ভাবছি। অন্য কোন পরামর্শ?

5
অসঙ্গতি সনাক্তকরণের মাধ্যমে বিড়ালদের চাক্ষুষভাবে সনাক্ত করা
আমার একটি শখের প্রকল্প রয়েছে যা আমি মেশিন লার্নিংয়ের আমার এত সীমিত অভিজ্ঞতা বাড়ানোর উপায় হিসাবে প্রতিশ্রুতিবদ্ধ হওয়ার কথা ভাবছি। আমি এই বিষয়ে কোর্সেরা এমওসি নিয়েছি এবং শেষ করেছি। আমার প্রশ্নটি প্রকল্পের সম্ভাব্যতার সাথে সম্পর্কিত। কাজটি নিম্নলিখিত: প্রতিবেশী বিড়ালরা সময়ে সময়ে আমার বাগানে ঘুরতে আসে, যেগুলি তারা আমার লনে মলত্যাগ …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.