তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
জিরো মিন এবং ইউনিট ভেরিয়েন্স
আমি ডেটা স্কেলিং এবং বিশেষত মানক পদ্ধতিটি অধ্যয়ন করছি। আমি এর পিছনে গণিতটি বুঝতে পেরেছি, তবে বৈশিষ্ট্যগুলি শূন্য এবং গড়ের একক বৈকল্পিকতা দেওয়া কেন গুরুত্বপূর্ণ তা আমার কাছে স্পষ্ট নয়। তুমি কি আমাকে ব্যাখ্যা করতে পারবে ?

4
পিসিএ একটি মেশিন লার্নিং অ্যালগরিদম হিসাবে বিবেচনা করা হয়?
আমি বুঝতে পেরেছি যে মূল উপাদান বিশ্লেষণটি একটি মাত্রিক হ্রাস কৌশল ie এটি PCAনিজেই একটি শেখার অ্যালগরিদম হিসাবে বিবেচিত হয় বা এটি ডেটা প্রাক প্রক্রিয়াকরণ পদক্ষেপ।

2
কোনও চিত্র ফটোশপ করা ছিল কিনা তা আমি কীভাবে সনাক্ত করতে পারি?
আমি যদি জেপিজি ফাইলগুলি বিষয়বস্তু পরিবর্তন করতে চাইলে তা পরীক্ষা করতে চাই। আমি ফটোশপেড না বলে কী বিবেচনা করি: ফসল তোলা ঘোরানো হচ্ছে (স্কেলিং) চিত্র রেজোলিউশন স্মার্টফোনগুলি স্বয়ংক্রিয় পরিবর্তন করতে পারে আমি ফটোশপিংকে কী বিবেচনা করি: পুরানো চিত্রের অংশগুলির উপরে একটি নতুন চিত্র যুক্ত করা কোনও চিত্রের অংশের পাঠ্য পরিবর্তন …

2
এল 2 এর উপরে কেন এল 1 নিয়মিতকরণ ব্যবহার করছেন?
ক্ষতির ফাংশন ব্যবহার করে লিনিয়ার রিগ্রেশন মডেল পরিচালনা করা, কেন আমার ব্যবহার করা উচিত এল1L1L_1 পরিবর্তে এল2L2L_2 নিয়মিতকরণ? ওভারফিটিং প্রতিরোধে এটি কি আরও ভাল? এটি কি নির্বিচারক (তাই সর্বদা একটি অনন্য সমাধান)? বৈশিষ্ট্য নির্বাচনের ক্ষেত্রে এটি কি আরও ভাল (কারণ বিরল মডেল উত্পাদন করে)? এটি বৈশিষ্ট্যগুলির মধ্যে ওজন ছড়িয়ে দেয়?

3
জিপিএস স্থানাঙ্ক (অক্ষাংশ এবং দ্রাঘিমাংশ) কোনও লিনিয়ার মডেলের বৈশিষ্ট্য হিসাবে ব্যবহার করা যেতে পারে?
আমার কাছে ডেটা সেট রয়েছে যা অনেকগুলি বৈশিষ্ট্যের মধ্যে, জিপিএস স্থানাঙ্ক (অক্ষাংশ এবং দ্রাঘিমাংশ) থাকে। আমি সমস্যাগুলি অন্বেষণ করতে এই ডেটা সেটগুলি ব্যবহার করতে চাই: (1) শুরু এবং শেষ পয়েন্টগুলির মধ্যে ড্রাইভের জন্য ইটিএ গণনা করা; এবং (২) একটি নির্দিষ্ট পয়েন্টের জন্য অপরাধের পরিমাণ অনুমান করা। আমি লিনিয়ার রিগ্রেশন মডেলটি …

2
শেষ স্তরে কেরাস একাধিক "সফটম্যাক্স" সম্ভব?
কেরাসের শেষ স্তরে একাধিক সফটম্যাক্স প্রয়োগ করা সম্ভব? সুতরাং নোডের যোগফল 1-4 = 1; 5-8 = 1; প্রভৃতি আমার কি আলাদা নেটওয়ার্ক ডিজাইনের জন্য যাওয়া উচিত?

2
শুধুমাত্র 2 টি লুকানো স্তর ব্যবহার করে সংখ্যাগুলি বাছাই করুন
আমি কর্নারস্টোন পেপার সিকোয়েন্স টু সিকোয়েন্স টু সিকোয়েন্স লার্নিং নিউরাল নেটওয়ার্ক উইথ ইলিয়া সুটস্কিভার এবং কোক লে দ্বারা পড়ছি । প্রথম পৃষ্ঠায়, এটি সংক্ষেপে উল্লেখ করেছে যে: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic …

1
নিকটতম প্রতিবেশী কি টি-এসএনই দিয়ে কোনও ধারণা রাখে?
এখানে উত্তরগুলি বলেছে যে টি-এসএনই-র মাত্রাগুলি অর্থহীন এবং পয়েন্টগুলির মধ্যে দূরত্বগুলি মিলের পরিমাপ নয় । তবে, আমরা টি-এসএনই স্থানের নিকটতম প্রতিবেশীদের ভিত্তিতে একটি পয়েন্ট সম্পর্কে কিছু বলতে পারি? যে পয়েন্টগুলি হুবহু একইরূপে ক্লাস্টার করা হয় না তার এই উত্তরটি নির্দেশ করে যে পয়েন্টগুলির মধ্যে দূরত্বের অনুপাতটি নিম্ন এবং উচ্চতর মাত্রিক …
10 tsne 

2
বিপুল সংখ্যক বৈশিষ্ট্য সহ লজিস্টিক রিগ্রেশন কীভাবে করবেন?
লজিস্টিক রিগ্রেশন-এর বাইনারি ক্লাসের সমস্যা সহ প্রতিটি নমুনার জন্য আমার কাছে 330 নমুনা এবং 27 টি বৈশিষ্ট্যযুক্ত একটি ডেটাসেট রয়েছে। "নিয়ম যদি দশ" অনুযায়ী প্রতিটি বৈশিষ্ট্য অন্তর্ভুক্ত করার জন্য আমার কমপক্ষে 10 টি ইভেন্টের প্রয়োজন। যদিও, আমার 20% হে পজিটিভ ক্লাস এবং 80% নেতিবাচক বর্গ সহ একটি ভারসাম্যহীন ডেটাসেট রয়েছে। …

4
যদি ফাংশনটি মসৃণ হয় তবে কেন এটি গ্রেডিয়েন্ট বংশোদ্ভূত হবে?
আমি এখন "হ্যান্ডস-অন মেশিন লার্নিং উইথ সায়কিট-লার্ন অ্যান্ড টেনসরফ্লো" শীর্ষক একটি বই পড়েছি এবং ১১ তম অধ্যায়ে এটির ইএলইউ (এক্সপেনশনাল রিলু) এর ব্যাখ্যা সম্পর্কে নিম্নলিখিত বিবরণ রয়েছে। তৃতীয়, ফাংশনটি প্রায় z = 0 সহ সর্বত্র মসৃণ, যা গ্রেডিয়েন্ট বংশোদ্ভূতিকে গতি বাড়িয়ে তুলতে সহায়তা করে, যেহেতু এটি z = 0 এর …

2
ওয়ার্ড টুভেমে ফিচার ম্যাট্রিক্স কী?
আমি নিউরাল নেটওয়ার্কগুলির একটি শিক্ষানবিশ এবং বর্তমানে আমি ওয়ার্ড টু ওয়েভ মডেলটি অন্বেষণ করছি। তবে বৈশিষ্ট্যটির ম্যাট্রিক্সটি হ'ল কি তা বোঝার জন্য আমার একটি শক্ত সময় কাটাচ্ছে। আমি বুঝতে পারি যে প্রথম ম্যাট্রিক্স একটি প্রদত্ত শব্দের জন্য এক-হট এনকোডিং ভেক্টর, তবে দ্বিতীয় ম্যাট্রিক্সটি কী বোঝায়? আরও সুনির্দিষ্টভাবে বলা যায় যে, …

3
ডেটাফ্রেমে পরপর শূন্যগুলি সন্ধান করুন এবং শর্তসাপেক্ষে প্রতিস্থাপন করুন
আমার এই জাতীয় ডেটাসেট রয়েছে: নমুনা ডেটাফ্রেম import pandas as pd df = pd.DataFrame({ 'names': ['A','B','C','D','E','F','G','H','I','J','K','L'], 'col1': [0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0], 'col2': [0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0]}) আমি কয়েকটি 0এর মধ্যে col1এবং এর col2সাথে প্রতিস্থাপন …

1
একটি ইংরেজী বাক্যটির জটিলতা কীভাবে নির্ধারণ করবেন?
আমি লোককে দ্বিতীয় ভাষা হিসাবে ইংরেজি শিখতে সাহায্য করার জন্য একটি অ্যাপে কাজ করছি। আমি বৈধতা দিয়েছি যে বাক্যগুলি অতিরিক্ত প্রসঙ্গ সরবরাহ করে একটি ভাষা শিখতে সহায়তা করে। আমি 60 ছাত্রের একটি শ্রেণিকক্ষে একটি ছোট গবেষণা পরিচালনা করে তা করেছি। আমি বিভিন্ন ইংরেজি শব্দের জন্য উইকিপিডিয়া থেকে এক লক্ষেরও বেশি …

1
যদি আমি গড় স্কোয়ার ত্রুটির পরিবর্তে নিখুঁত গড় ত্রুটি হ্রাস করি তবে টেনসরফ্লো কেন সাধারণ লিনিয়ার মডেলটিকে ফিট করতে পারে না?
ইন ভূমিকা আমি শুধু বদলে গেছে loss = tf.reduce_mean(tf.square(y - y_data)) প্রতি loss = tf.reduce_mean(tf.abs(y - y_data)) এবং মডেল লোকসান শিখতে অক্ষম সময়ের সাথে আরও বড় হয়ে উঠেছে। কেন?

1
বিভিন্ন অজগর কার্নেলের মধ্যে ডেটা ফ্রেম পুনরায় লোড করা এড়িয়ে চলুন
মেমরিতে কোনও ভেরিয়েবল (বড় টেবিল / ডেটা ফ্রেম) রাখার এবং একাধিক আইপিথন নোটবুক জুড়ে ভাগ করার কোনও উপায় আছে কি? আমি এমন কিছু সন্ধান করব, যা ম্যাটল্যাবের ধ্রুবক ভেরিয়েবলের সাথে ধারণাগতভাবে সমান। সেখানে একাধিক স্বতন্ত্র সম্পাদক (নোটবুক) থেকে একটি কাস্টম ফাংশন / গ্রন্থাগার কল করা সম্ভব এবং বহিরাগত ফাংশনটির কিছু …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.