তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

2
সমবায় শক্তিবৃদ্ধি শিক্ষা
উপার্জন সর্বাধিকীকরণের লক্ষ্য নিয়ে গতিশীল মূল্যের সমস্যায় কাজ করা একক এজেন্টের জন্য ইতিমধ্যে আমার কার্যকারী বাস্তবায়ন রয়েছে। যাইহোক, আমি যে সমস্যার সাথে কাজ করছি সেগুলির মধ্যে বেশ কয়েকটি বিভিন্ন পণ্য জড়িত যা একে অপরের প্রতিস্থাপন, সুতরাং গতিশীলভাবে এগুলি সমস্তকে স্বাধীন শিক্ষানবিশদের সাথে মূল্য নির্ধারণ করা ভুল বলে মনে হয়, কারণ …

7
তথ্য বিজ্ঞান প্রকল্পের ধাপে ধাপে কী ব্যাখ্যা করা হয়েছে?
আমি এমন একটি ওয়েবসাইট বা বইয়ের সন্ধান করছি যেখানে কয়েকটি ব্যবহারিক উদাহরণ ধাপে ধাপে দেওয়া হয়, কীভাবে তারা প্রাসঙ্গিক বৈশিষ্ট্যগুলি বেছে নেয়, মডেল নির্বাচন পদ্ধতি ইত্যাদি ব্যাখ্যা করে ...

1
স্পার্ক করুন, একক আরডিডিটিকে দুটিতে বিভক্ত করুন
আমার কাছে একটি বড় ডেটাসেট রয়েছে যা নির্দিষ্ট পরামিতি অনুসারে আমাকে গ্রুপে বিভক্ত করতে হবে। আমি চাই চাকরিটি যথাসম্ভব দক্ষতার সাথে প্রক্রিয়াজাত করা হোক। আমি এটি করার দুটি উপায় কল্পনা করতে পারি বিকল্প 1 - মূল আরডিডি এবং ফিল্টার থেকে মানচিত্র তৈরি করুন def customMapper(record): if passesSomeTest(record): return (1,record) else: …

3
কোনটি দ্রুত: বড় JSON ডেটাসেটে পোস্টগ্রিজ এসকিউএল বনাম মংগোডিবি?
আমার কাছে প্রতি 3। 300 বাইটে 9 মি JSON অবজেক্ট সহ একটি বড় ডেটাসেট রয়েছে। এগুলি লিঙ্ক একগ্রিগেটরের পোস্ট: মূলত লিঙ্কগুলি (একটি ইউআরএল, শিরোনাম এবং লেখক আইডি) এবং মন্তব্যসমূহ (পাঠ্য এবং লেখকের আইডি) + মেটাডেটা। তারা একটি টেবিলে খুব ভাল সম্পর্কযুক্ত রেকর্ড হতে পারে, আইডি সহ শিশুদের রেকর্ডের দিকে ইঙ্গিত …

4
কীভাবে আইএমডিবি ওয়েবপেজ স্ক্র্যাপ করবেন?
ডেটা বিশ্লেষণ শেখার প্রচেষ্টার অংশ হিসাবে আমি নিজেই পাইথন ব্যবহার করে ওয়েব স্ক্র্যাপিং শিখার চেষ্টা করছি। আমি imdb ওয়েবপৃষ্ঠাটি স্ক্র্যাপ করার চেষ্টা করছি যার ইউআরএলটি নিম্নলিখিত: http://www.imdb.com/search/title?sort=num_votes,desc&start=1&title_type=fe चर&year = 1950,2012 আমি বিউটিফুলসুপ মডিউলটি ব্যবহার করছি। নিম্নলিখিতটি আমি ব্যবহার করছি কোডটি: r = requests.get(url) # where url is the above url …

3
অনুরূপ নথির সন্ধানের জন্য ভেক্টর স্পেস মডেল কোসাইন tf-idf f
মিলিয়নেরও বেশি নথির কর্পাস রয়েছে প্রদত্ত নথির জন্য ভেক্টর স্পেস মডেলের মতো কোসাইন ব্যবহার করে অনুরূপ নথির সন্ধান করতে চান ঘ1। D2/ ( | | ডি।)1| | | | ঘ2| | )ঘ1⋅ঘ2/(||ঘ1||||ঘ2||)d_1 \cdot d_2 / ( ||d_1|| ||d_2|| ) এই টিএফ-আইডিএফ-এর মতো দীর্ঘতর নথির প্রতি পক্ষপাতিত্ব রোধ করতে, সমস্ত টিএফকে …

1
তত্ত্বাবধানে শেখার অ্যালগরিদমের একাধিক লেবেল
আমার সাথে সম্পর্কিত বিষয়গুলির সাথে একটি পাঠ্য সংকলন রয়েছে। উদাহরণস্বরূপ "A rapper Tupac was shot in LA"এবং এটি হিসাবে লেবেলযুক্ত ছিল ["celebrity", "murder"]। সুতরাং মূলত প্রতিটি বৈশিষ্ট্যের ভেক্টরের অনেকগুলি লেবেল থাকতে পারে (একই পরিমাণ নয় The প্রথম বৈশিষ্ট্য ভেক্টরটিতে 3 টি লেবেল থাকতে পারে, দ্বিতীয় 1, তৃতীয় 5)। আমি যদি …

3
লগ ফাইল বিশ্লেষণ: মান অংশ থেকে তথ্য অংশ বের করা
আমি আমাদের পণ্যগুলির একটিতে বেশ কয়েকটি লগ ফাইলে একটি ডেটা সেট তৈরি করার চেষ্টা করছি। বিভিন্ন লগ ফাইলগুলির নিজস্ব বিন্যাস এবং নিজস্ব সামগ্রী রয়েছে; আমি তাদের সফলভাবে একসাথে গ্রুপ করেছি, কেবলমাত্র এক ধাপ বাকি ... আসলে, লগ "বার্তা" সেরা তথ্য। আমার কাছে এই সমস্ত বার্তাগুলির বিস্তৃত তালিকা নেই এবং সেগুলির …

2
অনলাইন মেশিন লার্নিংয়ের জন্য গ্রন্থাগারগুলি
স্টক ডেটার পূর্বাভাস দেওয়ার জন্য অনলাইনে শেখার জন্য আমি প্যাকেজগুলি (পাইথন, আর, বা স্ট্যান্ড্যালোন প্যাকেজে) খুঁজছি। আমি ভোপাল ওয়াবিট ( https://github.com/ জোহানল্যাংফোর্ড / ভোপাল_উব্বিট / উইকি ) সম্পর্কে পেয়েছি এবং পড়েছি , যা বেশ আশাব্যঞ্জক বলে মনে হচ্ছে তবে আমি ভাবছি যে সেখানে অন্য কোনও প্যাকেজ আছে কিনা। আগাম ধন্যবাদ.

2
স্কেলেবল আউটলেটর / অ্যানোমালি সনাক্তকরণ
আমি হ্যাডোপ, হাইভ, ইলাস্টিক অনুসন্ধান (অন্যদের মধ্যে) ব্যবহার করে একটি বড় ডেটা অবকাঠামো সেটআপ করার চেষ্টা করছি এবং আমি নির্দিষ্ট ডেটাসেটের উপরে কিছু অ্যালগরিদম চালাতে চাই। আমি চাই যে অ্যালগোরিদমগুলি সেগুলি নিজেরাই মাপযোগ্য। এ্যাপাচি মাহুত লাইব্রেরী একটি ভালো বিকল্প আছে বলে মনে হয়, এবং এটি অতিরিক্ত বৈশিষ্ট্যগুলিও উপস্থিত রয়েছে রিগ্রেশন …

1
আরে গ্রাফের জন্য (লেবেল প্রচারের অ্যালগরিদম / ঘন ঘন সাবগ্রাফ খনির) জন্য গ্রন্থাগারসমূহ
সমস্যার সাধারণ বিবরণ আমার একটি গ্রাফ রয়েছে যেখানে 3 বা 4 সম্ভাব্য মানগুলির সাথে একটি প্রকারের সাথে কয়েকটি শীর্ষে লেবেলযুক্ত রয়েছে। অন্যান্য শিখরের জন্য, প্রকারটি অজানা। আমার লক্ষ্য হ'ল লেবেলযুক্ত শৃঙ্গগুলির জন্য প্রকারটি পূর্বাভাস দেওয়ার জন্য গ্রাফটি ব্যবহার করা। সম্ভাব্য কাঠামো আমার সন্দেহ হয় যে এটি আমার সাহিত্যের পড়ার উপর …

2
গোলমাল স্ট্রিংয়ের তালিকা থেকে ক্যানোনিকাল স্ট্রিংটি বের করুন
আমার কাছে কয়েক হাজার স্ট্রিংয়ের তালিকা রয়েছে এবং প্রতিটি তালিকায় প্রায় 10 টি স্ট্রিং রয়েছে। প্রদত্ত তালিকার বেশিরভাগ স্ট্রিং খুব একই রকম, যদিও কিছু স্ট্রিং (খুব কমই) অন্যের সাথে সম্পূর্ণ অপ্রাসঙ্গিক এবং কিছু স্ট্রিং অপ্রাসঙ্গিক শব্দ ধারণ করে। এগুলিকে একটি আড়ম্বরপূর্ণ স্ট্রিংয়ের শোরগোল বৈচিত্র হিসাবে বিবেচনা করা যেতে পারে। আমি …

2
দাবাতে সাময়িক পার্থক্য কার্যকর করা
আমি একটি দাবা প্রোগ্রাম বিকাশ করছি যা আলফা-বিটা ছাঁটাই অ্যালগরিদম এবং একটি মূল্যায়ন ফাংশন ব্যবহার করে যা নিম্নোক্ত বৈশিষ্ট্যগুলি যেমন পদার্থ, কিংবদন্তি, গতিশীলতা, প্যাঁচা কাঠামো এবং আটকা পড়া টুকরো ইত্যাদির সাহায্যে অবস্থানগুলি মূল্যায়ন করে ..... ..... আমার মূল্যায়ন ফাংশনটি হ'ল থেকে প্রাপ্ত চ( পি ) = ডাব্লু1⋅ উপাদান + ডাব্লু2⋅ …

4
বড় ডেটা সেটগুলি বোঝার জন্য আমার কোন প্রাথমিক পদক্ষেপগুলি ব্যবহার করা উচিত এবং আমার কোন সরঞ্জামগুলি ব্যবহার করা উচিত?
ক্যাভেট: মেশিন লার্নিংয়ের ক্ষেত্রে আমি সম্পূর্ণ শিক্ষানবিস, তবে শিখতে আগ্রহী। আমার একটি বড় ডেটাসেট রয়েছে এবং আমি এটিতে প্যাটার্ন সন্ধান করার চেষ্টা করছি। তথ্য জুড়ে পারস্পরিক সম্পর্ক থাকতে পারে, হয় হয় পরিচিত ভেরিয়েবলগুলির সাথে, বা ডেটাতে থাকা ভেরিয়েবলগুলি যা আমি এখনও বুঝতে পারি নি সেগুলি আসলে ভেরিয়েবল / প্রাসঙ্গিক। আমি …

3
নমুনা আকার এবং মাত্রা সহ বিভিন্ন পরিসংখ্যান কৌশল (রিগ্রেশন, পিসিএ, ইত্যাদি) কীভাবে স্কেল করে?
পরিসংখ্যান কৌশলগুলির একটি সাধারণ সাধারণ টেবিল রয়েছে যা ব্যাখ্যা করে যে তারা কীভাবে নমুনার আকার এবং মাত্রা দিয়ে স্কেল করে? উদাহরণস্বরূপ, আমার এক বন্ধু আমাকে অন্য দিন জানিয়েছিল যে আকারের একটি মাত্রিক ডেটা কেবল তাত্ক্ষণিকভাবে গণনার সময় n * লগ (এন) হিসাবে যায়। সুতরাং, উদাহরণস্বরূপ, যদি আমরা এক্স এর বিপরীতে …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.