তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

1
টাইমস্ট্যাম্প ডেটাটাইপের জন্য ইন্টের একটি পান্ডাস কলাম রূপান্তর করুন
আমার কাছে একটি ডেটাফ্রেম রয়েছে যে অন্যান্য জিনিসের মধ্যে, 1970-1-1-এর পরে পাস করা মিলিসেকেন্ডের সংখ্যার কলাম রয়েছে। আমাকে ইনটসের এই কলামটি টাইমস্ট্যাম্প ডেটাতে রূপান্তর করতে হবে, তাই আমি শেষ পর্যন্ত এটি 1970-1-1-এর জন্য ডেটটাইম মানগুলি সম্পূর্ণরূপে একটি সিরিজে টাইমস্ট্যাম্প কলাম সিরিজ যুক্ত করে ডেটটাইম ডেটা কলামে রূপান্তর করতে পারি। আমি …

5
সাইকিট-লার্ন র্যান্ডম ফরেস্টের সাথে বৈশিষ্ট্যটির গুরুত্বটি খুব উচ্চমানের বিচ্যুতি দেখায়
আমি সাইকিট-লার্ন র্যান্ডম ফরেস্ট ক্লাসিফায়ার ব্যবহার করছি এবং আমি উদাহরণটির মতো বৈশিষ্ট্যটির গুরুত্বকে প্লট করতে চাই । তবে আমার ফলাফলটি সম্পূর্ণ আলাদা, এই অর্থে যে বৈশিষ্ট্যটির গুরুত্ব স্ট্যান্ডার্ড বিচ্যুতি বৈশিষ্ট্যটির গুরুত্বের চেয়ে প্রায় সর্বদা বড় (সংযুক্ত চিত্র দেখুন)। এই জাতীয় আচরণ করা কি সম্ভব, বা এটির পরিকল্পনা করার সময় আমি …

1
অস্পষ্ট টোকেনগুলির ক্রমিকায় একটি ব্যাকরণ সনাক্ত করুন
আমার কাছে পাঠ্য দলিল রয়েছে যা মূলত আইটেমের তালিকা থাকে। প্রতিটি আইটেম বিভিন্ন ধরণের বিভিন্ন টোকেনের একটি গ্রুপ: ফার্স্টনাম, লাস্টনেম, জন্ম তারিখ, ফোন নম্বর, শহর, পেশা, ইত্যাদি etc. একটি টোকেন শব্দের একটি গ্রুপ group আইটেম বিভিন্ন লাইনে থাকা থাকতে পারে। কোনও দস্তাবেজের আইটেমগুলির প্রায় একই টোকেন সিনট্যাক্স রয়েছে তবে অগত্যা …

2
অ-প্রতিসাম্য ব্যয় ফাংশন সহ লিনিয়ার রিগ্রেশন?
Y(x)Y(x)Y(x)Y^(x)Y^(x)\hat Y(x)Y(x)Y(x)Y(x)cost{Y(x)≳Y^(x)}>>cost{Y^(x)≳Y(x)}cost{Y(x)≳Y^(x)}>>cost{Y^(x)≳Y(x)}\text{cost}\left\{ Y(x) \gtrsim \hat Y(x) \right\} >> \text{cost}\left\{ \hat Y(x) \gtrsim Y(x) \right\} আমি মনে করি একটি সাধারণ লিনিয়ার রিগ্রেশন সম্পূর্ণরূপে সূক্ষ্ম করা উচিত। সুতরাং আমি কীভাবে এটি ম্যানুয়ালি বাস্তবায়ন করতে জানি, তবে আমি অনুমান করি যে আমি এই ধরণের সমস্যা সহকারে প্রথম নই। আমি যা করতে চাই সেখানে …

2
কিভাবে একটি ডেটা ফ্রেম কলামের গড় গণনা করতে এবং শীর্ষ 10% সন্ধান করতে
আমি স্কালা এবং স্পার্কে খুব নতুন, এবং বেসবলের পরিসংখ্যান ব্যবহার করে কিছু স্ব-তৈরি মহড়া নিয়ে কাজ করছি। আমি কেস ক্লাসটি একটি আরডিডি তৈরি করে ডেটাতে একটি স্কিমা বরাদ্দ করছি এবং এরপরে এটি একটি ডেটা ফ্রেমে রূপান্তর করছি যাতে আমি নির্দিষ্ট মানদণ্ডের সাথে মেলে এমন স্টাটগুলির মাধ্যমে খেলোয়াড়দের গ্রুপ নির্বাচন করতে …

2
বিভাজন শ্রেণিবদ্ধের একটি সংকলক সমন্বিত শ্রেণিবদ্ধের জন্য আরওসি বক্ররেখার জন্য দক্ষ অ্যালগরিদম
ধরুন আমার কাছে শ্রেণিবদ্ধ সি আছে ... সি_এন যা এই অর্থে অসন্তুষ্ট যে কোনও দুটি একই ইনপুটটিতে সত্য হবে না (উদাহরণস্বরূপ সিদ্ধান্তের গাছের নোড)। আমি একটি নতুন শ্রেণিবদ্ধ তৈরি করতে চাই যা এগুলির কয়েকটি উপসেটের মিশ্রণ (উদাহরণস্বরূপ আমি সিদ্ধান্ত গাছের কোন পাতাকে ইতিবাচক শ্রেণিবিন্যাস দেওয়ার সিদ্ধান্ত নিতে চাই)। অবশ্যই এটি …
13 algorithms 

7
আমি একজন প্রোগ্রামার, আমি কীভাবে ডেটা সায়েন্সের ক্ষেত্রে নামব?
এই শব্দটির প্রথমটি এতই অস্পষ্ট মনে হচ্ছে। যাইহোক..আমি একটি সফটওয়্যার প্রোগ্রামার। আমি যে ভাষাগুলি কোড করতে পারি তার মধ্যে একটি হল পাইথন। ডেটা বলতে আমি এসকিউএল ব্যবহার করতে পারি এবং ডেটা স্ক্র্যাপিং করতে পারি। এতদূর নিবন্ধ পড়ার পরে আমি এতক্ষণ যা বুঝতে পেরেছি তা ডেটা সায়েন্স এ সম্পর্কে ভাল: 1- …
13 beginner  career 

1
বৈশিষ্ট্য উত্পন্নকরণ এবং বৈশিষ্ট্য নিষ্কাশন মধ্যে পার্থক্য কি?
ফিচার জেনারেশনের উদ্দেশ্য কী আমাকে কেউ বলতে পারেন? এবং কোনও চিত্রকে শ্রেণিবদ্ধ করার আগে কেন বৈশিষ্ট্য স্থান সমৃদ্ধকরণের প্রয়োজন? এটি কি প্রয়োজনীয় পদক্ষেপ? বৈশিষ্ট্য স্পেস সমৃদ্ধ করার কোন পদ্ধতি আছে?

1
নিও 4 জ বনাম ওরিয়েন্টডিবি বনাম টাইটান
আমি সামাজিক সম্পর্ক খনির সম্পর্কিত একটি ডেটা-সায়েন্স প্রকল্পে কাজ করছি এবং কিছু গ্রাফ ডাটাবেসে ডেটা সংরক্ষণ করার প্রয়োজন রয়েছে। প্রাথমিকভাবে আমি Neo4j ডাটাবেস হিসাবে বেছে নিয়েছি। তবে এটি Seo Neo4j ভাল স্কেল না। বিকল্প আমি খুঁজে পেয়েছি হ'ল টাইটান এবং oriebtDB। আমি এই তিনটি ডাটাবেসের সাথে এই তুলনাটি পেরিয়েছি, তবে …

2
গভীর স্নায়বিক প্রশিক্ষণ ভিজ্যুয়ালাইজিং
আমি প্রশিক্ষণের সময় ওজন প্লট করার জন্য মাল্টিলেয়ার নেটওয়ার্কগুলির জন্য হিন্টন ডায়াগ্রামগুলির সমতুল্য সন্ধান করার চেষ্টা করছি। প্রশিক্ষিত নেটওয়ার্কটি কিছুটা ডিপ এসআরএন এর অনুরূপ, যেমন এটিতে বহু সংখ্যক ওজন ম্যাট্রিক রয়েছে যা বেশ কয়েকটি হিন্টন ডায়াগ্রামের যুগপত প্লটকে দৃশ্যত বিভ্রান্ত করে তুলবে। একাধিক স্তর সহ পুনরাবৃত্ত নেটওয়ার্কগুলির জন্য ওজন আপডেট …

1
আরও একক সিদ্ধান্ত গাছ যুক্ত করে অন-লাইন এলোমেলো বন
ডিসেম্যান্ড ট্রিস (টিটি) এর একটি সংঘবদ্ধ দ্বারা একটি র্যান্ডম ফরেস্ট (আরএফ) তৈরি করা হয়েছে। ব্যাগিং ব্যবহার করে প্রতিটি ডিটি আলাদা ডেটা উপসেটে প্রশিক্ষিত হয়। সুতরাং, নতুন উপাত্তে আরও সিদ্ধান্তের সংযোজন যুক্ত করে কোনও অন-লাইনের এলোমেলো বন কার্যকর করার কোনও উপায় আছে কি? উদাহরণস্বরূপ, আমাদের 10 কে স্যাম্পল রয়েছে এবং 10 …

2
এনএলপিতে শ্রেণিবিন্যাস প্রক্রিয়াতে পার্স গাছ থেকে সাধারণত কোন বৈশিষ্ট্য ব্যবহৃত হয়?
আমি বিভিন্ন ধরণের পার্স গাছের কাঠামো অন্বেষণ করছি। দুটি বহুল পরিচিত পার্স গাছের কাঠামো হ'ল ক) নির্বাচনী কেন্দ্র ভিত্তিক পার্স ট্রি এবং খ) নির্ভরতা ভিত্তিক পার্স গাছের কাঠামো। স্ট্যানফোর্ড এনএলপি প্যাকেজ ব্যবহার করে আমি উভয় প্রকারের পার্স গাছের কাঠামো উত্পন্ন করতে সক্ষম am তবে আমার শ্রেণিবিন্যাস কার্যের জন্য কীভাবে এই …

4
অধ্যয়নকারী মেশিন লার্নিং অ্যালগরিদম: অ্যালগরিদমের সংখ্যা বনাম বোঝার গভীরতা
সম্প্রতি আমি ডেটা সায়েন্সের ক্ষেত্রে পরিচয় করিয়েছি (এটি প্রায় months মাস প্রায় হয়েছে), এবং আইআইএইচইউ দ্বারা ডেটা সায়েন্স স্পেশালাইজেশনে কাজ করা পোস্টটি অ্যান্ড্রু এনজি দ্বারা মেশিন লার্নিং কোর্সের মাধ্যমে যাত্রা শুরু করেছিল। ব্যবহারিক প্রয়োগের সম্মুখভাগে, আমি একটি ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরির জন্য কাজ করছি যা আত্মত্যাগের পূর্বাভাস দেয়। এখনও অবধি আমি …

6
সেরা অনুশীলনগুলি বোঝার ডেটাসেট
আমি ডেটা মাইনিংয়ের সিএস মাস্টার ছাত্র student আমার তত্ত্বাবধায়ক একবার আমাকে বলেছিলেন যে আমি কোনও শ্রেণিবদ্ধ চালানোর আগে বা কোনও ডেটাसेट দিয়ে কিছু করার আগে অবশ্যই আমাকে ডেটা পুরোপুরি বুঝতে হবে এবং নিশ্চিত হওয়া উচিত যে ডেটাটি পরিষ্কার এবং সঠিক। আমার প্রশ্নগুলো: কোন ডেটাসেট (সংখ্যাসূচক এবং নামমাত্র গুণাবলী সহ উচ্চ …

1
যখন কোনও রিলেশনাল ডাটাবেসের কোনও সম্পর্কযুক্তের চেয়ে ভাল পারফরম্যান্স থাকে
মাইএসকিউএলের মতো কোনও রিলেশনাল ডাটাবেস যখন মঙ্গোডিবি-র মতো কোনও সম্পর্কযুক্তের চেয়ে ভাল পারফরম্যান্স করে? কোরা অন্য দিন কেন মাইএসকিউএলকে তাদের ব্যাকএন্ড হিসাবে ব্যবহার করে এবং তাদের পারফরম্যান্সটি এখনও ভাল তা সম্পর্কে আমি অন্য দিন কোওরায় একটি প্রশ্ন দেখেছি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.