আমি কোথায় পাঠ্য বিন্যাসে ইংরেজি অভিধানের ডাটাবেস ডাউনলোড করতে পারি? [বন্ধ]


127

আমাকে একটি শব্দের জন্য পাঠ্য ফাইলটি পড়তে হবে এবং এর অর্থ ফেরত দিতে হবে। অন্য কোনও ফাইল ফর্ম্যাটও কাজ করবে।


আমি সমস্ত বিখ্যাত অনলাইন অভিধান (অক্সফোর্ড, লংম্যান, কেমব্রিজ, ওয়েবস্টার এবং কলিন্স) এর জন্য একটি ওয়েব ক্লোরার লিখেছি আপনি এটি আপনার ডেটা তৈরি করতে ব্যবহার করতে পারেন। github.com/kiasar/Dictionary_crawler
Peyman

উত্তর:


62

গুটেনবার্গ প্রকল্প Webster এর অসংক্ষেপিত ইংরেজি অভিধান হোস্ট প্লাস অনেক অন্যান্য পাবলিক ডোমেইনে সাহিত্যিক কাজ। আসলে দেখে মনে হচ্ছে তারা বিভিন্ন বছরের কপিরাইট সহ হোস্ট করা অভিধানের বেশ কয়েকটি সংস্করণ পেয়েছে। আমি যার সাথে লিঙ্ক করেছি তার একটি 2009 কপিরাইট রয়েছে। আপনি সাইটের চারদিকে ঝাঁকুনি দিতে এবং ওয়েবস্টার এর অভিধানের বিভিন্ন সংস্করণটি অনুসন্ধান করতে চাইতে পারেন।


1
1913 সংস্করণের '09 সাফ-আপ ট্রান্সক্রিপ্ট, সম্ভবত ওসিআর সম্পূর্ণ পরিষ্কার ছিল না। সাইটে মোট 15 টি সংস্করণ রয়েছে।
ড্রাগনলর্ড

57

ব্যবহারকারীর 1247808 এর সাথে একটি ভাল লিঙ্ক রয়েছে: wget -c c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

যদি তা আপনার পক্ষে পর্যাপ্ত শব্দ না হয়:

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (মাইকেল ক্রোপাটের পরামর্শ থেকে আপডেট হওয়া ইউআরএল)

যদিও সেই ফাইলটির নাম পরিবর্তন হয়, আপনি সর্বশেষতম ... এটি সন্ধান করতে চান যা কেবলমাত্র একটি বড় (খুব বড়) পাঠ্য ফাইল হিসাবে দেখা দেয়।

http://dumps.wikimedia.org/enwiktionary/


ধন্যবাদ .. এই লিঙ্কটির জন্য
অ্যান্ডিবয়

আপনি সর্বদা সর্বদা ডাম্পস.উইকিমিডিয়া.আর. / এনউইকিশনারি
মাইকেল ক্রপ্যাট

androidtech / wordnet20 এসকিউএল বিন্যাসে নয় txt in
ড্রাগনলর্ড

1
দয়া করে মনে রাখবেন: ওয়ার্ডনেট20 এর বাক্যবিন্যাসের .sql ফাইলে একটি অবচয় TYPE = * রয়েছে। চালান sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sqlএটা মাইএসকিউএল একটি 5.0+ সংস্করণ বিরুদ্ধে চালানোর আগে অননুমোদিত সিনট্যাক্স প্রতিস্থাপন
Serguei Fedorov

কোনও ইংরেজী শব্দ যুক্ত কোনও সহজ টেক্সট ফাইল নেই?
নাদভ বি

27

আমি জানি না এটি খুব দেরি হয়েছে, তবে আমি ভেবেছিলাম এটি অন্য কাউকে সাহায্য করবে।

আমি একইভাবে খারাপভাবে চেয়েছিলাম ... অবশেষে এটি খুঁজে পেয়েছি।

হতে পারে এটি নিখুঁত নয়, তবে আমার কাছে এটি পর্যাপ্ত পরিমাণে (আমার ছোট অভিধানের অ্যাপ্লিকেশনটির জন্য)।

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

এটি কোনও ডাম্প ফাইল নয়, তবে একটি এমওয়াইএসকিউএল। এসকিউএল স্ক্রিপ্ট ফাইল

শব্দগুলি ডাব্লুএনএনএসওয়াইএনএসইটি টেবিলের এবং ডাব্লুএনএনজিওএলএসএস টেবিলের শব্দকোষ / অর্থের মধ্যে রয়েছে


4
এটি কোন লাইসেন্সের অধীনে?
কোল জনসন

2
আমিও নিশ্চিত নই, তবে androidtech.com/html/downloads.php এ আছেHere are some files related to natural language and chatterbot projects that we are making available to the public
বেতলিস্টা

7
মাইএসকিউএল ব্যবহারকারীরা: তৈরি টেবিলের বিবৃতিগুলি এখন সরানো টিওয়াইপি বিকল্প ব্যবহার করে। sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sqlএটিকে সর্বশেষ মাইএসকিউএল
অ্যান্থনিগোরে

15

এই নিখরচায় সংস্থানগুলি আপনার প্রয়োজন অনুসারে ফিট করে কিনা তা পরীক্ষা করে দেখুন -


8
FOLDOC (কম্পিউটারের ফ্রি অন লাইন অভিধান) কেবল কম্পিউটিং শর্তাদি / নামগুলির অভিধান হিসাবে উপস্থিত হয়। এটি কারও কারও পক্ষে কার্যকর হতে পারে তবে এটি সাধারণ উদ্দেশ্য অভিধান নয় যা আপনি বেশিরভাগ শব্দের সন্ধান করতে পারেন
L mase majesté

2
অবজেক্টগ্রাফ পৃষ্ঠার লিঙ্কটিও মারা গেছে। অফিসিয়াল ডাউনলোডযোগ্য সংস্করণ অবস্থিত হয় এখানে
লস ম্যাজেস্টে

@ লাসেমেজেস্টé আপনার লিঙ্কটি এখন মারা গেছে
ইউকশিমা হুকসাই
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.