DBpedia
المطوّر | |
---|---|
الإطلاق المبدئي | 10 يناير 2007 |
الإصدار المستقر | DBpedia 2016-10
/ 4 July 2017 |
المستودع | github |
مكتوب بلغة | |
نظام التشغيل | Virtuoso Universal Server |
النوع | |
الرخصة | GNU General Public License |
الموقع الإلكتروني | dbpedia |
يهدف مشروع DBpedia (من "DB" "قاعدة بيانات") إلى استخراج محتوى منظم من المعلومات التي تم إنشاؤها في مشروع ويكيپيديا. هذه المعلومات المنظمة متاحة على شبكة الوب العالمية.[1]يسمح DBpedia للمستخدمين بالاستعلام الدلالي بالعلاقات وخصائص موارد ويكيپيديا، بما في ذلك الروابط إلى مجموعة البيانات الأخرى المرتبطة.[2] في عام 2008، وصف تيم بيرنرز-لي DBpedia بأنها واحدة من أشهر أجزاء المسعى اللامركزي للبيانات المرتبطة.[3]
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
خلفية
بدأ المشروع بواسطة أشخاص في جامعة برلين الحرة و جامعة لايبزگ،[4] بالتعاون مع برنامج OpenLink، ويتم إدارتها الآن بواسطة الأشخاص في جامعة مانهايم وجامعة لايبزگ.[5][6] تم نشر أول مجموعة بيانات متاحة للمستخدمين في عام 2007.[4] يتم توفير البيانات بموجب ترخيص مجاني s (CC-BY-SA)، مما يسمح للآخرين بإعادة استخدام مجموعة البيانات؛ ومع ذلك، فإنه لا يستخدم ترخيص البيانات المفتوحة للتنازل عن حقوق قاعدة البيانات الفريدة.
تتكون مقالات ويكيپيديا في الغالب من نص حر، ولكنها تتضمن أيضاً معلومات منظمة مضمنة في المقالات، مثل جداول "صناديق المعلومات" (اللوحات القابلة للسحب التي تظهر في أعلى يمين العرض الافتراضي للعديد من مقالات ويكيپيديا، أو في بداية إصدارات المحمول)، معلومات التصنيف، الصور، الإحداثيات الجغرافية والروابط إلى صفحة وب خارجية. يتم استخراج هذه المعلومات المنظمة ووضعها في مجموعة بيانات موحدة يمكن الاستعلام عنها.
مجموعة البيانات
يصف إصدار 2016-04 من مجموعة بيانات DBpedia 6.0 ملايين كيان، منها 5.2 مليون مصنفة في الأنطولوجية، بما في ذلك 1.5 مليون شخص، و 810 آلاف مكان، و 135 ألف ألبوم موسيقي، و 106 آلاف أفلام، 20 ألف لعبة فيديو، 275 ألف منظمة، 301 ألف نوع و 5 آلاف مرض.[7]تستخدم DBpedia إطار وصف الموارد (RDF) لتمثيل المعلومات المستخرجة وتتكون من 9.5 مليار RDF ثلاثية، منها 1.3 مليار تم استخلاصها من النسخة الإنگليزية من ويكيپيديا و 5.0 مليار من إصدارات اللغات الأخرى.[7]
من مجموعة البيانات هذه، يمكن استخراج المعلومات المنتشرة عبر صفحات متعددة. على سبيل المثال، يمكن تجميع حقوق تأليف الكتاب من صفحات حول العمل أو المؤلف.قالب:Elucidate
يتمثل أحد التحديات في استخراج المعلومات من ويكيپيديا في إمكانية التعبير عن نفس المفاهيم باستخدام پارامترات مختلفة في صندوق المعلومات والنماذج الأخرى، مثل |birthplace=
و |placeofbirth=
. لهذا السبب، يجب أن تبحث الاستفسارات حول مكان ميلاد الأشخاص عن هاتين الخاصيتين للحصول على نتائج أكثر اكتمالاً. نتيجة لذلك تم تطوير لغة رسم الخرائط DBpedia للمساعدة في تعيين هذه الخصائص إلى الأنطولوجيا مع تقليل عدد المرادفات. نظراً للتنوع الكبير في مربعات المعلومات والخصائص المستخدمة على ويكيپيديا، تم فتح عملية تطوير هذه التعيينات وتحسينها للمساهمات العامة[8]
تم إصدار النسخة 2014 في سبتمبر 2014.[9] كان التغيير الرئيسي منذ الإصدارات السابقة هو طريقة استخراج النصوص المجردة. على وجه التحديد، فإن تشغيل انعكاس محلي لـ ويكيپيديا واستعادة الملخصات المقدمة منها جعل النصوص المستخرجة أكثر صفاء. كما تم تقديم مجموعة بيانات جديدة مستخرجة من ويكيميديا كومنز.
بحلول عام 2017، أصبحت DBpedia أحد أكبر ممثلي بيانات الربط المفتوحة (LOD).[10]
أمثلة
تستخرج DBpedia المعلومات الواقعية من صفحات ويكيپيديا، مما يسمح للمستخدمين بالعثور على إجابات للأسئلة حيث تنتشر المعلومات عبر مقالات ويكيپيديا المتعددة. يتم الوصول إلى البيانات باستخدام SQL - مثل لغة الاستعلام لـ RDF تسمى SPARQL. على سبيل المثال، تخيل أنك كنت مهتماً بسلسلة Tokyo Mew Mew shōjo manga اليابانية، وأردت العثور على أنواع الأعمال الأخرى التي كتبها رسامها. تجمع DBpedia معلومات من إدخالات ويكيپيديا حول Tokyo Mew Mew، Mia Ikumi وعن أعمال مثل Super Doll Licca-chan وKoi Cupid. نظراً لأن DBpedia تقوم بتطبيع المعلومات في قاعدة بيانات واحدة، يمكن طرح query التالي دون الحاجة إلى معرفة أي إدخال يحمل كل جزء من المعلومات بالضبط، وسيسرد الأنواع ذات الصلة:
PREFIX dbprop: <http://dbpedia.org/property/>
PREFIX db: <http://dbpedia.org/resource/>
SELECT ?who, ?WORK, ?genre WHERE {
db:Tokyo_Mew_Mew dbprop:author ?who .
?WORK dbprop:author ?who .
OPTIONAL { ?WORK dbprop:genre ?genre } .
}
حالات الاستخدام
لدى DBpedia نطاق واسع من الكيانات التي تغطي مجالات مختلفة من المعرفة البشرية. وهذا يجعلها مركزاً طبيعياً لربط مجموعات البيانات، حيث يمكن أن ترتبط مجموعات البيانات الخارجية بمفاهيمها.[11] مجموعة البيانات DBpedia مرتبطة ببعضها البعض على مستوى RDF مع مجموعات بيانات مفتوحة أخرى مختلفة على الوب. يتيح ذلك للتطبيقات إثراء بيانات DBpedia ببيانات من مجموعات البيانات هذه.اعتبارا من سبتمبر 2013[تحديث]، هناك أكثر من 45 مليون ارتباط بين DBpedia ومجموعات البيانات الخارجية بما في ذلك: Freebase OpenCyc UMBEL GeoNames MusicBrainz، كتاب حقائق العالم لوكالة المخابرات المركزية، DBLP، مشروع گوتنبرگ، DBtune Jamendo ،Eurostat ،UniProt [[Bio2RDF] ، و تعداد الولايات المتحدة.[12][13] مبادرة تومسن رويترز كاليس المفتوحة ومشروع البيانات المفتوحة المرتبطة نيويورك تايمز، و Zemanta API و DBpedia Spotlight أيضاً تضمين روابط إلى DBpedia.[14][15][16]تستخدم BBC DBpedia للمساعدة في تنظيم محتواها.[17][18] يستخدم Faviki DBpedia لوضع العلامات الدلالية.[19]تقوم سامسونگ بتضمين DBpedia أيضاً في ملفات "Knowledge Sharing Platform".
مثل هذا المصدر الغني للمعرفة المهيكلة عبر المجالات هو أرض خصبة لأنظمة الذكاء الاصطناعي. تم استخدام DBpedia كأحد مصادر المعرفة في نظام فوز IBM Watson Jeopardy![20]
توفر أمازون مجموعة البيانات العامة DBpedia التي يمكن دمجها في تطبيقات خدمات أمازون وب.[21]
يمكن أن تساعد البنية الدلالية لـ DBpedia مع مقاييس الجودة في بناء طرق للإثراء التلقائي لإصدارات اللغات الأقل تطوراً من ويكيپيديا.[22]
يمكن استخدام البيانات المتعلقة بالمبدعين من DBpedia لإثراء ملاحظات مبيعات الأعمال الفنية.[23]
قامت شركة البرمجيات التوريد الجماعي، Ushahidi، ببناء نموذج أولي لبرامجها التي استفادت من DBpedia لأداء التعليقات التوضيحية الدلالية على التقارير التي ينشئها المستخدم. أُدرج النموذج الأولي خدمة "YODIE" (نظام آخر لاستخراج معلومات البيانات المفتوحة)[24] تم تطويره بواسطة جامعة شيفيلد، والتي تستخدم DBpedia لأداء التعليقات التوضيحية. كان الهدف من Ushahidi هو تحسين السرعة والتسهيلات التي يمكن بها التحقق من صحة التقارير الواردة.[25]
DBpedia Spotlight
DBpedia Spotlight هي أداة للتعليق على إشارات موارد DBpedia في النص. يسمح هذا بربط مصادر المعلومات غير المهيكلة بسحابة البيانات المفتوحة المرتبطة من خلال DBpedia. ينفذ DBpedia Spotlight المسماة استخراج الكيان، بما في ذلك اكتشاف الكيان و تحليل الاسم (بمعنى آخر، توضيح). يمكن استخدامه أيضاً لـ التعرف على الكيان المُسمى ومهام استخراج المعلومات الأخرى. يهدف DBpedia Spotlight إلى أن يكون قابلاً للتخصيص للعديد من حالات الاستخدام. بدلاً من التركيز على أنواع قليلة من الكيانات، يسعى المشروع جاهداً لدعم التعليقات التوضيحية لكامل 3.5 مليون كيان ومفاهيم من أكثر من 320 فئة في DBpedia. بدأ المشروع في يونيو 2010 في مجموعة الأنظمة القائمة على الوب في جامعة برلين الحرة.
DBpedia Spotlight متاح للمستخدمين باعتباره خدمة وب للاختبار و جاڤا / سكالا API المرخصة عبر رخصة أپاتشي. يتضمن توزيع DBpedia Spotlight مكوناً إضافياً jQuery الذي يتيح للمطورين إضافة تعليق توضيحي للصفحات في أي مكان على الوب عن طريق إضافة سطر واحد إلى صفحتهم.[26]والعملاء متاحون أيضاً في جاڤا أو PHP.[27] تتعامل الأداة مع لغات مختلفة من خلال صفحتها التجريبية[28]وخدمات الويب. يتم دعم التدويل لأي لغة لها إصدار ويكيپيديا.[29]
تاريخ
تم إطلاق DBpedia في عام 2007 بواسطة سورين أوير و كريستيان بيزر و جورجي كوبيلاروڤ و ينز ليمان و ريتشارد سگانياك و زاكاري إيڤيس.[4]
انظر أيضاً
المراجع
- ^ Bizer, Christian; Lehmann, Jens; Kobilarov, Georgi; Auer, Soren; Becker, Christian; Cyganiak, Richard; Hellmann, Sebastian (سبتمبر 2009). "DBpedia - A crystallization point for the Web of Data" (PDF). Web Semantics: Science, Services and Agents on the World Wide Web. 7 (3): 154–165. CiteSeerX 10.1.1.150.4898. doi:10.1016/j.websem.2009.07.002. ISSN 1570-8268. Archived from the original (PDF) on 10 أغسطس 2017. Retrieved 11 ديسمبر 2015.
- ^ "Komplett verlinkt — Linked Data" (in German). 3sat. 19 يونيو 2009. Archived from the original on 6 يناير 2013. Retrieved 10 نوفمبر 2009.
{{cite web}}
: CS1 maint: unrecognized language (link) - ^ "Sir Tim Berners-Lee Talks with Talis about the Semantic Web". Talis. 7 فبراير 2008. Archived from the original on 10 مايو 2013.
- ^ أ ب ت DBpedia: A Nucleus for a Web of Open Data, available at [1], [2], or [3]
- ^ "Credits". DBpedia. Archived from the original on 21 سبتمبر 2014. Retrieved 9 سبتمبر 2014.
- ^ https://wiki.dbpedia.org/about/dbpedia-community
- ^ أ ب "YEAH! We did it again ;) – New 2016-04 DBpedia release". DBpedia. 19 أكتوبر 2016. Retrieved 9 يناير 2019.
- ^ "DBpedia Mappings". mappings.dbpedia.org. Retrieved 3 أبريل 2010.
- ^ "Changelog". DBpedia. سبتمبر 2014. Retrieved 9 سبتمبر 2014.
- ^ Lewoniewski, Włodzimierz (18 أكتوبر 2017). Enrichment of Information in Multilingual Wikipedia Based on Quality Analysis. Vol. 303. pp. 216–227. doi:10.1007/978-3-319-69023-0_19. ISBN 978-3-319-69022-3. Retrieved 5 مايو 2018.
{{cite book}}
:|journal=
ignored (help) - ^ E. Curry, A. Freitas, and S. O’Riáin, "The Role of Community-Driven Data Curation for Enterprises," Archived 23 يناير 2012 at the Wayback Machine in Linking Enterprise Data, D. Wood, Ed. Boston, MA: Springer US, 2010, pp. 25-47.
- ^ Statistics on links between Data sets, W3C, http://esw.w3.org/topic/TaskForces/CommunityProjects/LinkingOpenData/DataSets/LinkStatistics, retrieved on 2009-11-24
- ^ Statistics on Data sets, W3C, http://esw.w3.org/topic/TaskForces/CommunityProjects/LinkingOpenData/DataSets/Statistics, retrieved on 2009-11-24
- ^ Sandhaus, Evan; Larson, Rob (29 أكتوبر 2009). "First 5,000 Tags Released to the Linked Data Cloud". The New York Times Blogs. Retrieved 10 نوفمبر 2009.
- ^
"Life in the Linked Data Cloud". opencalais.com. Archived from the original on 24 نوفمبر 2009. Retrieved 10 نوفمبر 2009.
Wikipedia has a Linked Data twin called DBpedia. DBpedia has the same structured information as Wikipedia – but translated into a machine-readable format.
- ^
"Zemanta talks Linked Data with SDK and commercial API". ZDNet. Archived from the original on 28 فبراير 2010. Retrieved 10 نوفمبر 2009.
Zemanta fully supports the Linking Open Data initiative. It is the first API that returns disambiguated entities linked to dbPedia, Freebase, MusicBrainz, and Semantic Crunchbase.
- ^ "European Semantic Web Conference 2009 - Georgi Kobilarov, Tom Scott, Yves Raimond, Silver Oliver, Chris Sizemore, Michael Smethurst, Christian Bizer and Robert Lee. Media meets Semantic Web - How the BBC uses DBpedia and Linked Data to make Connections". eswc2009.org. Archived from the original on 8 يونيو 2009. Retrieved 10 نوفمبر 2009.
- ^
"BBC Learning - Open Lab - Reference". BBC. Archived from the original on 25 أغسطس 2009. Retrieved 10 نوفمبر 2009.
Dbpedia is a database version of Wikipedia. It is used in a lot of projects for a wide range of different reasons. At the BBC we are using it for tagging content.
- ^ "Semantic Tagging with Faviki". readwriteweb.com. Archived from the original on 29 يناير 2010.
- ^ David Ferrucci, Eric Brown, Jennifer Chu-Carroll, James Fan, David Gondek, Aditya A. Kalyanpur, Adam Lally, J. William Murdock, Eric Nyberg, John Prager, Nico Schlaefer, and Chris Welty "Building Watson: An Overview of the DeepQA Project." In AI Magazine Fall, 2010. Association for the Advancement of Artificial Intelligence (AAAI).
- ^ "Amazon Web Services Developer Community : DBpedia". developer.amazonwebservices.com. Archived from the original on 13 فبراير 2010. Retrieved 10 نوفمبر 2009.
- ^ Lewoniewski, Włodzimierz; Węcel, Krzysztof; Abramowicz, Witold (8 ديسمبر 2017). "Relative Quality and Popularity Evaluation of Multilingual Wikipedia Articles". Informatics. 4 (4): 43. doi:10.3390/informatics4040043.
- ^ Filipiak, Dominik; Filipowska, Agata (2 ديسمبر 2015). DBpedia in the Art Market. Lecture Notes in Business Information Processing. Vol. 228. pp. 321–331. doi:10.1007/978-3-319-26762-3_28. ISBN 978-3-319-26761-6.
{{cite book}}
:|journal=
ignored (help) - ^ "GATE.ac.uk - applications/yodie.html". gate.ac.uk. Retrieved 11 مايو 2020.
- ^ "ushahidi/platform-comrades". GitHub (in الإنجليزية). Retrieved 9 مارس 2020.
- ^ Mendes, Pablo. "DBpedia Spotlight jQuery Plugin". jQuery Plugins. Retrieved 15 سبتمبر 2011.
- ^ DiCiuccio, Rob (25 سبتمبر 2016). "PHP Client for DBpedia Spotlight". GitHub.
- ^ "Demo of DBpedia Spotlight". Retrieved 8 سبتمبر 2013.
- ^ "Internationalization of DBpedia Spotlight". Retrieved 8 سبتمبر 2013.
وصلات خارجية
- CS1 errors: periodical ignored
- Short description is different from Wikidata
- Use dmy dates from October 2020
- مقالات فيها عبارات متقادمة منذ سبتمبر 2013
- جميع المقالات التي فيها عبارات متقادمة
- وب دلالي
- قوالب التكنولوجيا والعلوم التطبيقية
- Free software culture and documents
- Open data
- Knowledge bases
- History of Wikipedia
- منصة جاڤا
- Free software programmed in Scala