پایگاه دانش تا بی نهایت
پایگاه دانش چیست، چه تفاوتی با بانکهای اطلاعاتی دارد و چرا استفاده میشود؟
مهندسی دانش چیست؟
قبل از پرداختن به تفاوت پایگاه انش و پایگاه داده اجازه دهید توضیح مختصری در ارتباط با مهندسی دانش ارائه کنیم. مهندسی دانش، به مجموعه فرایندهای مربوط به طراحی، مهندسی و ایجاد سامانههای مبتنی بر دانش اطلاق میشود. مهندسی دانش، دارای وجوه مشترک فراوانی با مهندسی نرمافزار است، بهطوری که بیشتر راه حلها و روشهای هریک را میتوان در دیگری استفاده کرد. علاوه بر آن، زمینههای دیگری مثل هوش مصنوعی، پایگاههای دادهها، کاوشهای ماشینی در دادهها، سامانههای خبره، سامانههای پشتیبانی تصمیمها و نیز سامانههای اطلاعات جغرافیایی را باید در ارتباط نزدیک با مهندسی دانش، به حساب آورد.
مهندس دانش کیست؟
مهندس دانش (Knowledge Engineer)، فردی است که در فرایند مهندسی دانش (Knowledge Engineering) تخصص دارد. وی میتواند سه فعالیت استخراج، تحلیل و مدلسازی دانش را انجام دهد. این سه فعالیت منجر به تولید یک پایگاه دانش ساخت یافته مبتنی بر مدلهای دانش با قابلیت استفاده مجدد میشود که میتواند به عنوان محتوای ورودی در یک سیستم مبتنی بر دانش استفاده شود. در نگاههای غیرحرفهای تر مهندس دانش به عنوان نقشی برای اجرای برخی فرایندهای ساده مدیریت دانش تنزل پیدا میکند. همگام با مهاجرت سیستمهای خبره از نمونههای اولیه دانشگاهی به سیستمهای کسب و کار پیادهسازی شده مهندسی دانش مورد توجه قرار گرفت که امکان قابل پیشبینی بودن و کنترل روی رویههای ساخت نرمافزار را به عنوان یک اصل و روششناسی توصیف کرد. این تلاشها منجر به شکلگیری دو راهکار استفاده از متدولوژیهای قرار دادی برای توسعه نرمافزار و پیادهسازی متدولوژیهای خاصی که با نیازهای ساخت سیستمهای خبره وفق داده شد.
پایگاه دانش و پایگاه داده دو مفهوم متفاوت از یکدیگر:
هدف از پایگاه داده، ذخیره ی داده های بزرگ به صورت جداول دادهای است. ۲ نیازمندی اصلی برای ساخت یک پایگاه داده پشتیبانی از چندین کاربر توزیع شده برای دسترسی به یک داده و پشتیبانی از انجام تراکنشها (Transaction) دو حالت انجام قطعی یا بازگشت به حالت قبل است. یک پایگاه دانش، این نیازمندی های طراحی را ندارد، در عوض به داده های ساختار یافته نیاز دارد که ممکن است نشانگرهایی به شییهای دیگر داشته باشند. قابل ذکر است که نمایش ایدهآل برای یک پایگاه دانش مدل شیی (Object Model) است که در این مدل، کلاس، زیرکلاس و نمونه وجود دارد. دادههای پایگاه دانش برای سیستمهای خبره، برای رسیدن به جواب خاصی استفاده میشدند: رسیدن به تشخیص پزشکی، طراحی یک ملکول، رسیدن به پاسخ در موارد اضطراری. از پایگاه دانش برای فهم واقعیتها در مورد جهان استفاده میشود. بهطور مثال جمله همه انسانها فانیاند، قابل نمایش در یک پایگاه داده نیست، در عوض یک پایگاه داده اطلاعات هزاران جدول را نگهداری میکند که اطلاعاتی در مورد انسان خاصی را نمایش میدهند. این پایگاه دانش است که میتواند: نشان دهد همه انسانها فانیاند و در مورد انسان خاصی استنتاج میکند که او فانی است.
ارتباط پایگاه دانش و پایگاه داده:
قابل ذکر است که فروشندگان نرمافزارهای پایگاه داده(مثل اوراکل)، امروزه امکاناتی به محصولات خود اضافه کردهاند که امکان پشتیبانی از نیازمندیهای پایگاه دانش مثل قواعد و روابط کلاس-زیرکلاس را فراهم میکنند. حتی پایگاههای داده شییگرا مثل Versant هستند که از ابتدا برای پشتیبانی از امکانات شییگرایی ساخته شدهاند که از سرویسهای استاندارد پایگاه داده پشتیبانی میکنند.
استدلال خودکار:
استدلال خودکار حوزهای است از علوم کامپیوتر و منطق ریاضی است که مربوط به درک جنبههای مختلف استدلال است. استدلال خودکار منجر به تولید برنامههایی میشود که کمک میکند کامپیوترها بهطور کامل و مستقل توانایی استدلال داشته باشند. با این تعریف، استدلال خودکار معمولاً شاخهای از هوش مصنوعی است، اما به مقدار زیادی به علوم رایانه نظری و حتی فلسفه مربوط است. در حال حاضر توسعهیافتهترین زیرشاخه این علم اثبات قضیه خودکار و بررسی برهان خودکار هستند. نرمافزارهای اثبات قضیه خودکار قادرند برخی مسائل و قضایای ریاضی را اثبات نمایند و حتی در مواردی موفق به کشف اثباتهای کوتاهتر برای برخی از قضایای ریاضی شدهاند. استدلال خودکار در حوزه هوش مصنوعی کاربرد فراوان دارد. در واقع میتوان گفت استدلال خودکار قلب هوش مصنوعی است. زیرا در این حوزه، رایانش برابر است با استنتاج و حل مسئله. گامهایی که در استنتاج مسئله طی میشود در نهایت منجر به رسیدن به هدف معین میشود. پایه ایجاد یک محصول دارای هوش مصنوعی، جمعآوری استدلالهای «اگر - آنگاه» مربوط به جهان اطراف محصول است. امروزه استدلال خودکار در زمینه پایگاه دانش و ذخیره اطلاعات هدفمند و قابل درک انسانی استفاده میشود.
سیستم پایگاه دانش:
سیستم پایگاه دانش (Knowledge-based systems) برنامه کامپیوتری است که با استفاده از پایگاه دانش، به حل مسائل میپردازد. سیستمهای مختلفی به این نام خوانده میشوند ولی اکثر آنها سعی در حل مسائل از راه هستیشناسی (ontologies) دارند، به این معنی که آیا رابطه مورد نظر، با توجه به دادههای موجود، وجود دارد یا خیر.
نمایش دانش:
نمایش دانش (Knowledge representation and reasoning) دستیابی به مناسبترین شکلها و شیوههای ذخیرهسازی دانش است؛ هر چند امر نمایش دانش در همه زمینههای علمی، همواره اهمیت داشتهاست؛ زمانی که رایانهها بخواهند در کنار انسان، یا بهجای انسان، به استدلال بپردازند، نقش آن، به سبب دشواریهای ناشی از مقیاسپذیری، حیاتیتر و اجتنابناپذیر میگردد. معمولاً خواص زیر را برای سیستمهای نمایش دانش در هر زمینه خاص مطلوب میدانیم:
کفایت نمایشها: به قادر بودن سیستم بر نمایش تمامی انواع دانش موجود در زمینهٔ مورد نظر اطلاق میشود.
کفایت استنباطها: منظور توانایی سیستم انتخابی نمایش بر کار با ساختارهای نمایشی موجود و ایجاد ساختارهای مناسب جهت نمایش دانش جدیدی ست که استنباط شده است
دانش ساده رابطهای: سادهترین راه برای نمایش واقعیات اعلانی عبارت است از بهکارگیری مجموعههای روابط درست همانگونه که در سامانههای رابطهای دادهها انجام میدهیم.
هستیشناسی در علوم کامپیوتر:
هستیشناسی (Ontology) در علوم رایانه و علوم اطلاعات، شامل نمایش، نامگذاری صوری و نیز تعریف ردهها، تعریف ویژگیها، و تعریف رابطه موجود بین مفاهیم، داده، و موجودیتهایی است که ماهیت (یک یا چندین یا تمام) دامنههای سخن را تشکیل میدهند. اگر بخواهیم سادهتر بگوییم، هستیشناسی روشی برای نمایش ویژگیهای حوزه یک موضوع، و شیوه ارتباط آنها، از طریق تعریف یک «مجموعهی شامل مفهوم و رده» برای نمایش آن موضوع است. پایگاه شناخت به عنوان هستانشناسی (یا هستیشناسی) در علوم اطلاعاتی و علوم محاسباتی شناخته میشود که یک ساختار برای ذخیره، بازیابی و بهاشتراکگذاری شناخت است و شناخت عبارتست از درک فردی از دانش یک دامنه. عناصر این ساختار، یک توصیف فرمال از مفاهیم موجود در یک دامنه و روابط و ضوابط بین آنها فراهم میآورد. علوم اطلاعات و علوم محاسبات، برای گسترش و کارایی بیشتر و نیز برآورده نمودن نیازهای وب معنایی، نیازمند به ساخت و ایجاد پایگاه شناخت هستند. همچون بسیاری از زمینهها و شاخههای دیگر فلسفه، پایگاه شناخت نیز در سایهٔ پیشرفتها و تحوّلات اخیر در علوم اطلاعات، علوم مخابرات و ارتباطات، علوم رایانه، و محاسبات رواج و رونقی تازه و در سطحی گسترده بهخود گرفتهاست. برای آغاز به ساخت و گسترش وب معنینگر، باید تا حدّ امکان قادر باشیم تمامی موجودات (entities) و مفاهیم (concepts) و نیز روابط و اتّصالات آنها با یکدیگر را به صورت مدلهایی مجرد به زبانهایی که برای رایانهها قابل درک است بیان نماییم. در علوم رایانه این گونه مدلهای مجرد ماشینی را پایگاه شناخت نامیدهاند که برآمده از مفاهیم و ایدههای قدیمیتر و ژرفتر آن در فلسفهاست. از جمله زمینههایی که به نحوی چشمگیر و فعال به امر طراحی، مهندسی، و ایجاد پایگاه شناخت پرداختهاند باید علوم پزشکی، بیوانفورماتیک، و به زبانی همهگیرتر علوم حیات (Biosciences) را برشمرد.
هستیشناسی در وب معنایی:
هستیشناسیها توانایی پردازش دانش، بهاشتراکگذاری آن بین عاملهای مختلف و استفاده مجدد از آن را در محیط وب ایجاد میکنند. هستیشناسیها چنین تواناییهایی را مدیون تعریف و توصیف مفاهیم و موجودات و بیان ارتباط بین آنها بهصورت رسمی، میباشند. با تجزیه و تحلیل محتوای صفحات وب، میتوان دادههای موجود در صفحات را به مفاهیم موجود در هستیشناسیها نگاشت کرد. چنین عملی باعث بالا بردن درجه همکاری بین انسان و ماشین شده بهگونهای که ماشینها مستعد بهعهده گرفتن بسیاری از وظایف انسان میشوند. هستیشناسیها برای فعالیت سرویسهای هوشمند، بستر مناسبی فراهم میکنند. به عنوان مثال در سرویسهایی مانند جستجو هوشمند در وب، فیلترهای اطلاعاتی، یکپارچهسازی هوشمند اطلاعات و مدیریت دانش، استفاده از هستیشناسیها میتواند بسیار کارساز باشد. با توجه به کثرت اطلاعات موجود در وب، در اغلب راهبردها سعی میشود که فرایند معنایی کردن صفحات کنونی وب بهطور خودکار انجام شود. در این راهبردها سعی میشود تا با بهخدمت گرفتن ابزار مناسب و استفاده از تکنیکهای پردازش زبان طبیعی، صفحات کنونی وب با توصیف فرادادههای مبتنی بر هستیشناسی، حاشیهنویسی شوند.
گراف دانش یک نمونه روشن از پایگاه دانش:
گراف دانش (Knowledge Graph) یک پایگاه دانش است که توسط گوگل و سرویسهای گوگل، برای بهبود کیفیت نتایج موتور جستجوی آن استفاده میشود، این کار از طریق جمعآوری اطلاعات از منابع متفاوت انجام میشود. اطلاعات گراف دانش در یک جعبه اطلاعات (infobox)، در کنار نتایج جستجو برای کاربران نمایش مییابد. اطلاعات موجود در گراف دانش، پس از راهاندازی به صورت قابل توجهی رشد کرد و در مدت سه ماه سه برابر شد (شامل ۵۷۰ میلیون ورودی و ۱۸ میلیارد واقعیت). این ابزار «تقریباً یک سوم» از ۱۰۰ میلیارد جستجوی ماهانهای را که گوگل در ماه مه ۲۰۱۶ پردازش کرد را پاسخ میداد. اما گراف دانش یک ایراد مهم دارد و آن هم این است که به پاسخهایی که ارائه میدهد بدون منبع و مدرک موثق میباشد. اطلاعات از گراف دانش در یک جعبه، که گوگل به آن پنل دانش (knowledge panel) میگوید نمایش مییابد، و گوگل آنرا در سمت راست (سمت چپ در زبان فارسی و بالا در موبایل) برای نتایج جستجو نشان میدهد. بر اساس اعلام گوگل، این اطلاعات از منابع زیادی بازیابی شدهاند، که شامل اطلاعاتنامه جهان، ویکیداده، و ویکیپدیا میشوند. در ماه اکتبر ۲۰۱۶ گوگل اعلام کرد که گراف دانش بیش از ۷۰ میلیارد واقعیت را نگهداری کرده است. با اینحال، هیچ مستندات رسمی درباره تکنولوژی که برای پیادهسازی گراف دانش استفاده شدهاست، وجود ندارد. اطلاعات گراف دانش برای پاسخگویی، به سوالات کلامی و درخواستهای صوتی، در دستیار گوگل و گوگل هوم استفاده میشود. بر پایه اطلاعات گزارش شده از سوی گوگل اطلاعات گراف دانش تا ۳۰ ژوئن ۲۰۱۵ از منابع بسیاری گرفته میشد که شامل اطلاعاتنامه جهان, فریبیس بود و بعد از آن از ویکیداده و ویکیپدیا استفاده میشود. در اوت ۲۰۱۴ گوگل اعلام کرد که اطلاعات گراف دانش را گوگل با الگوریتمهای هوش مصنوعی استخراج میکند که حدود ۱٫۶ میلیارد اطلاعات را شامل میشود. همچنین در ۱۶ دسامبر ۲۰۱۴ گروه گراف دانش و فریبیس اعلام کردند که اطلاعاتشان را به ویکیداده انتقال دادهاند و فریبیس در اواخر ۲۰۱۵ از دسترس خارج میشود. یکی از ویژگیهای گراف دانش این است که قابلیت کنترل توسط اشخاص و سازمانهایی است که گراف دانش دارند برای این کار باید گراف دانش خود را پیدا و تأیید کنند تا کنترل آن را در اختیار داشته باشند. زمانی که یک گراف دانش تأیید میشود یک تیک آبی کنار عکس تعریف شده قرار میگیرد که مشخص کننده تحت مدیریت بودن آن است
ویژگیهای گراف دانش تأیید شده:
زمانی که یک گراف دانش را تأیید کنید آن را در اختیار خواهید داشت و میتوانید تنظیماتی روی آن اعمال کنید که روی نمایش اطلاعات شما در گوگل تأثیر خواهد گذاشت. از مهمترین تغییراتی که میتوان روی گراف دانش پس از در اختیار داشتن آن اعمال کنید به مواردی همچون توانایی تنظیم عکس برای نمایش در عنوان جستجو، توانایی تنظیم عکس و نماد بر روی گراف دانش، لینک کردن شبکههای اجتماعی بر روی گراف دانش و حذف آنها و تغییر نام گراف دانش اشاره کرد. همچنین این امکان وجود ندارد تا روی گراف دانش تغییراتی همچون لینک کردن صفحه ویکیپدیا بر روی گراف دانش و تنظیم بخش پیشنهادها دیگران این موارد را هم جستجو کردهاند اعمال کرد. زمانی که یک گراف دانش تأیید میشود یک لینک مخصوص به او اختصاص داده میشود که با https://posts.google.com/ و شناسه گراف دانش بعد از / تعریف میگردد.
چرا برخی از کارشناسان به گراف دانش ایراد میگیرند؟
کاربران نمیتوانند اطلاعات را تأیید کنند و عقایدی و دانشی که به دست میآورند نمیتواند آگاهانه باشد. این اطلاعات به صورت معمول منبع موثق ندارند. گراف دانش مبنای ویکیپدیا است و باعث شده تا خوانندگان آن کاهش یابد، زیرا هدف از گراف دانش پیادهسازی پاسخگویی به سوالات مستقیم در نتایج جستوجوی گوگل است.
پایگاه دانش را در تا بی نهایت تجربه کنید!