پایگاه دانش تا بی نهایت

پایگاه دانش چیست، چه تفاوتی با بانک‌های اطلاعاتی دارد و چرا استفاده می‌شود؟

 

پایگاه دانش(Knowledge base) به فناوری گفته می‌شود که در سیستم های کامپیوتری، برای ذخیره‌سازی داده‌های پیچیده ساختار یافته و بدون ساختار استفاده می‌شود. اولین سیستم های پایگاه دانشی که به وجود آمد، در سیستم‌های خبره کاربرد داشتند. یک سیستم مبتنی بر پایگاه دانش از دو زیرسیستم اصلی پایگاه دانش که نشان دهنده واقعیت‌هایی در مورد جهان است و یک ماشین استنتاج که در مورد واقعیت‌ها استنتاج می‌کنند و از قواعد مشخصی برای استنتاج واقعیت‌های جدید استفاده می‌کند ساخته شده است.
 

مهندسی دانش چیست؟

قبل از پرداختن به تفاوت پایگاه انش و پایگاه داده اجازه دهید توضیح مختصری در ارتباط با مهندسی دانش ارائه کنیم. مهندسی دانش، به مجموعه فرایندهای مربوط به طراحی، مهندسی و ایجاد سامانه‌های مبتنی بر دانش اطلاق می‌شود. مهندسی دانش، دارای وجوه مشترک فراوانی با مهندسی نرم‌افزار است، به‌طوری که بیشتر راه حل‌ها و روشهای هریک را می‌توان در دیگری استفاده کرد. علاوه بر آن، زمینه‌های دیگری مثل هوش مصنوعی، پایگاه‌های داده‌ها، کاوش‌های ماشینی در داده‌ها، سامانه‌های خبره، سامانه‌های پشتیبانی تصمیم‌ها و نیز سامانه‌های اطلاعات جغرافیایی را باید در ارتباط نزدیک با مهندسی دانش، به حساب آورد.

 

مهندس دانش کیست؟

مهندس دانش (Knowledge Engineer)، فردی است که در فرایند مهندسی دانش (Knowledge Engineering) تخصص دارد. وی می‌تواند سه فعالیت استخراج، تحلیل و مدلسازی دانش را انجام دهد. این سه فعالیت منجر به تولید یک پایگاه دانش ساخت یافته مبتنی بر مدل‌های دانش با قابلیت استفاده مجدد می‌شود که می‌تواند به عنوان محتوای ورودی در یک سیستم مبتنی بر دانش استفاده شود. در نگاه‌های غیرحرفه‌ای تر مهندس دانش به عنوان نقشی برای اجرای برخی فرایندهای ساده مدیریت دانش تنزل پیدا می‌کند. همگام با مهاجرت سیستم‌های خبره از نمونه‌های اولیه دانشگاهی به سیستم‌های کسب و کار پیاده‌سازی شده مهندسی دانش مورد توجه قرار گرفت که امکان قابل پیش‌بینی بودن و کنترل روی رویه‌های ساخت نرم‌افزار را به عنوان یک اصل و روش‌شناسی توصیف کرد. این تلاش‌ها منجر به شکل‌گیری دو راهکار استفاده از متدولوژی‌های قرار دادی برای توسعه نرم‌افزار و پیاده‌سازی متدولوژی‌های خاصی که با نیازهای ساخت سیستم‌های خبره وفق داده شد.

 

پایگاه دانش و پایگاه داده دو مفهوم متفاوت از یکدیگر:

هدف از پایگاه داده، ذخیره ی داده های بزرگ به صورت جداول داده‌ای است. ۲ نیازمندی اصلی برای ساخت یک پایگاه داده پشتیبانی از چندین کاربر توزیع شده برای دسترسی به یک داده و پشتیبانی از انجام تراکنش‌ها (Transaction) دو حالت انجام قطعی یا بازگشت به حالت قبل است. یک پایگاه دانش، این نیازمندی های طراحی را ندارد، در عوض به داده های ساختار یافته نیاز دارد که ممکن است نشانگر‌هایی به شیی‌های دیگر داشته باشند. قابل ذکر است که نمایش ایده‌آل برای یک پایگاه دانش مدل شیی (Object Model) است که در این مدل، کلاس، زیرکلاس و نمونه وجود دارد. داده‌های پایگاه دانش برای سیستم‌های خبره، برای رسیدن به جواب خاصی استفاده می‌شدند: رسیدن به تشخیص پزشکی، طراحی یک ملکول، رسیدن به پاسخ در موارد اضطراری. از پایگاه دانش برای فهم واقعیت‌ها در مورد جهان استفاده می‌شود. به‌طور مثال جمله همه انسان‌ها فانی‌اند، قابل نمایش در یک پایگاه داده نیست، در عوض یک پایگاه داده اطلاعات هزاران جدول را نگهداری می‌کند که اطلاعاتی در مورد انسان خاصی را نمایش می‌دهند. این پایگاه دانش است که می‌تواند: نشان دهد همه انسان‌ها فانی‌اند و در مورد انسان خاصی استنتاج می‌کند که او فانی است.

 

ارتباط پایگاه دانش و پایگاه داده:

قابل ذکر است که فروشندگان نرم‌افزار‌های پایگاه داده(مثل اوراکل)، امروزه امکاناتی به محصولات خود اضافه کرده‌اند که امکان پشتیبانی از نیازمندی‌های پایگاه دانش مثل قواعد و روابط کلاس-زیرکلاس را فراهم می‌کنند. حتی پایگاه‌های داده شیی‌گرا مثل Versant هستند که از ابتدا برای پشتیبانی از امکانات شیی‌گرایی ساخته شده‌اند که از سرویس‌های استاندارد پایگاه داده پشتیبانی می‌کنند.

 

استدلال خودکار:

استدلال خودکار حوزه‌ای است از علوم کامپیوتر و منطق ریاضی است که مربوط به درک جنبه‌های مختلف استدلال است. استدلال خودکار منجر به تولید برنامه‌هایی می‌شود که کمک می‌کند کامپیوترها به‌طور کامل و مستقل توانایی استدلال داشته باشند. با این تعریف، استدلال خودکار معمولاً شاخه‌ای از هوش مصنوعی است، اما به مقدار زیادی به علوم رایانه نظری و حتی فلسفه مربوط است. در حال حاضر توسعه‌یافته‌ترین زیرشاخه این علم اثبات قضیه خودکار و بررسی برهان خودکار هستند. نرم‌افزارهای اثبات قضیه خودکار قادرند برخی مسائل و قضایای ریاضی را اثبات نمایند و حتی در مواردی موفق به کشف اثبات‌های کوتاه‌تر برای برخی از قضایای ریاضی شده‌اند. استدلال خودکار در حوزه هوش مصنوعی کاربرد فراوان دارد. در واقع می‌توان گفت استدلال خودکار قلب هوش مصنوعی است. زیرا در این حوزه، رایانش برابر است با استنتاج و حل مسئله. گام‌هایی که در استنتاج مسئله طی می‌شود در نهایت منجر به رسیدن به هدف معین می‌شود. پایه ایجاد یک محصول دارای هوش مصنوعی،‌ جمع‌آوری استدلال‌های «اگر - آنگاه» مربوط به جهان اطراف محصول است. امروزه استدلال خودکار در زمینه پایگاه دانش و ذخیره اطلاعات هدفمند و قابل درک انسانی استفاده می‌شود.

 

سیستم پایگاه دانش:

سیستم پایگاه دانش (Knowledge-based systems) برنامه کامپیوتری است که با استفاده از پایگاه دانش، به حل مسائل می‌پردازد. سیستم‌های مختلفی به این نام خوانده می‌شوند ولی اکثر آن‌ها سعی در حل مسائل از راه هستی‌شناسی (ontologies) دارند، به این معنی که آیا رابطه مورد نظر، با توجه به داده‌های موجود، وجود دارد یا خیر.

 

نمایش دانش:

نمایش دانش (Knowledge representation and reasoning) دستیابی به مناسب‌ترین شکل‌ها و شیوه‌های ذخیره‌سازی دانش است؛ هر چند امر نمایش دانش در همه زمینه‌های علمی، همواره اهمیت داشته‌است؛ زمانی که رایانه‌ها بخواهند در کنار انسان، یا به‌جای انسان، به استدلال بپردازند، نقش آن، به سبب دشواری‌های ناشی از مقیاس‌پذیری، حیاتی‌تر و اجتناب‌ناپذیر می‌گردد. معمولاً خواص زیر را برای سیستم‌های نمایش دانش در هر زمینه خاص مطلوب می‌دانیم:

کفایت نمایش‌ها: به قادر بودن سیستم بر نمایش تمامی انواع دانش موجود در زمینهٔ مورد نظر اطلاق می‌شود.

کفایت استنباط‌ها: منظور توانایی سیستم انتخابی نمایش بر کار با ساختارهای نمایشی موجود و ایجاد ساختارهای مناسب جهت نمایش دانش جدیدی ست که استنباط شده است

دانش ساده رابطه‌ای: ساده‌ترین راه برای نمایش واقعیات اعلانی عبارت است از به‌کارگیری مجموعه‌های روابط درست همان‌گونه که در سامانه‌های رابطه‌ای داده‌ها انجام می‌دهیم.

 

هستی‌شناسی در علوم کامپیوتر:

هستی‌شناسی (Ontology) در علوم رایانه و علوم اطلاعات، شامل نمایش، نام‌گذاری صوری و نیز تعریف رده‌ها، تعریف ویژگی‌ها، و تعریف رابطه موجود بین مفاهیم، داده، و موجودیت‌هایی است که ماهیت (یک یا چندین یا تمام) دامنه‌های سخن را تشکیل می‌دهند. اگر بخواهیم ساده‌تر بگوییم، هستی‌شناسی روشی برای نمایش ویژگی‌های حوزه یک موضوع، و شیوه ارتباط آنها، از طریق تعریف یک «مجموعه‌ی شامل مفهوم و رده» برای نمایش آن موضوع است. پایگاه شناخت به عنوان هستان‌شناسی (یا هستی‌شناسی) در علوم اطلاعاتی و علوم محاسباتی شناخته می‌شود که یک ساختار برای ذخیره، بازیابی و به‌اشتراک‌گذاری شناخت است و شناخت عبارتست از درک فردی از دانش یک دامنه. عناصر این ساختار، یک توصیف فرمال از مفاهیم موجود در یک دامنه و روابط و ضوابط بین آن‌ها فراهم می‌آورد. علوم اطلاعات و علوم محاسبات، برای گسترش و کارایی بیشتر و نیز برآورده نمودن نیازهای وب معنایی، نیازمند به ساخت و ایجاد پایگاه شناخت هستند. همچون بسیاری از زمینه‌ها و شاخه‌های دیگر فلسفه، پایگاه شناخت نیز در سایهٔ پیشرفت‌ها و تحوّلات اخیر در علوم اطلاعات، علوم مخابرات و ارتباطات، علوم رایانه، و محاسبات رواج و رونقی تازه و در سطحی گسترده به‌خود گرفته‌است. برای آغاز به ساخت و گسترش وب معنی‌نگر، باید تا حدّ امکان قادر باشیم تمامی موجودات (entities) و مفاهیم (concepts) و نیز روابط و اتّصالات آن‌ها با یک‌دیگر را به صورت مدل‌هایی مجرد به زبان‌هایی که برای رایانه‌ها قابل درک است بیان نماییم. در علوم رایانه این گونه مدل‌های مجرد ماشینی را پایگاه شناخت نامیده‌اند که برآمده از مفاهیم و ایده‌های قدیمی‌تر و ژرف‌تر آن در فلسفه‌است. از جمله زمینه‌هایی که به نحوی چشم‌گیر و فعال به امر طراحی، مهندسی، و ایجاد پایگاه شناخت پرداخته‌اند باید علوم پزشکی، بیوانفورماتیک، و به زبانی همه‌گیرتر علوم حیات (Biosciences) را برشمرد.

 

هستی‌شناسی‌ در وب معنایی:

هستی‌شناسی‌ها توانایی پردازش دانش، به‌اشتراک‌گذاری آن بین عامل‌های مختلف و استفاده مجدد از آن را در محیط وب ایجاد می‌کنند. هستی‌شناسی‌ها چنین توانایی‌هایی را مدیون تعریف و توصیف مفاهیم و موجودات و بیان ارتباط بین آن‌ها به‌صورت رسمی، می‌باشند. با تجزیه و تحلیل محتوای صفحات وب، می‌توان داده‌های موجود در صفحات را به مفاهیم موجود در هستی‌شناسی‌ها نگاشت کرد. چنین عملی باعث بالا بردن درجه همکاری بین انسان و ماشین شده به‌گونه‌ای که ماشین‌ها مستعد به‌عهده گرفتن بسیاری از وظایف انسان می‌شوند. هستی‌شناسی‌ها برای فعالیت سرویس‌های هوشمند، بستر مناسبی فراهم می‌کنند. به عنوان مثال در سرویس‌هایی مانند جستجو هوشمند در وب، فیلترهای اطلاعاتی، یکپارچه‌سازی هوشمند اطلاعات و مدیریت دانش، استفاده از هستی‌شناسی‌ها می‌تواند بسیار کارساز باشد. با توجه به کثرت اطلاعات موجود در وب، در اغلب راهبردها سعی می‌شود که فرایند معنایی کردن صفحات کنونی وب به‌طور خودکار انجام شود. در این راهبردها سعی می‌شود تا با به‌خدمت گرفتن ابزار مناسب و استفاده از تکنیک‌های پردازش زبان طبیعی، صفحات کنونی وب با توصیف فراداده‌های مبتنی بر هستی‌شناسی، حاشیه‌نویسی شوند.

 

گراف دانش یک نمونه روشن از پایگاه دانش:

گراف دانش (Knowledge Graph) یک پایگاه دانش است که توسط گوگل و سرویس‌های گوگل، برای بهبود کیفیت نتایج موتور جستجوی آن استفاده می‌شود، این کار از طریق جمع‌آوری اطلاعات از منابع متفاوت انجام می‌شود. اطلاعات گراف دانش در یک جعبه اطلاعات (infobox)، در کنار نتایج جستجو برای کاربران نمایش می‌یابد. اطلاعات موجود در گراف دانش، پس از راه‌اندازی به صورت قابل توجهی رشد کرد و در مدت سه ماه سه برابر شد (شامل ۵۷۰ میلیون ورودی و ۱۸ میلیارد واقعیت). این ابزار «تقریباً یک سوم» از ۱۰۰ میلیارد جستجوی ماهانه‌ای را که گوگل در ماه مه ۲۰۱۶ پردازش کرد را پاسخ می‌داد. اما گراف دانش یک ایراد مهم دارد و آن هم این است که به پاسخ‌هایی که ارائه می‌دهد بدون منبع و مدرک موثق می‌باشد. اطلاعات از گراف دانش در یک جعبه، که گوگل به آن پنل دانش (knowledge panel) می‌گوید نمایش می‌یابد، و گوگل آن‌را در سمت راست (سمت چپ در زبان فارسی و بالا در موبایل) برای نتایج جستجو نشان می‌دهد. بر اساس اعلام گوگل، این اطلاعات از منابع زیادی بازیابی شده‌اند، که شامل اطلاعات‌نامه جهان، ویکی‌داده، و ویکی‌پدیا می‌شوند. در ماه اکتبر ۲۰۱۶ گوگل اعلام کرد که گراف دانش بیش از ۷۰ میلیارد واقعیت را نگهداری کرده ‌است. با این‌حال، هیچ مستندات رسمی درباره تکنولوژی که برای پیاده‌سازی گراف دانش استفاده شده‌است، وجود ندارد. اطلاعات گراف دانش برای پاسخگویی، به سوالات کلامی و درخواست‌های صوتی، در دستیار گوگل و گوگل هوم استفاده می‌شود. بر پایه اطلاعات گزارش شده از سوی گوگل اطلاعات گراف دانش تا ۳۰ ژوئن ۲۰۱۵ از منابع بسیاری گرفته می‌شد که شامل اطلاعات‌نامه جهان, فری‌بیس بود و بعد از آن از ویکی‌داده و ویکی‌پدیا استفاده می‌شود. در اوت ۲۰۱۴ گوگل اعلام کرد که اطلاعات گراف دانش را گوگل با الگوریتم‌های هوش مصنوعی استخراج می‌کند که حدود ۱٫۶ میلیارد اطلاعات را شامل می‌شود. همچنین در ۱۶ دسامبر ۲۰۱۴ گروه گراف دانش و فری‌بیس اعلام کردند که اطلاعاتشان را به ویکی‌داده انتقال داده‌اند و فری‌بیس در اواخر ۲۰۱۵ از دسترس خارج می‌شود. یکی از ویژگی‌های گراف دانش این است که قابلیت کنترل توسط اشخاص و سازمان‌هایی است که گراف دانش دارند برای این کار باید گراف دانش خود را پیدا و تأیید کنند تا کنترل آن را در اختیار داشته باشند.  زمانی که یک گراف دانش تأیید می‌شود یک تیک آبی کنار عکس تعریف شده قرار می‌گیرد که مشخص کننده تحت مدیریت بودن آن است

 

ویژگی‌های گراف دانش تأیید شده:

زمانی که یک گراف دانش را تأیید کنید آن را در اختیار خواهید داشت و می‌توانید تنظیماتی روی آن اعمال کنید که روی نمایش اطلاعات شما در گوگل تأثیر خواهد گذاشت. از مهم‌ترین تغییراتی که می‌توان روی گراف دانش پس از در اختیار داشتن آن اعمال کنید به مواردی همچون توانایی تنظیم عکس برای نمایش در عنوان جستجو، توانایی تنظیم عکس و نماد بر روی گراف دانش، لینک کردن شبکه‌های اجتماعی بر روی گراف دانش و حذف آن‌ها و تغییر نام گراف دانش اشاره کرد. همچنین این امکان وجود ندارد تا روی گراف دانش تغییراتی همچون لینک کردن صفحه ویکی‌پدیا بر روی گراف دانش و تنظیم بخش پیشنهادها دیگران این موارد را هم جستجو کرده‌اند اعمال کرد. زمانی که یک گراف دانش تأیید می‌شود یک لینک مخصوص به او اختصاص داده می‌شود که با https://posts.google.com/ و شناسه گراف دانش بعد از / تعریف می‌گردد.

 

چرا برخی از کارشناسان به گراف دانش ایراد می‌گیرند؟

کاربران نمی‌توانند اطلاعات را تأیید کنند و عقایدی و دانشی که به دست می‌آورند نمی‌تواند آگاهانه باشد. این اطلاعات به صورت معمول منبع موثق ندارند. گراف دانش مبنای ویکی‌پدیا است و باعث شده‌ تا خوانندگان آن کاهش یابد، زیرا هدف از گراف دانش پیاده‌سازی پاسخ‌گویی به سوالات مستقیم در نتایج جست‌وجوی گوگل است.

 

 

پایگاه دانش را در تا بی نهایت تجربه کنید!

 

☎ 02144671862
📣 Telegram & WhatsApp: 09981008658

📧Info@TaBinahayat.com