فرمت فایل: ورد –Word و قابل ویرایش
تعداد صفحات: 177
با ظهور وب، داده ها و اطلاعات زیادی در موضوعات مختلف در اختیار همگان
قرار گرفتـ ه اسـت . ایـنداده ها که اکثرا در قالب فایل های HTML ارائه شده
اند، فرصت مناسـبی را در اختیـار کـاربران وب قـرارداده تا بتوانند با
جستجوی کلمات کلیدی مناسب به داده های مورد نیاز خود دسـت یابنـد. امـا
امـروزه بـاوجود انبوهی از اطلاعات گوناگون در وب، جستجو بر اساس کلمات
کلیدی، ما را به تعداد زیادی صفحه وب می رساند که یافتن اطلاعات مورد نیاز
در آن دشوار و زمانبر است. وب معنایی جهت رفع مـشکلاتی از ایـنقبیل به
عنوان نسل جدید وب جاری، توسط آقای تیم برنرز لی [1] معرفی شد.
وب معنایی به عنوان شاخه جدیدی از وب جاری لازم دارد تـا بـه اطلاعـات
موجـود در وب دسترسـیداشته باشد . اما اطلاعات موجود در وب جهت نمـایش آن
بـه انـسان هـا سـازماندهی شـده انـد. لـذا بـرای استخراج اقلام اطلاعاتی
از ابزاری بنامWrapper استفاده می شـود . در ایـن نوشـته بـر اسـتخراج از
منـابع اطلاعاتی تمرکز می کنیم و استخراج اطلاعات مبتنی بر یک Crawler که
با استفاده از یک آنتالوژی دامنه به شناسایی اقلام اطلاعاتی می پردازد را
پیشنهاد می کنیم.
کلمات کلیدی : وب معنایی، حاشیه گذاری معنایی، آنتالوژی، RDF، بازیابی اطلاعات، Wrapper.
فهرست مطالب
1 – مقدمه ................4
2 - معرفی وب معنایی..............8
2 – 1 - مشکلات وب موجود 9
2 - 2 - نیاز به بازنمایی دانش ............. 10
2 – 3 – آشنایی با اجزای اساسی وب معنایی .....12
2 – 4 - معماری وب معنایی ................14
2 – 5 – آشنایی با خانواده استاندارد های XML................ 17
21......... (Resource Description Framework) RDF آشنایی با – 6 – 2
24.........RDF Schema (RDFS) آشنایی با – 7 – 2
26........... ها Taxonomy معرفی – 8 – 2
2 – 9 – معرفی طیف آنتالوژی............30
2 – 10 – معرفی آنتالوژی ...34
2 – 11 – توصیف منطقی آنتالوژی ها 35
2 – 12 – سطوح بازنمایی دانش......... 37
2 – 13 – مشکل نگاشت معنایی .......38
2 – 14 – خلاصه مطالب .....39
3 – مدیریت دانش و بازیابی اطلاعات..... 41
3 – 1 – بررسی مشکل........41
3 – 2 – نقش آنتالوژی ها ..42
3 – 3 – معرفی معماری Sesame........43 3 – 4– بازیابی اطلاعات برای وب معنایی..........45
3 – 5 – جمع بندی مطالب48
4 – بررسی فعالیت های انجام شده در زمینه استخراج اطلاعات.............. 49
50 ............WEBOQL – 1 – 4
52.... (World Wide Web Wrapper Factory) W4F – 2 – 4
53OntoKnowledge – 3 – 4
56............OntoPrise – 4 – 4
57.... KIM – 5 – 4
59.........OntoGather – 6 – 4
60..........BYU-Ontos – 7 – 4
4 – 8 – جمع بندی مطالب .61
5 – ارائه یک چارچوب جهت بازیابی اطلاعات ........62
5 – 1 – تحلیل مساله بازیابی اطلاعات................62
5 – 2 – استخراج اطلاعات صریح و اطلاعات ضمنی ..........64
5 – 3 – مقاومت در برابر تغییرات منابع.............65
5 – 4 – معرفی چارچوب پیشنهادی..66
5 – 5 – فعالیت های بعدی 70
مراجع ...72
72.......[Intoduction to Semantic Web]
72.........[Semantic Web Languages References]
73...[Knowledge Management & Information Retrieval]
72.............[Others]
1 – مقدمه
در این بخش به بررسی مشکل وب جاری پرداخته و وب معنایی را به عنوان یک
راه حل معرفـی مـیکنیم. سپس یکی از چالش های موجود در وب معنایی را تشریح
کرده و محدوده بحث خود را مشخص میکنیم.
مشکل وب کنونی
با توجه به رشد روز افـزون وب و بـا وجـود 400 میلیـون وب سـایت [16] و
چنـدین میلیـارد منـابعاطلاعاتی (شامل صفحاتHTML ، فایل های صوتی و
ویدئویی، تـصاویر فایـل هـایRSS ،XML و غیـره )، عملا وب جاری به یک
کتابخانه بزرگ از منابع و اطلاعات مختلف تبدیل شده است.
شکل 1 : نمودار رشد سایت های اینترنتی [16]
موتور های جستجوگر مانند گوگل و یاهو و غیره، به کاربران خود امکـان
جـستجو بـر اسـاس کلمـاتکلیدی مشخص را می دهند. اما بزرگترین مشکل در
ارتباط با این شیوه جستجو، که به آن جستجوی کـورهم گفته می شود، یافتن
کلمات کلیدی مناسب می باشد. البتـه نبایـد فرامـوش کنـیم کـه وب بـ ا
همـینوضعیت موجود نیز یک موفقیت بزرگ به حساب می آید . تا ده سال پیش، هرگز
کسی فکر آن را نمی کردکه روزی اینترنت بتواند تا این حد در شیوه زندگی
انسان ها، اخبار و اطلاع رسانی، ارتباطات و غیـره تـاثیربگذارد.
اما از طرفی دیگر، وب موجود، دارای یک مشکل اساسی می باشد. می توان گفت
که چالش اساسی در ارتباط با وب آن است که منابع موجود تنها برای انسان ها
قبل فهم و استفاده می باشد. بنابراین ماشین هـادر جستجو، اشتراک و یکپارچه
سازی انبوهی از اطلاعات، محـدودیت هـای زیـادی دارنـد. در حـال حاضـرماشین
ها جهت شناخت محتوی و اطلاعات موجود در وب، نیاز به دانش انسانی دارند و
بدون آن تنهـا مـیتوانند کورکورانه، وجود یا عدم وجود یک کلمه کلیدی را
مشخص نمایند.
وب معنایی
ایده توسعه وب جاری با تزریق مقداری اطلاعات تکمیلی ، بگونه ای که
اطلاعات موجود قابل فهم برایماشین ها باشد، برای اولین بار توسط آقای تیم
برنرز لی مطرح گردید [1و2]. ایشان نسل جدیـدی از وبجاری را با نام وب
معنایی معرفی کردند و هدف
|