تعداد صفحات:137
نوع فایل:word
فهرست مطالب:
مقدمه
مفاهیم پایه
XML چیست؟
معرفی اجزا اصلی XML
مدل درختی XML
مفهوم شما در XML
انواع زبانهای کوئری در XML
رابطه XML و پایگاه دادهها
پایگاه دادههای مبتنی بر XML
پایگاه دادههای پشتیبان XML
مقدمه ای بر نحوه پردازش پرس و جوها
مروری بر کارهای انجام شده
روش حلقه های تودرتو
روش Structural Join
روش StairCase Join
روش Holistic Twig Join
روش TJFast
روش هایی مبتنی بر شاخص های مسیری
کاستیهای موجود در روشهای پردازش کوئری
روش پیشنهادی
طرح مسئله
روش شماره گذاری سند
مدل سه مرحله طرح جدول شاخص
راهنمای پرس وجو
انتخاب شاخص مسیری
نقطه اتصال
تجزیه پرس وجو
مرحله اول) اجرای کوئری بر روی راهنمای تطابق الگو
مرحله دوم) تولید جدول شاخص
مرحله سوم) تولید نتایج نهایی
کاربرد جدول شاخص در کوئری های پیچیده
نقاط اتصالی با بیش از دو زیر شاخه
کوئری هایی با بیش از دو نقطه اتصال
کوئری هایی با عملگرهای مختلف
نمایش سمبولیک جدول شاخص
بهینه سازی جدول شاخص از روی شمای سند
ارزیابی روش جدول شاخص
توسعه روش جدول شاخص
کاربرد روش در پاسخ به عملگرهای نقیض
کاربرد جدول شاخص در پرش از روی گره های بی فایده
کاربرد جدول شاخص روی برگ های شاخص شده
پیاده سازی و ارزیابی
محیط پیاده سازی و معیارهای مقایسه
مقایسه با روش های مشابه
نتیجه گیری و کارهای آینده
نتیجه گیری
کارهای آینده
منابع
فهرست اشکال و جداول:
ساختار درختی یک سند
یک نمونه TPQ
نمونهای از یک سند داده
مقایسه دو لیست برای پی بردن به رابطه ما بین گرهها
نحوه شماره گذاری درخت
شبه کد الگوریتم Tree- Merge-Anc
روش شماره گذاری پسوندی و پیشوندی
پیوند پلکانی
روش شماره گذاری در TJFast
یک نمونه FST
نمونهای از کد گذاری Dewey
روش سه مرحله ای جدول شاخص
یک نمونه نقطه اتصال
یک نمونه جدول شاخص
مراحل حذف پیچیدگی پرس و جوهای چند شاخه ای
یک نمونه IT_Model
یک نمونه از نقطه استخراج
عملگر AND میان گرههای یک نمونه TPQ
یک نمونه عملگر NOT
یک نمونه کوئریی دو شاخه ای Q4
عملگر NOT در کوئریهای دو شاخه ای
حذف دادهها در کوئری های دوشاخهای با عملگر NOT
تعداد گرههای خوانده شده
مقدار فضای برده شده در حافظه اصلی
زمان اجرا
تعداد گرههای پردازش شده
کوئری های تک شاخهای
کوئری های چند شاخهای
کوئری هایی با عملگر نقیض
مشخصات دیتاستها معروف
مشخصات جدول رندوم دیتاست
اندازه کد گذاری Dewey
کوئری های اجرا شده روی IT و TJFast
کوئری های اجرا شده روی T2S
چکیده:
امروزه XML به یکی از قالبهای مهم برای ذخیره و تبادل دادهها تبدیل شده
است. انعطاف ساختار XML موجب گسترش استفاده از آن گردیده و حجم اسناد XML
روز به روز در حال افزایش است. در نتیجه به منظور مدیریت اسناد XML نیاز به
یک سیستم مدیریت جامع میباشد؛ زیرا سیستم مدیریت فایلی توانایی مدیریت
چنین حجمی از دادهها را ندارد. با رشد چشمگیر این پایگاههای داده نیاز
به تسریع در عملیات اجرای کوئری ها حس می شود. بیشتر محققان به این جنبه
XML پرداختهاند و روش های زیادی در این زمینه ارائه شده است. اما از
آنجایی که ساختار XML با ساختار رابطه ای قدیمی بسیار متفاوت است، اصولا
این روش ها ناکارآمد هستند و بهصورت یک استاندارد پذیرفته نشدهاند، از
این رو تلاش محققان برای حل این مشکل دو چندان شده است. تاکنون روشهای
زیادی برای حل این مشکل در دنیای XML ارائه شدهاند، اما هر روش تنها به
جنبهای از نواقص پرداخته و تنها برای دسته کوچکی از کوئری ها کارایی دارد
در نتیجه برای قسمت عمده کوئریها ناکارآمد است. در نتیجه هنوز روش خاصی به
عنوان یک استاندارد، مانند SQL در پایگاه دادههای رابطهای سنتی، وجود
ندارد و میتوان گفت هنوز استفاده از XML به مرحله بلوغ و بهرهبرداری کامل
نرسیده است.
دراین پایان نامه ما به دنبال روشی هستیم که برای دسته بزرگی از کوئری ها
کارآیی لازم را داشته باشد. روشی که در مقایسه با روشهای مشابه تعداد
گرههای کمتری را مورد دستیابی قرار داده و در زمان کمتری به پاسخ برسد.
روشی که قابلیت تلفیق با شاخص روشهای مشابه را داشته و بتواند از آنها
برای تسریع کوئری ها استفاده نماید. ما به دنبال روشی هستیم که قابلیت پرش
از روی گرههای بیفایده را داشته باشد و دادههای میانی کمتری در مقایسه
با روشهای مشابه تولید نماید. روشی که با استفاده از یک راهنمای تطابق
الگو، به طور مستقیم و کورکورانه به پردازش گرهها در سند نپردازد.