دانلود پایان نامه روش جدید نگاشت کلمات کلیدی به مفاهیم و مکانیسمی برای بهبود نمایش کاربر در وب سایت

توضیحــات تاریخ ارسال : (آبان ۲, ۱۳۹۴)

 

پایان نامه کارشناسی ارشد رشته مهندسی کامپیوتر گرایش نرم افزار روش جدید نگاشت کلمات کلیدی به مفاهیم و مکانیسمی برای بهبود نمایش کاربر در وب سایت

 

چکیده

 

گرانبار شدن اطلاعات یک مشکل عمده در وب کنونی به شمار می-رود. برای مقابله با این مشکل، سیستم های شخصی سازی وب ارائه شده اند که محتوا و سرویس های یک وب سایت را با افراد براساس علایق و رفتار گردشی آن ها سازگار می کنند. یک مولفه ی اساسی در هر سیستم شخصی سازی وب، مدل کاربر آن است. محتوای صفحات یک وب سایت را می توان به منظور ایجاد مدل دقیق تری از کاربر مورد استفاده قرار داد، اما رویکردهای مبتنی بر کلمات کلیدی نگرش عمیقی از وب سایت ندارند. اخیرا تحقیقاتی برای ترکیب کردن معنای موجود در وب سایت در نمایش کاربران آن انجام شده است.

 

تمامی این تلاش ها یا از یک رده بندی یا واژگان شناختی خاص و دست ساخته و یا از واژگان شناختی های عمومی مانند WordNet برای نگاشت مشاهده صفحات به عناصر معنایی استفاده می کنند. با این وجود ساختن یک سلسله مراتب از مفاهیم بصورت دستی زمان بر و هزینه بر است. از سوی دیگر منابع معنایی لغوی عمومی از پوشش کم عبارات خاص دامنه رنج می برند. در این پایان نامه ما قصد داریم که هر دوی این نقص ها را برطرف کنیم. دستاورد اصلی ما این است که مکانیسمی برای بهبود نمایش کاربر در وب سایت بصورت خودکار و با استفاده از یک منبع معنایی لغوی جامع معرفی می کنیم.

 

ما از Wikipedia، بزرگ ترین دایره المعارف امروزی به عنوان یک منبع غنی معنایی برای بهبود ساخت خودکار مدل برداری از علایق کاربر بهره برداری می کنیم. معماری ارائه شده شامل تعدادی مولفه است که عبارتند از: پیش پردازش اولیه، استخراج مفاهیم دامنه ی وب سایت، استخراج کلمات کلیدی از وب-سایت، سازنده ی بردار کلمات کلیدی و نگاشت کلمات کلیدی به مفاهیم. دستاورد مهم دیگر استفاده از ساختار وب سایت برای محدود کردن خودکار مفاهیم خاص دامنه می باشد. سرانجام، آخرین دستاورد آن یک روش جدید نگاشت کلمات کلیدی به مفاهیم است. ارزیابی های ما نشان می دهد که روش پیشنهادی همراه با منبع معنایی لغوی جامع آن کاربران را بصورت موثرتری نسبت به روش کلمات کلیدی و نیز روش های بر مبنای WordNet نمایندگی می کند.

 

کلمات کلیدی:
مدلسازی کاربر
کاوش Wikipedia
تکنیک های معنایی
شخصی سازی وب

 

نتایج حاصل از پروژه

 

مدل کاربر به عنوان یکی از اصلی ترین مولفه های سیستم شخصی سازی وب، اهمیت فراوانی دارد. چنانچه هر چه این مدل بصورت بهتری ساخته شود، توصیه هایی که بر مبنای آن انجام می شود دقیق تر و عمیق تر خواهد بود. هدف از انجام این پروژه ارائه ی روشی برای بهبود مدل کاربر در وب سایت با استفاده از معنای موجود در صفحات بصورت خودکار است و مطلوب است که مدل کاربر بصورت ضمنی (یعنی بدون دخالت مستقیم او) ساخته شود. برای این امر، از یک منبع معنایی لغوی غنی یعنی Wikipedia استفاده شد.

 

روش پیشنهادی از این قرار است که ابتدا مفاهیم دامنه ی سایت بصورت خودکار و با استفاده از URL صفحات از Wikipedia استخراج می شوند و سپس کلمات کلیدی صفحات مرور شده توسط کاربر با استفاده از Wikipedia بدست می آیند و از روی آن-ها بردار کلمات کلیدی ساخته می شود. در محاسبه ی وزن یک کلمه ی کلیدی در این بردار، مدت زمان صرف شده توسط کاربر بر روی صفحه ی متناظر با آن کلمه اثر مستقیم دارد. سپس کلمات کلیدی توسط مولفه ی نگاشت به مفاهیم حاصل از مرحله ی اول نگاشته می شوند. نتایج حاصل از ارزیابی نشان می دهد که روش پیشنهادی دقت و یادآوری بهتری نسبت به روش کلمات کلیدی و نیز استفاده از WordNet دارد

 

فهرست

 

۱- مقدمه ۹

 

مقدمه ۱۳
۱-۱- دلایل نیاز به شخصی سازی وب ۱۳
۱-۱-۱- گرانبار شدن اطلاعات ۱۳
۱-۱-۲- نیاز به جذب مشتری پابرجای برای وب سایت ۱۴
۱-۲- تعریف شخصی سازی وب ۱۴
۱-۳- فواید سیستم شخصی سازی وب ۱۴
۱-۴- تفاوت شخصی سازی وب با تطبیق طرح کلی سایت ۱۵
۱-۵- طبقه بندی عملکردهای اصلی شخصی سازی وب ۱۵
۱-۶- نیازمندیهای اصلی سیستم شخصی سازی وب ۱۶
۱-۷- رویکرد های موجود در شخصی سازی وب ۱۷
۱-۸- نقش وب کاوی کاربرد وب در شخصی سازی وب ۱۸
۱-۹- نیاز به استفاده از محتوا در شخصی سازی وب ۱۹
۱-۱۰- نیاز به استفاده از معنا در شخصی سازی وب ۱۹
۱-۱۱- هدف پروژه ۲۱
۱-۱۲- نحوه ی گردآوری مراجع ۲۱
۱-۱۳- رویکرد بکار رفته در تحقیق ۲۱
۱-۱۴- ساختار پایان نامه ۲۲
مراجع ۲۲

 

۲- مطالب پیش زمینه ۲۵

 

مقدمه ۲۵
۲-۱- شخصی سازی وب براساس وب کاوی کاربرد وب ۲۵
۲-۱-۱- آماده سازی و مدلسازی داده ۲۸
۲-۱-۱-۱- منابع و انواع داده ۲۹
۲-۱-۱-۱-۱- داده های کاربرد ۲۹
۲-۱-۱-۱-۱-۱- فرمت های ثبت ۳۰
۲-۱-۱-۱-۱-۲- منابع داده های کاربرد ۳۲
۲-۱-۱-۱-۲- داده های محتوا ۳۶
۲-۱-۱-۱-۳- داده های ساختار ۳۷
۲-۱-۱-۱-۴- داده های کاربران ۳۷
۲-۱-۱-۲- آماده سازی و پیش پردازش داده ها ۳۸
۲-۱-۱-۲-۱- پاکسازی داده ها ۳۸
۲-۱-۱-۲-۲- شناسایی کاربر ۴۰
۲-۱-۱-۲-۳- تشخیص مشاهده صفحه ۴۱
۲-۱-۱-۲-۴- تشخیص جلسه ی کاربر ۴۲
۲-۱-۱-۲-۵- تکمیل مسیر ۴۳
۲-۱-۱-۲-۶- تشخیص تراکنش ۴۴
۲-۱-۱-۲-۷- پیش پردازش نهایی داده های کاربرد ۴۶
۲-۱-۱-۲-۸- یکپارچه سازی داده ها از منابع گوناگون ۴۷
۲-۱-۲- کشف الگو از داده های کاربرد وب ۴۸
۲-۱-۲-۱- سطوح و انواع تحلیل ۴۸
۲-۱-۲-۲- وظایف داده کاوی بر روی داده های کاربرد وب ۴۹
۲-۱-۲-۲-۱- کاوش قواعد انجمنی ۵۰
۲-۱-۲-۲-۲- کشف الگوهای ترتیبی ۵۲
۲-۱-۲-۲-۳- خوشه بندی ۵۷
۲-۱-۳- استفاده از الگوهای کشف شده جهت شخصی سازی وب ۶۱
۲-۱-۴- زمینه های تحقیقاتی شخصی سازی وب ۶۱
۲-۲- منابع معنایی لغوی ۶۳
۲-۲-۱- فرهنگ لغت ۶۳
۲-۲-۲- فرهنگ های جامع ۶۳
۲-۲-۳- واژگان شناختی و رده بندی ۶۴
۲-۲-۳-۲- رده بندی ۶۷
۲-۲-۳-۳- واژگان شناختی ها و رده بندی های موجود ۶۷
۲-۲-۳-۳-۱- واژگان شناختی های مربوط به یک دامنه ی خاص ۶۸
۲-۲-۳-۳-۲- واژگان شناختی های عمومی ۶۸
۲-۲-۳-۳-۲-۱- CYC و OpenCYC 68
۲-۲-۳-۳-۲-۲- WordNet 68
۲-۲-۳-۳-۲-۳- دایرکتوری های وب ۷۰
۲-۲-۳-۴- زبان های نمایش واژگان شناختی ۷۱
۲-۲-۴- فرهنگ های عمومی ۷۲
۲-۲-۴-۱- Wikipedia 72
۲-۲-۴-۱-۱- نقاط ضعف و قوت Wikipedia 74
۲-۲-۴-۱-۲- ساختار Wikipedia 75
۲-۲-۴-۱-۳- انواع اطلاعات معنایی لغوی در Wikipedia 76
۲-۲-۵- نتیجه گیری ۷۸
مراجع ۸۰

 

۳- کارهای انجام شده در زمینه مدلسازی کاربر در شخصی سازی وب با استفاده از محتوای وب ۸۵

 

مقدمه ۸۵

 

۳-۱- تکنیک های مورد استفاده ۸۶
۳-۱-۱- تکنیک tf-idf 86
۳-۱-۲- تکنیک تحلیل معنایی پنهان ۸۶
۳-۱-۳- تکنیک های مربوط به محاسبه ی ارتباط معنایی دو کلمه ۸۷
۳-۱-۳-۱- معیارهای ارتباط معنایی مهم در ساختارهای سلسله مراتبی ۸۷
۳-۱-۳-۱-۱- رویکردهای مبتنی بر مسیر ۸۸
۳-۱-۳-۱-۲- رویکردهای مبتنی بر محتوای اطلاعات ۸۸
۳-۱-۳-۱-۳- رویکردهای مبتنی بر همپوشانی متن ۸۹
۳-۱-۳-۲- رویکردهای محاسبه ی ارتباط معنایی دو کلمه برای روابط غیر رابطه ی هست ۸۹
۳-۱-۳-۳- کارهای انجام شده در مورد محاسبه ی ارتباط معنایی دو کلمه در Wikipedia 90
۳-۲- رویکردهای انجام شده در زمینه ی مدلسازی کاربر در وب سایت با استفاده از محتوای صفحات ۹۱
۳-۲-۱- رویکردهای بر مبنای کلمات کلیدی ۹۲
۳-۲-۲- رویکردهای معنایی ۹۲
۳-۲-۲-۱- روش های آماری ۹۳
۳-۲-۲-۲- روش های مبتنی بر سلسله مراتب ۹۴
جمع بندی ۱۰۰
مراجع ۱۰۱

 

۴- روش پیشنهادی ۱۰۶

 

مقدمه ۱۰۶
۴-۱- تعریف مساله ۱۰۶
۴-۲- طراحی روش جدید ۱۰۶
۴-۲-۱- مولفه ی پیش پردازش اولیه ی ثبت ۱۰۷
۴-۲-۲- مولفه ی استخراج کلمات کلیدی از صفحات وب سایت ۱۰۷
۴-۲-۳- مولفه ی استخراج مفاهیم دامنه از وب سایت ۱۱۱
۴-۲-۴- مولفه ی سازنده ی بردار کلمات کلیدی ۱۱۳
۴-۲-۵- مولفه ی نگاشت ۱۱۵
۴-۶- دیاگرام های UML قسمت های اصلی سیستم ۱۱۷
۴-۷- بررسی تطابق طرح پیشنهادی با صورت مساله ۱۱۷
جمع بندی ۱۱۹
مراجع ۱۱۹

 

۵- جزئیات پیاده سازی ۱۲۱

 

مقدمه ۱۲۱
۵-۱- مولفه ی پیش پردازش اولیه ی ثبت ۱۲۱
۵-۱-۲- نحوه ی دریافت ثبت وب سرور ۱۲۱
۵-۲- مولفه ی استخراج کلمات کلیدی از صفحات وب سایت ۱۲۳
۵-۳- مولفه ی استخراج مفاهیم دامنه از وب سایت ۱۲۵
۵-۴- مولفه ی سازنده ی بردار کلمات کلیدی ۱۲۵
۵-۵- مولفه ی نگاشت ۱۲۵
۵-۶- پیاده سازی آزمایشات ۱۲۵
جمع بندی ۱۲۶
مراجع ۱۲۶

 

۶- ارزیابی روش پیشنهادی ۱۲۹

 

مقدمه ۱۲۹
۶-۱- مجموعه داده ها ۱۲۹
۶-۲- پارامترهای ارزیابی ۱۳۰
۶-۳- بررسی درستی مولفه های سیستم ۱۳۱
۶-۴- آزمایشات انجام شده ۱۳۱
۶-۴-۱- سخت افزار مورد استفاده ۱۳۲
۶-۴-۲- نتایج آزمایشات ۱۳۲
۶-۴-۳- تحلیل نتایج آزمایشات ۱۳۲
جمع بندی ۱۳۳
مراجع ۱۳۳

 

۷- نتیجه گیری و کارهای آینده ۱۳۶

 

مقدمه ۱۳۶
۷-۱- نتایج حاصل از پروژه ۱۳۶
۷-۲- دستاوردهای پروژه ۱۳۶
۷-۳- کارهای آینده ۱۳۷
مراجع ۱۳۹
واژه نامه ۱۴۵

 

فهرست شکل ها

 

شکل ۲-۱- مولفه های برون خطی آماده سازی داده و کشف الگو ۲۳
شکل ۲-۲- مولفه برخط شخصی سازی وب ۲۴
شکل ۲-۳- تراکنش HTTP 25
شکل ۲-۴- URL و URI 26
شکل ۲-۵-  مکان های جمع آوری داده های کاربرد وب ۲۸
شکل ۲-۶- مثالی از مدل کردن رفتار گردشی کاربر با زنجیره ی مارکف ۵۱
شکل ۲-۷- مثالی از مدل کردن رفتار گردشی در یک درخت تجمعی ۵۳
شکل ۲-۸- مثالی از استخراج پروفایل های تجمعی کاربرد از خوشه های تراکنش ها ۵۵
شکل ۲-۹- بخشی از زمینه های تحقیقاتی شخصی سازی وب ۵۸
شکل ۲-۱۰- نمونه ای از واژگان شناختی ۶۱
شکل ۲-۱۱- نمونه ای از یک رده بندی ۶۳
شکل ۳-۱- استفاده از SVD برای تجزیه ماتریس D * T 83
شکل ۳-۲-  مفسر معنایی سیستم ESA 87
شکل ۳-۳- ماتریس SESSION-PAGE VIEW 89
شکل ۳-۴- تولید C-LOG 93
شکل ۴-۱- معماری کلی سیستم پیشنهادی ۱۰۳
شکل ۴-۲- جزئیات مولفه ی استخراج کلمات کلیدی ۱۰۵
شکل ۴-۳- شبه کد مولفه استخراج کلمات کاندیدا ۱۰۶
شکل ۴-۴- شبه کد مولفه رتبه بندی کلمات کاندیدا ۱۰۶
شکل ۴-۵- جزئیات مولفه ی استخراج مفاهیم دامنه ۱۰۷
شکل ۴-۶- شبه کد بخش فیلتر کردن کاندیدا ۱۰۸
شکل ۴-۷- شبه کد مولفه سازنده بردار کلمات کلیدی ۱۱۰
شکل ۴-۸- شبه کد مولفه ی نگاشت ۱۱۱
شکل ۴-۹- CLASS DIAGRAM مولفه های اصلی سیستم ۱۱۳
شکل ۴-۱۰- SEQUENCE DIAGRAM بخش اصلی سیستم ۱۱۴

 

فهرست جدول ها

 

جدول ۲-۱- مثال هایی از ارتباطات لغوی در WORDNET 66
جدول ۲-۲- منابع اطلاعات معنایی لغوی در WIKIPEDIA 73
جدول ۲-۳- مقایسه ی انواع منابع معنایی لغوی جهت استفاده در شخصی سازی وب ۷۴
جدول ۴-۱- بردارهای کلمات کلیدی صفحات وب سایت مثال۱ ۱۱۰
جدول ۴-۲- بردارهای کلمات کلیدی جلسه ی داده شده در مثال۱ ۱۱۰
جدول ۴-۳- کلمات کلیدی و وزن های فرضی آنها در مثال ۲ ۱۱۲
جدول ۴-۴- مفاهیم موجود در صفحات جلسات کاربر به همراه وزن های آنها در مثال ۲ ۱۱۲
جدول ۵-۱- ساختار دستور CUSTOMLOG 117
جدول ۵-۲- ساختار دستور LOGFORMAT 117
جدول ۶-۱- نتایج آزمایشات انجام شده بر روی ۱۰۰ جلسه ی تصادفی ۱۲۸

 

قیمت فایل ۱۳۵,۰۰۰ تومان

 

خرید آنلاین پایان نامه کارشناسی ارشد رشته مهندسی کامپیوتر گرایش نرم افزار روش جدید نگاشت کلمات کلیدی به مفاهیم و مکانیسمی برای بهبود نمایش کاربر در وب سایت

 

توجه : تمام مقالات و پایان نامه و پروژه ها به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد.

 

جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید.

افزودن نــسخه صوتی

افـــزودن تصویر

افزودن برچسب

کتاب های مرتبط

پرفروش ترین کتاب ها

دانلود کتاب بهترین سال زندگی تو

کتاب بهترین سال زندگی تو روشی اثبات شده برای رسیدن به اهداف بزرگ در این کتاب، نشان‌تان می‌دهم که چگونه در چند ماه به چیزی برسید که بقیه در کل زندگی به آن می‌رسند. اگر انگیزه و شور فراوان برای دوباره طراحی‌کردن آینده‌تان دارید، این برنامه برای شماست. هر وقت از من درباره‌ی مهارت شماره‌ی […]

52 فروش
37,000 ریال
52 فروش

دانلود کتاب زن بودن نوشتۀ تونی گرنت

کتاب زن بودن رویکردی استثنایی نسبت به زنانگی ترسیم می‌کند. به زنان چهارچوب ذهنی صحیحی برای پیوند خوردن با مرد می‌دهد و به تفاوت‌های روانشناسانه و بیولوژیکی میان جنسیت‌ها می‌پردازد و حاوی مباحثی است که مخاطب آن فقط زنان نیستند، آگاهی تمامی زنان و مردان از مباحث این کتاب ضرورت امروز زیستن است. مقدمه مؤلف […]

42 فروش
59,000 ریال
42 فروش
زندگی نزیسته‌ ات را زندگی کن

دانلود کتاب زندگی نزیسته‌ ات را زندگی کن

در کتاب زندگی نزیسته‌ ات را زندگی کن (به انگلیسی: Living Your Unlived Life) روانشناس مشهور رابرت آ. جانسون فرضیه‌ای ساده ولی دگرگون کننده ارائه می‌دهد؛ هوش و استعداد نهفته و پرورش نیافته ما وقتی بطور کامل در زندگی بروز نداشته باشد، ممکن است به مشکلات بسیاری منتهی شود، مثل افسردگی، اختلافات زناشویی، مشکلات شغلی […]

26 فروش
49,000 ریال
26 فروش

دانلود کتاب سکوت سوزان کین

دربارۀ کتاب کتاب سکوت قدرت درون‌گراها در جهانی که از سخن گفتن نمی‌ایستد» کتاب سکوت در سال ۲۰۱۲ در آمریکا به چاپ رسید و در همان سال پرفروش ترین کتاب سال نیویورک تایمز/ واشینگتن پست/ لوس آنجلس تایمز/ NPR/ INDIE/هفته نامه ناشران آمریکا شناخته شد. همچنین موسسه آمازون آن را در لیست سه کتاب برتر […]

22 فروش
69,000 ریال
22 فروش

دانلود کتاب چگونه با هرکسی صحبت کنیم

دربارۀ کتاب دانلود کتاب چگونه با هرکسی صحبت کنیم: ۹۲ راهکار ساده برای رسیدن به موفقیت بزرگ در روابط آیا تاکنون اشخاص موفقی را تحسین کرده‌اید که به نظر می‌رسد آنچه را می‌خواهند در اختیار دارند؟ این اشخاص را می‌بینید که در جلسات تجاری و در مهمانیهای اجتماعی با اطمینان خاطر و اعتماد به نفس […]

20 فروش
30,000 ریال
20 فروش
تاملات در فلسفه اولی

دانلود کتاب تاملات در فلسفه اولی دکارت

تاملات در فلسفه اولی نام کتابی از رنه دکارت است که در آن به شرح نظرات خویش راجع به وجود نفس، خدا و هستی پرداخته‌ است. رنه دکارت در این کتاب همواره اندیشید که دو مساله مربوط به خدا و نفس ،  در صدر مسائلی است که باید آنها را با برهان فلسفی اثبات نمود  […]

18 فروش
20,000 ریال
18 فروش

دانلود کتاب مردی به نام اوه–فردریک بکمن

درباره کتاب : کتاب مردی به نام اوه–فردریک بکمن اثر «فردریک بکمن»، وبلاگ‌نویس سوئدی است که در مدت کوتاهی تبدیل به یکی از پرفروش‌ترین رمان‌های جهان شد. این کتاب تا کنون به بیش از سی زبان ترجمه و منتشر شده است. اما استقبال از این کتاب تنها محدود به علاقه‌مندان به رمان نبود. سخت‌ترین منتقدان […]

15 فروش
39,000 ریال
15 فروش

نــظرات کاربــران

نظر شما درباره این صفحه چیست؟