طبقه بندی صفحات وب مبتنی بر آنتولوژی
کد مقاله : 1112-HMM
نویسندگان:
زهره قاسمی *
میدان طالقانی - کوچه امامیه - واحد اول غربی
چکیده مقاله:
طبقه بندی وب‌سایت‌ها همواره یکی از چالش‌های وب کاوی در بازیابی اطلاعات از وب بوده است. در سال های اخیر استفاده از آنتولوژی به منظور افزایش دقت دسته بندی صفحات وب ، مطرح شده است. آنتولوژی ارتباط بین مفاهیم در اسناد وب و دنیای واقعی را مشخص می‌کند که با این کار اسناد مربوطه توسط ماشین‌ها قابل پردازش و فهم می شوند و اشتراک گذاری بین عامل ها را تسهیل می-نماید. در این مقاله ما یک تکنیک جدید جهت طبقه‌بندی صفحات وب مبتنی بر آنتولوژی پیشنهاد می‌دهیم تا این کار را با دقت و صحت بالایی انجام دهد. شناسایی و مقایسه معنا و روابط معنایی و محتوایی بین کلمات صفحه دقت و کارآمدی طبقه‌بندی را بالاتر خواهد برد. در مرحله اول کلمات یک صفحه وب استخراج و با استفاده از چند فاکتور وزن دهی شده و کلمات کلیدی مشخص می‌شوند، مرحله دوم میزان شباهت بین کلمات کلیدی از صفحه و آنتولوژی با استفاده از مفهوم IC اندازه گیری می شود. با استفاده از نتایج این اندازه گیری طبقه صفحه مورد نظر را مشخص می گردد.
کلیدواژه ها:
طبقه بندی صفحات وب، آنتولوژی، شباهت معنایی
وضعیت : مقاله برای ارائه به صورت پوستر پذیرفته شده است