کدخبر :6414 پرینت
13 فروردین 1392 - 09:09

راه اندازی شبکه واژگانی زبان فارسی در پژوهشگاه فضای مجازی

متن خبر
شبکه واژگانی زبان فارسی (وردنت عمومی زبان فارسی) در پژوهشکده فناوری اطلاعات پژوهشگاه فضای مجازی و با همکاری دانشگاه شهید بهشتی تهیه شد.
 

به گزارش سیتنا از مهر، این پایگاه دانش که حاوی اطلاعات در مورد واژه­ ها و ترکیبات زبان (مفاهیم)، اطلاعات نحوی آنها و روابط معنایی میان آنها است در دو نسخه از طریق آدرس http://nlp.sbu.ac.ir:۸۰۸۰/farsnet قابل دسترس است.

نسخه اول wordnet که برای استفاده عموم آزاد است، شامل بیش از ۱۷هزار مدخل واژگانی از مقوله های اسم، فعل و صفت است، همچنین روابط تحت پوشش آن روابط درون مقوله ه­ای مطرح در وردنت انگلیسی (نسخه ۲.۱) است و قابلیت اتصال به وردنت های دیگر از طریق نگاشت به وردنت پرینستون نسخه ۳.۰ را نیز داراست.

نسخه دوم وردنت فارسی نیز که نسخه توسعه یافته نسخه اول است برای کاربردهای پژوهشی به صورت رایگان در اختیار پژوهشگران قرار دارد و شامل بیش از ۳۰هزار مدخل واژگانی از مقوله های اسم، فعل، صفت و قید است. روابط تحت پوشش آن علاوه بر روابط درون مقوله­ های مطرح در وردنت انگلیسی (نسخه ۲.۱) پنج رابطه میان مقوله ای نیز، مفاهیم را بهم پیوند می­ دهد و ویژگی های تحت پوشش آن علاوه بر ویژگی های درنظر گرفته شده برای واژه ها، ویژگی های نحوی، ساخت واژی و آوایی به واژه ها و قاب و ساختار آرگومانی به افعال افزوده شد. همچنین این وردنت قابلیت اتصال به وردنت های دیگر از طریق نگاشت به وردنت پرینستون نسخه ۳.۰ را نیز داراست. 

در همین حال پژوهشکده فناوری اطلاعات تهیه وردنت تخصصی فارسی حوزه فاوا را با همکاری دانشگاه بوعلی سینای همدان آغاز کرده که به زودی برای متخصصان و فعالان این حوزه قابل بهره­ برداری خواهد بود.

انتهای پیام

نظرات خود را با ما درمیان بگذارید

افزودن دیدگاه جدید

کپچا
CAPTCHA ی تصویری
کاراکترهای نمایش داده شده در تصویر را وارد کنید.