سبد خرید شما

اطلاعات داده

حجم: نامشخص
فرمت: نامشخص
وضعیت دریافت: برون سازمانی

پیکره چندزبانه رایانامه‌

معرفی: 

پیکرهٔ چندزبانهٔ رایانامه برای تشخیص ریسمان‌های گفتگوی چندزبانه در آزمایشگاه سیستم‌های هوشمند اطلاعات دانشگاه تهران تهیه شده است. نام این پیکره ‌«Multilingual-BC3» است که در حقیقت یک پیکرهٔ ساختگی چندزبانه است که حاصل ترجمهٔ بخشی از پیکرۀ تک‌زبانه BC3، توسط عامل انسانی است. پیکرۀ اولیه BC3 به صورت تک‌زبانه و در زبان انگلیسی توسط آزمایشگاه هوش محاسباتی در دانشگاه British Columbia ساخته شده است. این پیکره، یک زیرمجموعه از پیکرهٔ W3C است که دارای برچسب‌های معنایی، نظیر حالت گفتار در سطح جمله و برچسب خلاصه‌سازی گفتگوها است. پیکرهٔ ConThread-BC3 یک نسخه از BC3 است که در آن‌، برچسب‌های نشان‌دهندهٔ ساختار ریسمان‌های گفتگو و همچنین اطلاعات مربوط به برچسب متن اصلی و متن نقل‌قول رایانامه‌ها اضافه شده است. پیکرهٔ Multilingual-BC3، در دو نسخه تهیه شده که نسخهٔ اول، گونه‌ای چند‌زبانه از نسخهٔ اولیه BC3 و نسخهٔ دوم گونه‌ای چند‌زبانه از ConThread-BC3 است. قابل ذکر است که اطلاعات برچسب‌های موجود در نسخه‌های تک‌زبانه، مستقل از زبان بوده و قابل گسترش به Multilingual-BC3 خواهند بود.

*اطلاعات ارجاع: 

Dehghani, M.‎, Shakery, A.‎, Asadpour, M.‎, & Koushkestani, A.‎ (2013)‎.‎ A learning approach for email conversation thread reconstruction.‎ Journal of Information Science (JIS),  39 (6)‎, ۸۴۶-۸۶۳.

اطلاعات انتشار:

ناشر
دانشگاه تهران
مجوز
نامشخص
تاریخ ثبت در پیکره‌گان
۱۳۹۵-۰۲-۰۴
تاریخ آخرین تغییر
۱۳۹۷-۰۲-۱۵
شناسه
D3950204
آمار بازدید
۳۴۹۵