امکان‌سنجی برچسب‌گذاری ادات سخن متون عربی در لایه نحو

قوانین سیستم تشخیص حدود جمله - انسان‌ها برای انتقال مقصود خود به مخاطب، از راه‌های مختلفی استفاده می‌کنند. یکی از متداول‌ترین روش‌ها، استفاده از تکلّم (گفتاری و نوشتاری) است. در پردازش سخن، گوینده با به کارگیری کلمات، در قالبی به نام جمله، هدف خود را به مخاطب می‌فهماند. برای فهم هدف متکلّم لازم است مخاطب، جملات او را از جنبه‌های گوناگون مانند: محدوده، معنا، اعراب و ... مورد بررسی قرار دهد و تنها بهره‌‌گیری از تجزیه کلمات و تکیه بر نقش آنها برای تشخیص جمله کافی نیست. شناخت محدوده جمله که تعیین ابتدا و انتهای جملات است، نخستین مرحله پردازش جمله به شمار می‌آید. پس از آن، اعراب و لایه‌ معنا‌شناسی قرار دارد. (ادامه ...)

 

قوانین سیستم تشخیص اسم و خبر نواسخ (خانواده إنّ) - در زبان عربی برخی ترکیب‌ها خودشان جمله‌سازند؛ به این معنا که اگر نقششان معلوم شود، تا حد زیادی محدوده جمله‌ای که بر پایه این کلمات بنا شده است، مشخص می‌شود. بررسی این دسته از ترکیب‌ها، سرعت پیشرفت کار را دو چندان می‌کند و حتی در برخی موارد تکیه‌گاهی برای تحقیقی دیگر در باب جمله‌یابی می‌شوند. ترکیب «إنّ» به همراه اسم و خبرش، یکی از این ترکیب‌ها است. این ترکیب که از خانواده نواسخ نامیده می‌شود، یکی از مهم‌ترین و پرکاربردترین استعمالات را دارد؛ به صورتی که اگر قرآن را به عنوان یکی از متون فصیح عربی مد نظر قرار دهیم، واژه «إنّ» بیش از ۸۳۴ بار در آن به کار رفته است. این آمار در مورد واژه «کان» (دیگر عضو پرکاربرد از مجموعه نواسخ) ۴۰۸ مورد است. نکته دیگر اینکه پرداختن به این دسته، نه فقط گره از «إنّ» و اسم و خبرش باز می‌کند، بلکه با اندک تفاوتی در قوانین می‌توان اسم و خبر حروف شبیه به «إنّ» (أنّ، کأن، لیت و لعل)، اسم و خبر کان و افعال شبیه به آن (لیس، صار، اصبح، امضی، اضحی، امسی، ظل، بات، مادام، مابال، مابرح، ماانفک، مافتئ) و حتی مبتدا و خبر را شناسایی کرد و این، یعنی گامی ‌بزرگ در راه‌اندازی موتور برچسب‌گذار نحوی و غنی‌سازی مراحل متن‌کاوی در لایه نحو. (ادامه ...)

 

قوانین سیستم تشخیص معطوف و معطوف علیه «واو» - موضوع گرامر زبان (نحو)، یکی از موضوعاتی است که در پردازش زبان طبیعی مورد توجه قرار می‌گیرد. گرامر زبان، یعنی بررسی چینش کلمات و نقش هر واژه در کنار سایر واژگان. از مهم‌ترین موضوعاتی که می‌توان در گرامر زبان مطرح کرد، بحث عطف است. عطف، به منزله مفصلی است که قسمتی از عبارت پس از خود را به قبل آن مربوط می‌سازد. یکی از دلایلی که بررسی عطف را در اولویت قرار می‌دهد، میزان استفاده و فراوانی آن در متون است. مشخص شدن رابطه کلمه پس از حرف عطف با پیش از آن، هم به پیدا کردن نقش کلمه پس از حرف عطف کمک کرده و هم در مرحله‌های بعدی به یافتن رابطه معنایی جملات کمک خواهد کرد. (ادامه ...)