Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

جمع «ها» در واژه‌هایی که با نیم‌فاصله نوشته می‌شوند #12

Open
5j9 opened this issue Feb 28, 2016 · 2 comments

Comments

@5j9
Copy link

5j9 commented Feb 28, 2016

این واژه‌ها با اینکه در دادگان هستند ولی در حالت جمع درست شناخته نمی‌شوند: - پیاده‌روها (با اینکه «پیاده رو» در دادگان هست) - چشم‌اندازها (با اینکه «چشم انداز» در دادگان هست) - کتاب‌خانه‌ها (با اینکه «کتاب‌خانه» را به تنهایی درست تشخیص می‌دهد) - تخته‌سیاه‌ها (با اینکه «تخته‌سیاه» درست شناخته می‌شود) - عرضه‌نویس‌ها (با اینکه «عریضه‌نویس» درست شناخته می‌شود)

روش کلی‌ای هست که بشود این‌ها را تشخیص داد یا باید جداگانه وارد شوند؟

@b00f
Copy link
Owner

b00f commented Feb 29, 2016

متاسفانه من وقت نکردم همه واژگان (خصوصا واژگان ترکیبی) زبان فارسی را وارد دادگان کنم
برای جبران این مشکل از لیست این کلمات در پروژه ویراستیار استفاده کردم.
اینجا:https://github.com/b00f/lilak/blob/master/src/dic_users
و اینجا: http://www.virastyar.ir/

بدین صورت که هر واژه‌ای در دادگان نباشد ولی در این لیست باشد را هم به دیکشنری نهایی اضافه می‌کند. متاسفانه این فهرست چون هیچ گونه برچسب دستور زبانی ندارد هیچ‌گونه برچسب هانسپلی هم نمی‌خورد.

واژگان بالا همه از این دست هستند. یعنی مشخص نمی‌شوند که چه پسوندی برایشان در نظر گرفته شود.
برای همین «تخته‌سیاه» درست است اما «تخته‌سیاه‌ها» با «تخته‌سیاه‌مان» نادرست

دو راه هست:
۱- همه این فهرست را به عنوان اسم در نظر بگیریم.
یا
۲- این کلمات را به مرور دادگان اضافه کنیم به همراه برچسب گذاری دستور زبانی

راه حل دیگری به ذهنم نمی‌رسد.

@reza1615
Copy link
Collaborator

برای برچسب‌گذاری عمده می‌توان از فرهنگ معین استفاده کرد در فرهنگ معین برای هر مدخل نوع دستوری را مشخص کرده‌اند

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants