Skip to content

OverFlowData/NER-

Repository files navigation

NER-

سلام من دلم میخواست تو حوزه متن کاوی فارسی کار جامعی انجام بدم، کاری که کشورهای دیگه و زبان های دیگه انجام شده، به نظر رسید که ما یه پارسر دقیق توی فارسی نداریم، لازمه پارسر یه لیستی از اسامی بود.یه فراخوان توی توییتر دادم که بچه ها بیان به من کمک کنن و یه لیستی رو از داده هایی که باید میگرفتیم رو اماده کردم، البته هنوز داده هایی کرال نشده دیگه ای هم موجود هست، اما تو نسخه۱ محمود اسکندری و محمدرضا کوشا کمک کردن ، هرچند از رپوهای دیگری مثل اسامی دختر و پسری هم که جادی گذاشته استفاده کردم و البته اینکه ممکن کسی هم باشه که من فراموش کرده باشم اسمش رو بذارم، بهتره که به من پیام بده و یا خودش اسمش رو اضافه کنه! نیلوفر فرج پور هم زحمت مرتب کردن داده ها رو کشیده. ، ادامه این کار به این صورت هست که اگه کسی وقت داشته باشه لیست اسامی و اشخاص رو میتونم براش ایمیل کنم که کرال کنه و به این لیست اضافه کنه و در طول زمان بهتر بشه. توی همین ریپو تلاش میکنم تا نسخه اولیه ای از اینکه چطور در مورد پارس کردن متن فکر میکنم و یا ساختارش چه جوری هست رو بذارم طبعا کانتربیوت شما رو با جان و دل میخرم! البته لیست اصطلاحات، مفاهیم و کلمات رو هم اضافه میکنم که قطعا کار شخص خودم هست و کسی به من کمک نکرده