Skip to content

Thai natural language processing in Python.

License

Apache-2.0, Apache-2.0 licenses found

Licenses found

Apache-2.0
LICENSE
Apache-2.0
LICENSE.txt
Notifications You must be signed in to change notification settings

offchan42/pythainlp

 
 

PyThaiNLP

[PyPI Downloads] Codacy Badge pypi Build Status Build status Coverage Status

English

Thai natural language processing in Python.

PyThaiNLP is a python module similar to nltk , but it's working primarily on Thai language instead of English.

It supports both Python 2.7 and Python 3.

Project status

Developing

Version

1.5

Capability

  • Thai segment
  • Thai wordnet
  • Thai Character Clusters (TCC) and ETCC
  • Thai stop word
  • Thai meta sound
  • Thai soundex
  • Thai postaggers
  • Thai romanization
  • Thai misspellings detection and correction

and much more.

Install

using pip.

$ pip install pythainlp

Install on Windows

Download pyicu from http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu then install pyicu. Install pythainlp using pip.

pip install pythainlp

Install on MacOS

$ brew install icu4c --force
$ brew link --force icu4c
$ CFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib pip install pythainlp

Documentation

Read on https://github.com/wannaphongcom/pythainlp/blob/dev/docs/pythainlp-1-4-eng.md

Develop : Read on https://github.com/wannaphongcom/pythainlp/blob/dev/docs/pythainlp-1-5-eng.md

License

Apache Software License 2.0

ภาษาไทย

[PyPI Downloads] pypi Build Status Build status Coverage Status

ประมวลภาษาธรรมชาติภาษาไทยในภาษา Python

Natural language processing หรือ การประมวลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่อพัฒนาการประมวลภาษาธรรมชาติภาษาไทยในภาษา Python และมันฟรี (ตลอดไป) เพื่อคนไทยและชาวโลกทุกคน !

เพราะโลกขับเคลื่อนต่อไปด้วยการแบ่งปัน

รองรับ Python 2.7 และ Python 3

สถานะโครงการ

กำลังพัฒนา

Version

1.5

สิ่งใหม่ที่เพิ่มเข้ามาใน PyThaiNLP 1.5

  • กลับมารองรับ Python 2.7 แล้ว

ความสามารถ

  • ตัดคำภาษาไทย
  • ถอดเสียงภาษาไทยเป็น Latin
  • Postaggers ภาษาไทย
  • อ่านตัวเลขเป็นข้อความภาษาไทย
  • เรียงจำนวนคำของประโยค
  • แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
  • เช็คคำผิดในภาษาไทย
  • รองรับ Thai Character Clusters (TCC) และ ETCC
  • Thai WordNet
  • Stop Word ภาษาไทย
  • Meta Sound ภาษาไทย
  • Thai Soundex
  • และอื่น ๆ

ติดตั้ง

รองรับ Python 2.7 และ Python 3

รุ่นเสถียร

$ pip install pythainlp

วิธีติดตั้งสำหรับ Windows

ให้ทำการติดตั้ง pyicu โดยใช้ไฟล์ .whl จาก http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu

หากใช้ python 3.5 64 bit ให้โหลด PyICU‑1.9.7‑cp35‑cp35m‑win_amd64.whl แล้วเปิด cmd ใช้คำสั่ง

pip install PyICU‑1.9.7‑cp35‑cp35m‑win_amd64.whl

แล้วจึงใช้

pip install pythainlp

ติดตั้งบน Mac

$ brew install icu4c --force
$ brew link --force icu4c
$ CFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib pip install pythainlp

ข้อมูลเพิ่มเติม คลิกที่นี้

เอกสารการใช้งาน

อ่านได้ที่ https://github.com/wannaphongcom/pythainlp/blob/pythainlp1.4/docs/pythainlp-1-4-thai.md

เอกสารนักพัฒนา : Read on https://github.com/wannaphongcom/pythainlp/blob/dev/docs/pythainlp-1-5-thai.md

License

Apache Software License 2.0

พัฒนาโดย นาย วรรณพงษ์ ภัททิยไพบูลย์

สนับสนุน

คุณสามารถร่วมพัฒนาโครงการนี้ได้ โดยการ Fork และส่ง pull requests กลับมา

About

Thai natural language processing in Python.

Topics

Resources

License

Apache-2.0, Apache-2.0 licenses found

Licenses found

Apache-2.0
LICENSE
Apache-2.0
LICENSE.txt

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 95.2%
  • Shell 3.0%
  • Makefile 1.7%
  • Batchfile 0.1%