Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Sentence tokenizer for Thai - การตัดประโยคที่ไม่ได้คั่นด้วย whitespace #73

Closed
PhatSriwichai opened this issue Feb 24, 2018 · 4 comments
Labels
enhancement enhance functionalities help wanted no contributor yet
Milestone

Comments

@PhatSriwichai
Copy link

pythainlp รองรับการตัดประโยคที่ไม่ได้คั่นด้วย whitespace ไหมครับ
ตัวอย่าง
input: "อยากติดต่อสอบถามเรื่องเช่าพื้นที่ขายของของตลาดนัด"
output: ["อยากติดต่อสอบถาม", "เรื่องเช่าพื้นที่ขายของของตลาดนัด"]

@PhatSriwichai PhatSriwichai changed the title การตัดประโยคความซ้อน การตัดประโยคที่ไม่ได้คั่นด้วย whitespace Feb 24, 2018
@wannaphong
Copy link
Member

ตอนนี้ยังไม่รองรับครับ แต่มีแผนที่จะทำในอนาคตครับ ตอนนี้ยังต้องการ contributors ทำเรื่องนี้ครับ

@wannaphong wannaphong added the enhancement enhance functionalities label Feb 28, 2018
@wannaphong
Copy link
Member

โครงการทดลองครับ ต้องการคนมาพัฒนาต่อครับ https://github.com/wannaphongcom/test-thai-sent-tokenize-NaiveBayesClassifier

@wannaphong wannaphong added the help wanted no contributor yet label May 16, 2018
@bact
Copy link
Member

bact commented Oct 12, 2018

Same as an enhancement request in #43

@cstorm125 cstorm125 changed the title การตัดประโยคที่ไม่ได้คั่นด้วย whitespace Sentence tokenizer for Thai - การตัดประโยคที่ไม่ได้คั่นด้วย whitespace May 16, 2019
@bact bact added this to the Future milestone Oct 7, 2019
@cstorm125
Copy link
Member

#337 can do this but original example are not two sentences

@bact bact modified the milestones: Future, 2.2 Dec 20, 2019
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement enhance functionalities help wanted no contributor yet
Projects
None yet
Development

No branches or pull requests

4 participants