-
Notifications
You must be signed in to change notification settings - Fork 274
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
การ romanization ใช้กับชื่อผมไม่ได้ #11
Comments
การ romanization ของ http://pioneer.chula.ac.th/~awirote/resources/thai-romanization.html ทำตามหลักเกณฑ์การถอดเสียงภาษาไทยเป็นอักษรโรมัน - http://www.arts.chula.ac.th/~ling/tts/ThaiRoman.pdf ของรัฐบาลที่ประกาศใช้ครับ แต่ในส่วน PyThaiNLP ใช้คำสั่งจาก icu ที่ใช้การ romanization ตามมาตราฐาน ISO 11940-2 - https://en.wikipedia.org/wiki/ISO_11940-2 ครับ การ romanization จึงไม่เหมือนกัน ตอนริเริ่มทำโมดูลนี้ ผมเขียนตามหลักเกณฑ์การถอดเสียงภาษาไทยเป็นอักษรโรมัน https://github.com/wannaphongcom/pythainlp/blob/531b9177919ce2da15d8bc9b5320e77ef4b06f45/pythainlp/romanization/royin.py แต่มีปัญหา คือ ไม่รองรับสระภาษาไทยครับ ผมจึงตัดสินใจลบไฟล์แล้วใช้ ISO 11940-2 แทน หากคุณ @wasdee ต้องการสามารถนำ https://github.com/wannaphongcom/pythainlp/blob/531b9177919ce2da15d8bc9b5320e77ef4b06f45/pythainlp/romanization/royin.py ไปพัฒนาต่อให้รองรับสระแล้วส่งกลับมาได้ครับ ขอบคุณครับ |
ผมจะลองดูนะครับ |
นอกจากคำว่า พรม แล้วมีคำที่มีปัญหาอื่นๆไหมครับ ผมยังไม่ค่อยเข้าใจที่พูดว่าไม่รองรับสระ ช่วยอธิบายเพิ่มหน่อยครับ |
ผมติดปัญหาตรงที่สระครับ ตัวอย่างเช่น |
@wasdee จาก d8fda84 ล่าสุด รองรับหลักเกณฑ์การถอดอักษรไทยเป็นอักษรโรมัน ฉบับราชบัณฑิตยสถานแล้วครับ from pythainlp.romanization import romanization
b=romanization("นัด",engine="royin") + romanization("ชะ",engine="royin") + romanization("โนน",engine="royin") #ใช้สระโอะ ไม่ได้ ToT
print(b) # natchanon ในการที่จะถอดทั้งคำได้เลย ต่อไปในอนาคตจะเพิ่มระบบแปลงเป็นคำอ่านต่อไปครับ |
Remove obsoleted, unused, and experimental codes (#140)
เป็นไปได้ไหมที่เราจะนำ http://pioneer.chula.ac.th/~awirote/resources/thai-romanization.html port มา
The text was updated successfully, but these errors were encountered: