Please use this identifier to cite or link to this item:
https://dspace.rmutk.ac.th/jspui/handle/123456789/4701
Title: | การจำแนกภาษาบาลีและภาษาสันสกฤตในภาษาไทยด้วยการเรียนรู้ของ เครื่อง |
Other Titles: | Machine Learning the classification of Bali and Sanskrit in Thai language using machine learning |
Authors: | ณัฐรฐนนท์ กานต์รวีกุลธนา ประสบการ นำแสงวาณิช อนุชัย แซ่ซ้ง ชาญชัย จีระ |
Keywords: | โครงงานปริญญาตรี - ปีการศึกษา 2566 การเรียนรู้ของเครื่อง Machine learning อัลกอริทึมนาอีฟเบย์ แบบจำลองซัพพอร์ตเวกเตอร์แมชชีน แบบจำลองต้นไม้การตัดสินใจ |
Issue Date: | 2566 |
Publisher: | มหาวิทยาลัยเทคโนโลยีราชมงคลกรุงเทพ. คณะบริหารธุรกิจ. สาขาวิชาเทคโนโลยีสารสนเทศและธุรกิจดิจิทัล |
Abstract: | โครงการวิจัยเรื่อง การจำแนกภาษาบาลี และภาษาสันสกฤตในภาษาไทยด้วยการเรียนรู้ของเครื่อง มีวัตถุประสงค์1) เพื่อทดสอบประสิทธิภาพของแบบจำลองการทำนายผลการจำเเนกภาษาบาลีและภาษาสันสกฤต 2) เพื่อเปรียบเทียบประสิทธิภาพของแบบจำลองการทำนายผลการจำเเนกภาษาบาลีและภาษาสันสกฤต 3) เพื่อนำเสนอเเบบจำลองที่มีประสิทธิภาพดีที่สุดในการทำนายผล
การจำเเนกภาษาบาลีและภาษาสันสกฤตโดยใช้การเรียนรู้ของเครื่อง (machine learning) คือ การจำแนกภาษาบาลี และภาษาสันสกฤต โดยมีแบบจำลอง (Model) ที่ใช้ดังนี้ ซัพพอร์ตเวกเตอร์แมชชีน
(Support Vector Machine) ต้นไม้การตัดสินใจ (Decision Tree) และนาอีฟ เบย์ (Naive Bayes) โดยการจำแนกภาษาบาลี และภาษาสันสกฤต โดยมีจำนวนข้อมูล (data) ทั้งหมด 100,000 คำ แบ่งเป็นภาษาบาลี 50,000 คำ และ ภาษาสันสกฤต 50,000 คำ ผลการวิจัยพบว่า ค่าความแม่นยำ (Accuracy) ของแบบจำลอง (Model) ทั้ง 3 แบบ โดยเรียงจากมากไปน้อยได้แก่ ต้นไม้ตัดสินใจ อยู่ที่ร้อยละ 0.69 ลองลงมาคือแบบจำลอง นาอีฟ เบย์ (Naive Bayes) อยู่ที่ร้อยละ 0.65 และลองลงมาคือแบบจำลอง ซัพพอร์ตเวกเตอร์แมชชีน
(Support Vector Machine) อยู่ที่ร้อยละ 0.47 This project explores the classification of Pali and Sanskrit languages in Thai texts through machine learning with three objectives: 1) evaluating the performance of different models in classifying Pali and Sanskrit languages, 2) comparing the effectiveness of these models, and 3) identifying the most effective model for this classification task. The models evaluated include the Support Vector Machine (SVM), Decision Tree, and Naive Bayes. The dataset consists of 100,000 words, evenly divided between the Pali and Sanskrit languages, with 50,000 words from each. The findings reveal the accuracy of the three models, ranked from highest to lowest, as follows: the Decision Tree model demonstrated the highest accuracy at 69%, followed by the Naive Bayes model at 65%, and the Support Vector Machine model at 47% |
URI: | http://dspace.rmutk.ac.th/handle/123456789/4701 |
Appears in Collections: | บทคัดย่อรายวิชาโครงงานปริญญาตรี |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
การจำแนกภาษาบาลี และภาษาสันสกฤตในภาษาไทย.pdf | 172.46 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.