phongnt570 / uetsegmenter Goto Github PK
View Code? Open in Web Editor NEWA toolkit for Vietnamese word segmentation
A toolkit for Vietnamese word segmentation
I would like to implement a demo using your approach.
How can I prepare input file. Do I have to segment the sentence first?
After that, I would like to know the format of input (I mean your features) which is used to train Logistic Regression.
I have an example.
Trong vũ_trụ , thời_gian có_thể tồn_tại khắp mọi nơi ?
Có_thể không phải vậy , các nhà_khoa_học cho_rằng ở trung_tâm của một hố đen là không có thời_gian .
Điều này thật khó để tưởng_tượng , bởi chính các hố đen có một lực hấp_dẫn rất mạnh , không có bất_cứ một photon nào ( ánh_sáng hạt ) có_thể thoát_khỏi lực hút của nó .
Thực_sự không_thể quan_sát bên_trong hố đen dù có sử_dụng kính_thiên_văn tốt nhất trên thế_giới .
Thank and best regards,
Hi Phong,
Anh đang viết thư viện https://github.com/telexyz/syll2words, và có một phần mã nguồn từ UETsegmenter nên muốn hỏi em bản quyền để sử dụng. Em đọc https://github.com/telexyz/syll2words/blob/master/README.md để biết thêm chi tiết nhé.
Anh thấy UETsegmenter ko đề LICENSE nên có lẽ là em sẽ cho phép mọi người sử dụng lại mã nguồn mình viết 👍 👍 👍, hoặc có thể ngược lại nên anh muốn hỏi em cho chắc chắn.
Mong em trả lời sớm,
Dũng.
Dear,
May I ask how I can prepare new dataset for training another new model to match my problem?
Could you please give us guide?
Thank you
Multiple meaningless null
checks
s
can not be null. You already call s
before.
String[] tempTokens = s.split("(\\s| )+");
if (trimed.isEmpty() || trimed.equals(StringConst.SPACE) || s == null || tempTokens.length == 0) {
return tokens;
}
Please, give us some approach introduction so we can follow more easily
Hello,
Could you give me the example of training data and test data? I want to retrain your model in my own data, but there is no description for the data format.
Hope to hear from you soon,
Many thanks.
I want to add my training data into this library to retrain the algorithm, how can i do? And where can I acquire the original training data?
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.