benjavalero / replacer Goto Github PK
View Code? Open in Web Editor NEWStraightforward tool to help fixing the most common errors in Spanish Wikipedia
License: GNU General Public License v3.0
Straightforward tool to help fixing the most common errors in Spanish Wikipedia
License: GNU General Public License v3.0
Existen propiedades que dependen del sistema y que no se pueden subir al repositorio por su confidencialidad, como la contraseña de la base de datos.
En Producción, estas propiedades deberían existir en un fichero aparte del repositorio Git.
Encontrar reemplazos para fechas cortas con el mes en mayúsculas. Por ejemplo:
Al buscar reemplazos personalizados para «se anuncio», no se encuentran más para corregir. En cambio, haciendo una búsqueda rápida en la Wikipedia, aparecen más de 600.
Quizá se puede (v. https://www.mediawiki.org/wiki/API:Search):
srlimit
sroffset
totalhits
Si no existe, la API devuelve un "pageID = -1", más ns = 0, title = "xxxx" y missing = ""
Adaptar las distintas secciones a un diseño sencillo, basado p. ej. en el de la propia https://tools.wmflabs.org/
La botonera que muestra las distintas opciones de reemplazos excede el ancho o corta las palabras (si son muy largas) en dispositivos móviles.
Al marcar un artículo como revisado se debe actualizar el caché de reemplazos mientras se recarga con los datos reales.
En el artículo "América del Sur", el error "caribe" se resalta en el término "caribeña".
Wikipedia permite editar solo una sección e indicarla al guardar.
Si la herramienta lo implementa, se puede mejorar enormemente la cantidad de datos enviados al editar, especialmente en textos largos donde quizá solo basta editar un párrafo.
Actualmente la frecuencia en la que se ejecutan ciertas tareas, como la indexación de dumps, está a fuego en el código fuente.
La configuración de estas frecuencias debería leerse del fichero de propiedades.
Las fechas cuyos días comienzan por 0, por ejemplo, «07 de Julio de 2019» son capturadas por los reemplazos de tipo Fecha. Debe mejorarse la expresión regular.
El análisis del artículo Anexo:Primera temporada de Reto 4 Elementos tarda varios minutos. Es un artículo muy largo con muchas repeticiones. Hay que analizar por qué tarda tanto.
Al buscar reemplazos personalizados la herramienta está devolviendo resultados del espacio de nombres «Discusión».
Generalizar textos en los que solo se hace referencias a los errores ortográficos para nombrar también los errores de estilo.
Por ejemplo, en: «La siguiente tabla muestra una lista de los potenciales errores ortográficos (obtenida de la propia Wikipedia) así como el número de apariciones sin revisar».
null
En caso de que hayamos guardado sin cambios, se muestra directamente el JSON devuelto por el backend.
La indexación se ha truncado aproximadamente al 62 %.
Caused by: org.xml.sax.SAXParseException: JAXP00010004: The accumulated size of entities is "50,000,001" that exceeded the "50,000,000" limit set by "FEATURE_SECURE_PROCESSING"
Al usar la aplicación en el móvil la cabecera está colapsada por defecto. Si la abrimos y cambiamos de sección, la cabecera no vuelve a colapsarse.
Al filtrar se mantiene el número de página.
Esto puede hacer que, si por ejemplo estamos en la página 3, no se muestren resultados tras filtrar si solo hay 10 y por tanto se muestran todos en la página 1.
Mostrar en el resumen del estado de la indexación (solo para administradores) una estimación de cuándo va a terminar la indexación en caso de que ésta se esté ejecutando.
Las líneas que comienzan por un espacio en blanco son utilizadas para preservar el formato. Deben ignorarse del mismo modo que se ignora el contenido de la etiqueta pre
.
Por ejemplo:
Para los reemplazos personalizados se busca con el API de la Wikipedia el texto entrecomillado. Pero éste no distingue mayúsculas. Esta distinción debería hacerse por parte de la herramienta.
El número de versión que se muestra en el pie de página está a fuego en el archivo app.component.html
.
Debería extraerse del archivo pom.xml
del frontend durante el empaquetado con Maven.
Si en uno de los reemplazos, sustityo un término por otro más largo, el resto de los reemplazos posteriores no se insertan correctamente.
Ejemplo: "Archaea", reemplazando las apariciones de "Setiembre" por "Septiembre".
Al entrar en la página inicial, Tomcat incluye una cookie de sesión que no es filtrada correctamente por el filtro que comprueba la autenticación y redirige si procede a la página de login. Ejemplo:
https://tools.wmflabs.org/replacer/index.html;jsessionid=6B82E31491AC9A04FC765172DA25D464
Hay muchos casos de la plantilla cita libro
que no se encuentran en un elemento ref
y por tanto no son ignorados.
La etiqueta nowiki
se utiliza para mantener el formato de texto tal cual. Debería ignorarse su contenido del mismo modo que se hace con la etiqueta pre
.
Quizá no está funcionando porque la redirección está justo al inicio del contenido
Los caracteres extraños aparecen como ? y no se guarda bien.
Al marcar como revisado sin cambios el mensaje que se muestra es «Guardando cambios».
El subrayado (o barra baja) no se está teniendo en cuenta como separador de palabras. Por ejemplo, en {{Twitter|Clasica_Almeria}}
el término Almeria es detectado.
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.