Giter Site home page Giter Site logo

speech-recognition's Introduction

Speech Demo

Reconocimiento y síntesis de voz para smartphone

Demostración de reconocimiento y síntesis de voz para web y móvil

La tecnología "HTML5 Web Speech API" es una propuesta del W3C relativamente reciente y por lo tanto sólo algunos navegadores como Chrome o FireFox la incorporan en sus últimas versiones. Usando dicha tecnología, esta demostración permite interactuar con un programa de distintas maneras: ejecutando comandos por voz o convirtiendo texto a voz mediante habla sintética

        NOTA: Esta es una tecnología experimental. Los navegadores Microsoft IE, Edge, Ópera y Safari
              no son compatibles con esta aplicación.

Consultar compatibilidad entre navegadores


La demostración está dividida en tres secciones o pantallas:

  1. Pantalla de instrucciones
  2. Ejecución de comandos por voz: Desde esta pantalla se puede activar/desactivar el reconocimiento de voz
  3. Síntesis de voz: Desde esta pantalla se puede activar/desactivar la síntesis de voz

Se puede acceder a cada pantalla usando las flechas de la parte inferior hasta llegar a la sección elegida. También es posible la navegación entre pantallas usando comandos de voz

Instrucciones

  • Conceder permiso a la aplicación para que acceda al hardware del micrófono siempre que se solicite
  • Durante el reconocimiento de voz, hablar a pocos centímetros del micrófono
  • Situarse en un entorno silencioso
  • Utilizar un tono claro y normal
  • Navegador compatible requerido
  • En caso de usar móvil sólo se garantiza el funcionamiento en Android por las cuestiones de compatibilidad antes mencionadas
DEMO FULLSCREEN FOR MOBILE

DEMO FOR DESKTOP

Auditoría

Gráfico de carga:

  • Descomposción de los datos de la aplicación según el tipo de fichero y cantidad de datos
  • Número de peticiones HTTP realizadas usando caché y sin usarla

Este gráfico permite visualizar cuántos datos se movilizan antes y después de usar la memoria caché, y ver las agrupaciones de ficheros por tipo.

La primera vez que se carge la aplicación en memoria sin utilzar la cache será necesario movilizar 793 K. Las siguientes veces que se cargue la aplicación usando la caché, será necesario movilizar solamente 21.5 K.

Esto se aplica a la versión web. En la app compilada para instalar en el móvil hay que añadir el Runtime WebView de Chromium.

Gráfico de carga

Volver al principio

speech-recognition's People

Contributors

yagolopez avatar

Stargazers

 avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.